開発者ゾーンに戻る

Zhipu AI モデル

Zhipu AI の全 6 モデルを、詳細な価格、長所・短所、開発者向け推奨事項とともにご覧いただけます。

6
モデル
$0.050
最安入力
1M
最大コンテキスト
3
品質ティア

クイック推奨

ベストバリュー: GLM-4-Flash ($0.050/1M)
最高品質: GLM-5.1

GLM-5.1

Flagship

複雑なコーディング、長期的なエージェントタスク、オープンソースデプロイ

公式価格

使用するタイミング: オープンソースコーディングアシスタント、内部開発者ツール、エージェントコーディングワークフロー、セルフホスト可能なフロンティア級モデルを必要とするチーム。

アップグレードのポイント

  • 754B MoE オープンウェイト — MITライセンス、完全な商用利用
  • SWE-benchでGPT-5.4に匹敵 — フロンティアコーディング性能
  • 単一問題に対して8時間の自律タスク実行
  • 反芻: 正確性のための反復的内部推論
  • 自社GPUでホスト — ベンダーロックインなし
入力価格
$0.830
per 1M tokens
出力価格
$3.31
per 1M tokens
キャッシュ入力
$0.170
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 1M
最大出力: 16,384 tokens
知識のカットオフ: 2026-04
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • 754B MoE オープンウェイト (MITライセンス)
  • SWE-benchコーディングでGPT-5.4に匹敵
  • 8時間の持続的自律タスク実行
  • 完全な商用権利でセルフホスト可能
  • 深い推論のための反芻アーキテクチャ

短所

  • 754Bパラメータのセルフホストには相当なGPUインフラが必要
  • 汎用タスクでクローズドフロンティアモデルに比べ英語力が弱い
  • ベースモデルにビジョンなし

パフォーマンス

出力速度~40 tok/s
レート制限3,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU (CN)
91.2%
C-Eval
93.5%
SWE-Verified
78.6%
CMMLU
92.1%

GLM-4.6

Flagship

中国語タスク、エンタープライズAI

公式価格

使用するタイミング: 中国語のエンタープライズアプリケーション、カスタマーサービスボット、中国市場向けコンテンツ生成。

アップグレードのポイント

  • トップクラスの中国語NLUと生成 — 中国語ベンチマークでGPT-4を凌駕
  • 128Kコンテキストと16K最大出力 — クラス最長の出力
  • エージェントワークフロー向けの完全な関数呼び出し
  • ドメイン適応のためのファインチューニング可能
  • $0.50/$2.00 — GPT-4oの半額で競争力あり
入力価格
$0.500
per 1M tokens
出力価格
$2.00
per 1M tokens
キャッシュ入力
$0.100
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 128K
最大出力: 16,000 tokens
知識のカットオフ: 2025-03
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • 最高の中国語パフォーマンス
  • 128Kコンテキスト、16K出力
  • 強力な関数呼び出し
  • ファインチューニング対応

短所

  • GPT-4と比較して英語が弱い
  • ベースモデルにビジョンなし
  • 小規模なエコシステム

パフォーマンス

出力速度~60 tok/s
レート制限5,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU (CN)
84.5%
C-Eval
89.2%
CMMLU
88.7%

GLM-4.5

Mid-tier

中国語/英語タスクのバランス

公式価格

使用するタイミング: 中価格帯で中国語と英語の両方をうまく処理する必要があるバイリンガルアプリケーション。

アップグレードのポイント

  • 強力なバイリンガル: 中国語と英語の両方で競争力あり
  • 128Kコンテキスト、$0.30/1M — 手頃な長いコンテキスト
  • 16K最大出力で長文生成が可能
  • ファインチューニング対応でカスタマイズ可能
入力価格
$0.300
per 1M tokens
出力価格
$1.20
per 1M tokens
キャッシュ入力
$0.080
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 128K
最大出力: 16,000 tokens
知識のカットオフ: 2025-03
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • 強力なバイリンガル性能
  • 128Kコンテキスト
  • 16K最大出力
  • コスト効率が良い

短所

  • GLM-4.6より能力が低い
  • ビジョンなし
  • モデルエコシステムが小さい

パフォーマンス

出力速度~75 tok/s
レート制限8,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU
76.8%
C-Eval
83.1%

GLM-4-Plus

Mid-tier

汎用、API統合

公式価格

使用するタイミング: 予算に優しい価格で、汎用API統合、チャットボット、コンテンツ生成に使用します。

アップグレードのポイント

  • ほとんどのユースケースに対応する汎用性の高いミッドティアモデル
  • $0.20/100万入力で128Kコンテキスト
  • ツール使用のための完全な関数呼び出し
  • ファインチューニング可能
入力価格
$0.200
per 1M tokens
出力価格
$0.800
per 1M tokens
キャッシュ入力
$0.050
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 128K
最大出力: 8,192 tokens
知識のカットオフ: 2025-03
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • 優れたオールラウンダー
  • 128Kコンテキスト
  • 手頃な価格
  • 関数呼び出し

短所

  • 最大8K出力
  • ビジョンなし
  • 複雑な推論に弱い

パフォーマンス

出力速度~85 tok/s
レート制限10,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU
73.5%
C-Eval
79.8%

GLM-4-Flash

Lite

高スループット、低レイテンシのタスク

公式価格

使用するタイミング: 分類、要約、簡単なQ&Aなど、速度とコストが重要な大量タスク。

アップグレードのポイント

  • 最速のGLMモデル — スループット最適化
  • $0.05/100万入力 — 超低予算対応
  • ライトティアでも128Kコンテキスト
  • 無料ティア: 開発用に1日100万トークン
入力価格
$0.050
per 1M tokens
出力価格
$0.200
per 1M tokens
キャッシュ入力
$0.010
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 128K
最大出力: 8,192 tokens
知識のカットオフ: 2025-03
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • 非常に高速な推論
  • 128Kコンテキスト
  • 非常に低コスト
  • 無料ティアあり

短所

  • 基本的な推論のみ
  • ファインチューニング不可
  • ビジョン機能なし

パフォーマンス

出力速度~200 tok/s
レート制限30,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU
65.2%
C-Eval
72.1%

GLM-4V-Plus

Mid-tier

中国語マルチモーダル、ドキュメントAI

公式価格

使用するタイミング: 中国語ドキュメント分析、領収書/請求書処理、中国市場向けビジュアルQ&A。

アップグレードのポイント

  • 強力な中国語OCRを備えたネイティブマルチモーダル
  • ドキュメントAI:領収書、請求書、フォーム
  • 中国語コンテンツに最適化されたビジュアルQ&A
  • マルチモーダルエージェントワークフローのための関数呼び出し
入力価格
$0.300
per 1M tokens
出力価格
$1.20
per 1M tokens
キャッシュ入力
$0.080
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 8K
最大出力: 4,096 tokens
知識のカットオフ: 2025-03
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • ネイティブビジョン言語
  • 強力な中国語OCR
  • ドキュメントとチャートの理解
  • 関数呼び出し

短所

  • 8Kコンテキストのみ
  • 最大出力4K
  • ファインチューニング不可

パフォーマンス

出力速度~50 tok/s
レート制限3,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMMU (CN)
62.8%
DocVQA
85.3%

並べて比較

モデルティア入力出力コンテキスト
GLM-5.1Flagship$0.830$3.311M
GLM-4.6Flagship$0.500$2.00128K
GLM-4.5Mid-tier$0.300$1.20128K
GLM-4-PlusMid-tier$0.200$0.800128K
GLM-4-FlashLite$0.050$0.200128K
GLM-4V-PlusMid-tier$0.300$1.208K