Zhipu AI モデル

Zhipu AI の全 6 モデルを、詳細な価格、長所・短所、開発者向け推奨事項とともにご覧いただけます。

モデル

$0.050

最安入力

最大コンテキスト

品質ティア

クイック推奨

ベストバリュー: GLM-4-Flash ($0.050/1M)

最高品質: GLM-5.1

GLM-5.1

Flagship

複雑なコーディング、長期的なエージェントタスク、オープンソースデプロイ

公式価格

使用するタイミング: オープンソースコーディングアシスタント、内部開発者ツール、エージェントコーディングワークフロー、セルフホスト可能なフロンティア級モデルを必要とするチーム。

アップグレードのポイント

◆754B MoE オープンウェイト — MITライセンス、完全な商用利用
◆SWE-benchでGPT-5.4に匹敵 — フロンティアコーディング性能
◆単一問題に対して8時間の自律タスク実行
◆反芻: 正確性のための反復的内部推論
◆自社GPUでホスト — ベンダーロックインなし

入力価格

$0.830

per 1M tokens

出力価格

$3.31

per 1M tokens

キャッシュ入力

$0.170

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 1M

最大出力: 16,384 tokens

知識のカットオフ: 2026-04

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

754B MoE オープンウェイト (MITライセンス)
SWE-benchコーディングでGPT-5.4に匹敵
8時間の持続的自律タスク実行
完全な商用権利でセルフホスト可能
深い推論のための反芻アーキテクチャ

短所

754Bパラメータのセルフホストには相当なGPUインフラが必要
汎用タスクでクローズドフロンティアモデルに比べ英語力が弱い
ベースモデルにビジョンなし

パフォーマンス

出力速度~40 tok/s

レート制限3,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU (CN)

91.2%

C-Eval

93.5%

SWE-Verified

78.6%

CMMLU

92.1%

GLM-4.6

Flagship

中国語タスク、エンタープライズAI

公式価格

使用するタイミング: 中国語のエンタープライズアプリケーション、カスタマーサービスボット、中国市場向けコンテンツ生成。

アップグレードのポイント

◆トップクラスの中国語NLUと生成 — 中国語ベンチマークでGPT-4を凌駕
◆128Kコンテキストと16K最大出力 — クラス最長の出力
◆エージェントワークフロー向けの完全な関数呼び出し
◆ドメイン適応のためのファインチューニング可能
◆$0.50/$2.00 — GPT-4oの半額で競争力あり

入力価格

$0.500

per 1M tokens

出力価格

$2.00

per 1M tokens

キャッシュ入力

$0.100

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 128K

最大出力: 16,000 tokens

知識のカットオフ: 2025-03

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

最高の中国語パフォーマンス
128Kコンテキスト、16K出力
強力な関数呼び出し
ファインチューニング対応

短所

GPT-4と比較して英語が弱い
ベースモデルにビジョンなし
小規模なエコシステム

パフォーマンス

出力速度~60 tok/s

レート制限5,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU (CN)

84.5%

C-Eval

89.2%

CMMLU

88.7%

GLM-4.5

Mid-tier

中国語/英語タスクのバランス

公式価格

使用するタイミング: 中価格帯で中国語と英語の両方をうまく処理する必要があるバイリンガルアプリケーション。

アップグレードのポイント

◆強力なバイリンガル: 中国語と英語の両方で競争力あり
◆128Kコンテキスト、$0.30/1M — 手頃な長いコンテキスト
◆16K最大出力で長文生成が可能
◆ファインチューニング対応でカスタマイズ可能

入力価格

$0.300

per 1M tokens

出力価格

$1.20

per 1M tokens

キャッシュ入力

$0.080

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 128K

最大出力: 16,000 tokens

知識のカットオフ: 2025-03

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

強力なバイリンガル性能
128Kコンテキスト
16K最大出力
コスト効率が良い

短所

GLM-4.6より能力が低い
ビジョンなし
モデルエコシステムが小さい

パフォーマンス

出力速度~75 tok/s

レート制限8,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU

76.8%

C-Eval

83.1%

GLM-4-Plus

Mid-tier

汎用、API統合

公式価格

使用するタイミング: 予算に優しい価格で、汎用API統合、チャットボット、コンテンツ生成に使用します。

アップグレードのポイント

◆ほとんどのユースケースに対応する汎用性の高いミッドティアモデル
◆$0.20/100万入力で128Kコンテキスト
◆ツール使用のための完全な関数呼び出し
◆ファインチューニング可能

入力価格

$0.200

per 1M tokens

出力価格

$0.800

per 1M tokens

キャッシュ入力

$0.050

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 128K

最大出力: 8,192 tokens

知識のカットオフ: 2025-03

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

優れたオールラウンダー
128Kコンテキスト
手頃な価格
関数呼び出し

短所

最大8K出力
ビジョンなし
複雑な推論に弱い

パフォーマンス

出力速度~85 tok/s

レート制限10,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU

73.5%

C-Eval

79.8%

GLM-4-Flash

Lite

高スループット、低レイテンシのタスク

公式価格

使用するタイミング: 分類、要約、簡単なQ&Aなど、速度とコストが重要な大量タスク。

アップグレードのポイント

◆最速のGLMモデル — スループット最適化
◆$0.05/100万入力 — 超低予算対応
◆ライトティアでも128Kコンテキスト
◆無料ティア: 開発用に1日100万トークン

入力価格

$0.050

per 1M tokens

出力価格

$0.200

per 1M tokens

キャッシュ入力

$0.010

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 128K

最大出力: 8,192 tokens

知識のカットオフ: 2025-03

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

非常に高速な推論
128Kコンテキスト
非常に低コスト
無料ティアあり

短所

基本的な推論のみ
ファインチューニング不可
ビジョン機能なし

パフォーマンス

出力速度~200 tok/s

レート制限30,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU

65.2%

C-Eval

72.1%

GLM-4V-Plus

Mid-tier

中国語マルチモーダル、ドキュメントAI

公式価格

使用するタイミング: 中国語ドキュメント分析、領収書/請求書処理、中国市場向けビジュアルQ&A。

アップグレードのポイント

◆強力な中国語OCRを備えたネイティブマルチモーダル
◆ドキュメントAI：領収書、請求書、フォーム
◆中国語コンテンツに最適化されたビジュアルQ&A
◆マルチモーダルエージェントワークフローのための関数呼び出し

入力価格

$0.300

per 1M tokens

出力価格

$1.20

per 1M tokens

キャッシュ入力

$0.080

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 8K

最大出力: 4,096 tokens

知識のカットオフ: 2025-03

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

ネイティブビジョン言語
強力な中国語OCR
ドキュメントとチャートの理解
関数呼び出し

短所

8Kコンテキストのみ
最大出力4K
ファインチューニング不可

パフォーマンス

出力速度~50 tok/s

レート制限3,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMMU (CN)

62.8%

DocVQA

85.3%

並べて比較

モデル	ティア	入力	出力	キャッシュ	コンテキスト	最大出力
GLM-5.1	Flagship	$0.830	$3.31	$0.170	1M	16,384
GLM-4.6	Flagship	$0.500	$2.00	$0.100	128K	16,000
GLM-4.5	Mid-tier	$0.300	$1.20	$0.080	128K	16,000
GLM-4-Plus	Mid-tier	$0.200	$0.800	$0.050	128K	8,192
GLM-4-Flash	Lite	$0.050	$0.200	$0.010	128K	8,192
GLM-4V-Plus	Mid-tier	$0.300	$1.20	$0.080	8K	4,096