Alibaba Cloud モデル

Alibaba Cloud の全 11 モデルを、詳細な価格、長所・短所、開発者向け推奨事項とともにご覧いただけます。

モデル

$0.0000

最安入力

最大コンテキスト

品質ティア

クイック推奨

ベストバリュー: Qwen-RobotWorld ($0.0000/1M)

最高品質: Qwen3.7-Max

Qwen3.7-Max

Flagship

長期エージェントワークフロー、コーディングエージェント、複雑な推論

公式価格

使用するタイミング: 長期間の自律実行を必要とする最先端エージェントワークロード、複雑な多段階コーディングタスク、深層研究分析。

アップグレードのポイント

◆100万トークンコンテキスト — ドキュメント中心のエージェント作業の制限を排除
◆65K最大出力 — 大規模単一生成
◆35時間の持続的自律カーネル最適化 (1,158回のツール呼び出し)
◆SWE-Verified 80.4、LiveCodeBench 91.6 — Claude Opus 4.6と競合
◆OpenAI + Anthropic API互換 — ドロップイン置換

入力価格

$2.50

per 1M tokens

出力価格

$7.50

per 1M tokens

キャッシュ入力

$0.250

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 1M

最大出力: 65,536 tokens

知識のカットオフ: 2026-05

ビジョン関数呼び出しファインチューニングJSONモード

長所

ドキュメント中心のエージェント作業向け100万コンテキストウィンドウ
Qwenファミリー最長の65K最大出力
クロスハーネス互換性 (Claude Code、OpenClaw、Qwen Code)
35時間の持続的自律実行
コーディングベンチマークでClaude Opus 4.6と競合

短所

プロプライエタリ — オープンウェイトやセルフホスティング不可
Qwen 3.6ラインより高コスト
ビジョンサポートなし
APIのみのアクセス

パフォーマンス

出力速度~55 tok/s

レート制限2,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU-Pro

89.6%

LiveCodeBench

91.6%

SWE-Verified

80.4%

GPQA Diamond

92.4%

このモデルを使用するエージェント

QoderWork Qoder Cloud Agents JVS Agent Suite

Qwen3.7-Plus

Mid-tier

マルチモーダルタスク、コスト効率の高いエージェント展開

公式価格

使用するタイミング: 長いコンテキスト要件とともに、テキスト、動画、画像の理解が必要なコスト効率の高いマルチモーダル展開に最適です。

アップグレードのポイント

◆マルチモーダル入力: 1つのモデルでテキスト + 動画 + 画像
◆$0.40/100万トークンの100万コンテキスト — Qwen3.7-Maxより6倍安い
◆ミッドティア価格で強力なエージェント性能
◆OpenAI互換API

入力価格

$0.400

per 1M tokens

出力価格

$1.60

per 1M tokens

キャッシュ入力

$0.100

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 1M

最大出力: 16,384 tokens

知識のカットオフ: 2026-05

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

ミッドティア価格で100万コンテキスト
マルチモーダル: テキスト、動画、画像入力
強力な速度と性能のバランス
独自仕様だが非常に手頃な価格

短所

独自仕様 — セルフホスティング不可
複雑な推論ではQwen3.7-Maxより性能が劣る
最大出力16K

パフォーマンス

出力速度~80 tok/s

レート制限5,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU-Pro

84.2%

LiveCodeBench

78.5%

MMMU

72.1%

Qwen3-235B-A22B

Flagship

複雑な推論、多言語タスク

公式価格

使用するタイミング: 多言語ワークロード、複雑な推論、コスト重視の本番環境に最適なフラッグシップモデルです。

アップグレードのポイント

◆MoEアーキテクチャ: 235Bパラメータ、22Bのみアクティブ — GPT-4クラスを1/10の価格で
◆131Kコンテキスト — 長文ドキュメントやコードベースを処理
◆100以上の言語サポート — 非英語タスクで最高クラス
◆オープンソース: HuggingFaceで完全な重みを提供し、セルフホスティング可能
◆1Mトークンあたり$0.40/$1.20 — GPT-4oより90%低価格

入力価格

$0.400

per 1M tokens

出力価格

$1.20

per 1M tokens

キャッシュ入力

$0.100

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 131K

最大出力: 8,192 tokens

知識のカットオフ: 2025-04

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

MoE 235B総数 / 22Bアクティブ — 低コストでフラッグシップ性能
131Kコンテキストウィンドウ
強力な多言語対応(100以上の言語)
オープンソースの重みを利用可能

短所

ビジョンサポートなし
最大出力8Kトークン
GPT-4よりもエコシステム統合が少ない

パフォーマンス

出力速度~70 tok/s

レート制限5,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU

86.8%

LiveCodeBench

63.7%

IFEval

86.2%

このモデルを使用するエージェント

Smolagents Dify

Qwen3-30B-A3B

Mid-tier

効率的な多言語推論

公式価格

使用するタイミング: コスト効率が最も重要な高スループット多言語タスク。

アップグレードのポイント

◆わずか3Bアクティブパラメータ — コンシューマーGPUで実行可能
◆$0.15/1M入力で131Kコンテキスト — 最も安価な長いコンテキストオプション
◆完全カスタマイズ可能なオープンソース
◆エージェントワークフロー向けの強力な関数呼び出し

入力価格

$0.150

per 1M tokens

出力価格

$0.600

per 1M tokens

キャッシュ入力

$0.040

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 131K

最大出力: 8,192 tokens

知識のカットオフ: 2025-04

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

MoE 30B 合計 / 3B アクティブ — 超効率的
131K コンテキスト
優れたコストパフォーマンス比
オープンソース

短所

アクティブパラメータが少なく複雑な推論に制限
ビジョンなし
最大8K出力

パフォーマンス

出力速度~120 tok/s

レート制限10,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU

78.5%

LiveCodeBench

48.2%

Qwen3-32B

Mid-tier

バランスの取れたパフォーマンスとコスト

公式価格

使用するタイミング: コーディングや一般的なタスクに信頼性の高い高密度モデルのパフォーマンスが必要な場合に使用します。

アップグレードのポイント

◆高密度32Bアーキテクチャ — MoEルーティングオーバーヘッドなし
◆長文コンテンツ向け131Kコンテキスト
◆強力なコーディング: LiveCodeBench 55.3%
◆HuggingFace完全サポートのオープンソース

入力価格

$0.200

per 1M tokens

出力価格

$0.600

per 1M tokens

キャッシュ入力

$0.050

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 131K

最大出力: 8,192 tokens

知識のカットオフ: 2025-04

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

高密度32B — 一貫したパフォーマンス
131Kコンテキスト
強力なコーディング能力
オープンソース

短所

ビジョン非対応
最大8K出力
MoEバリアントより高いレイテンシ

パフォーマンス

出力速度~65 tok/s

レート制限5,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU

83.2%

LiveCodeBench

55.3%

Qwen3-14B

Lite

軽量な一般的なタスク

公式価格

使用するタイミング: 要約、翻訳、簡単なQ&Aに最適な予算に優しいオプションです。

アップグレードのポイント

◆14B高密度 — 単一GPUに適合
◆131Kコンテキスト、わずか$0.10/1M入力
◆ほとんどの日常タスクに十分
◆ファインチューニング用のオープンソース

入力価格

$0.100

per 1M tokens

出力価格

$0.300

per 1M tokens

キャッシュ入力

$0.030

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 131K

最大出力: 8,192 tokens

知識のカットオフ: 2025-04

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

コンパクトな14B高密度モデル
131Kコンテキスト
非常に低コスト
オープンソース

短所

限られた複雑な推論
ビジョンなし
最大8K出力

パフォーマンス

出力速度~90 tok/s

レート制限10,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU

77.1%

LiveCodeBench

42.8%

Qwen3-8B

Lite

エッジ展開、シンプルなタスク

公式価格

使用するタイミング: エッジデバイス、ローカル展開、または超低コストのバッチ処理に最適です。

アップグレードのポイント

◆8Bパラメータ — RTX 3060または同等品で動作
◆$0.05/100万入力 — 最も安価なオプションの一つ
◆小型ながら131Kコンテキスト
◆ローカル/オフライン展開に最適

入力価格

$0.050

per 1M tokens

出力価格

$0.150

per 1M tokens

キャッシュ入力

$0.010

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 131K

最大出力: 8,192 tokens

知識のカットオフ: 2025-04

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

超小型8B — ノートPCのGPUで動作
131Kコンテキスト
非常に低コスト
オープンソース

短所

基本的な推論のみ
ビジョン非対応
最大8K出力

パフォーマンス

出力速度~150 tok/s

レート制限20,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU

71.5%

LiveCodeBench

33.1%

Qwen-VL-Plus

Mid-tier

マルチモーダル理解、文書分析

公式価格

使用するタイミング: 文書分析、画像キャプション、ビジュアルQ&A、マルチモーダルRAGパイプライン。

アップグレードのポイント

◆ネイティブマルチモーダル — 画像とテキストを一緒に処理
◆131Kコンテキストで複数ページの文書を処理
◆強力なOCR: チャート、表、図の理解
◆100以上の言語に対応した多言語VQA

入力価格

$0.200

per 1M tokens

出力価格

$0.800

per 1M tokens

キャッシュ入力

$0.050

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 131K

最大出力: 8,192 tokens

知識のカットオフ: 2025-04

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

ネイティブビジョン言語モデル
131Kコンテキストと画像対応
強力な文書OCRとチャート理解
多言語VQA

短所

ファインチューニング不可
最大出力8K
テキスト専用Qwen3より高コスト

パフォーマンス

出力速度~55 tok/s

レート制限3,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMMU

68.2%

MathVista

62.5%

Qwen-RobotManip

Flagship

ロボット操作、巧みなハンド制御

公式価格

使用するタイミング: ロボット操作タスク: 研究および産業環境での把持、組み立て、巧みなハンド制御。

アップグレードのポイント

◆初のQwen-Robot VLA操作モデル
◆38,100時間以上のオープンソーストレーニングデータ
◆ロボットタイプ間の統一状態-アクションスペース
◆カメラフレームエンドエフェクター増分ポーズ制御
◆完全なQwen-Robot Suite(操作 + ナビ + ワールド)の一部

入力価格

$0.0000

per 1M tokens

出力価格

$0.0000

per 1M tokens

キャッシュ入力

—

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 0

最大出力: 0 tokens

知識のカットオフ: 2026-06

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

精密なロボット操作のためのVLAモデル
オープンソースデータによる38,100時間以上のトレーニング
統一アクションスペースによるマルチロボットタイプ対応
Apache 2.0ライセンスでオープンソース

短所

ロボット専用 — 汎用LLMではない
デプロイにロボットハードウェアまたはシミュレーターが必要
テキスト生成機能なし
非常に新しい — コミュニティでの採用が限定的

パフォーマンス

出力速度—

レート制限—

マルチモーダル

画像入力画像出力音声入力音声出力

Qwen-RobotNav

Flagship

ロボットナビゲーション、経路計画、自律移動

公式価格

使用するタイミング: 移動ロボットナビゲーション：指示追従、ポイントナビゲーション、物体追跡、自律運転タスクに使用します。

アップグレードのポイント

◆物理エージェント向けVLNモデル：ビジョン言語ナビゲーション
◆4つのタスクタイプを統合：指示、ポイント/ゴール、追跡、運転
◆制御された観測エンコーディング＋ツールインターフェース
◆オープンソース：カスタマイズ用の完全な重み
◆完全なQwen-Robot Suite（操作＋ナビゲーション＋世界）の一部

入力価格

$0.0000

per 1M tokens

出力価格

$0.0000

per 1M tokens

キャッシュ入力

—

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 0

最大出力: 0 tokens

知識のカットオフ: 2026-06

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

4種類のナビゲーションタスクを統合するVLNモデル
3D空間認識のための制御された観測エンコーディング
指示追従、ポイント/ゴールナビゲーション、追跡、運転をカバー
Apache 2.0ライセンスでオープンソース

短所

ロボットナビゲーションに特化
ロボットハードウェアまたはシミュレーターが必要
テキスト生成不可
非常に新しい — 実世界での検証が限定的

パフォーマンス

出力速度—

レート制限—

マルチモーダル

画像入力画像出力音声入力音声出力

Qwen-RobotWorld

Flagship

物理世界の予測、ロボット計画

公式価格

使用するタイミング: ロボット計画と世界シミュレーション: 操作、運転、ナビゲーションのシナリオにおける行動の結果を予測します。

アップグレードのポイント

◆世界モデル: 物理的に妥当な未来を予測
◆クロスシーン: 操作、運転、ナビゲーションで動作
◆自然言語アクションインターフェース
◆オープンソース: 研究と展開のための完全な重み
◆完全なQwen-Robot Suite(Manip + Nav + World)の一部

入力価格

$0.0000

per 1M tokens

出力価格

$0.0000

per 1M tokens

キャッシュ入力

—

per 1M tokens

バッチ入力

—

per 1M tokens

コンテキストウィンドウ: 0

最大出力: 0 tokens

知識のカットオフ: 2026-06

ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

物理的に妥当な未来を予測する世界モデル
クロスシーン: 操作、運転、ナビゲーション
直感的な制御のための自然言語アクションインターフェース
Apache 2.0に基づくオープンソース

短所

世界シミュレーションのみに特化
テキスト生成やロボット制御なし
フルスタックにManip/Navとの統合が必要
非常に新しい — 利用可能なベンチマークが限られている

パフォーマンス

出力速度—

レート制限—

マルチモーダル

画像入力画像出力音声入力音声出力

並べて比較

モデル	ティア	入力	出力	キャッシュ	コンテキスト	最大出力
Qwen3.7-Max	Flagship	$2.50	$7.50	$0.250	1M	65,536
Qwen3.7-Plus	Mid-tier	$0.400	$1.60	$0.100	1M	16,384
Qwen3-235B-A22B	Flagship	$0.400	$1.20	$0.100	131K	8,192
Qwen3-30B-A3B	Mid-tier	$0.150	$0.600	$0.040	131K	8,192
Qwen3-32B	Mid-tier	$0.200	$0.600	$0.050	131K	8,192
Qwen3-14B	Lite	$0.100	$0.300	$0.030	131K	8,192
Qwen3-8B	Lite	$0.050	$0.150	$0.010	131K	8,192
Qwen-VL-Plus	Mid-tier	$0.200	$0.800	$0.050	131K	8,192
Qwen-RobotManip	Flagship	$0.0000	$0.0000	—	0	0
Qwen-RobotNav	Flagship	$0.0000	$0.0000	—	0	0
Qwen-RobotWorld	Flagship	$0.0000	$0.0000	—	0	0