開発者ゾーンに戻る

Alibaba Cloud モデル

Alibaba Cloud の全 11 モデルを、詳細な価格、長所・短所、開発者向け推奨事項とともにご覧いただけます。

11
モデル
$0.0000
最安入力
1M
最大コンテキスト
3
品質ティア

クイック推奨

ベストバリュー: Qwen-RobotWorld ($0.0000/1M)
最高品質: Qwen3.7-Max

Qwen3.7-Max

Flagship

長期エージェントワークフロー、コーディングエージェント、複雑な推論

公式価格

使用するタイミング: 長期間の自律実行を必要とする最先端エージェントワークロード、複雑な多段階コーディングタスク、深層研究分析。

アップグレードのポイント

  • 100万トークンコンテキスト — ドキュメント中心のエージェント作業の制限を排除
  • 65K最大出力 — 大規模単一生成
  • 35時間の持続的自律カーネル最適化 (1,158回のツール呼び出し)
  • SWE-Verified 80.4、LiveCodeBench 91.6 — Claude Opus 4.6と競合
  • OpenAI + Anthropic API互換 — ドロップイン置換
入力価格
$2.50
per 1M tokens
出力価格
$7.50
per 1M tokens
キャッシュ入力
$0.250
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 1M
最大出力: 65,536 tokens
知識のカットオフ: 2026-05
ビジョン関数呼び出しファインチューニングJSONモード

長所

  • ドキュメント中心のエージェント作業向け100万コンテキストウィンドウ
  • Qwenファミリー最長の65K最大出力
  • クロスハーネス互換性 (Claude Code、OpenClaw、Qwen Code)
  • 35時間の持続的自律実行
  • コーディングベンチマークでClaude Opus 4.6と競合

短所

  • プロプライエタリ — オープンウェイトやセルフホスティング不可
  • Qwen 3.6ラインより高コスト
  • ビジョンサポートなし
  • APIのみのアクセス

パフォーマンス

出力速度~55 tok/s
レート制限2,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU-Pro
89.6%
LiveCodeBench
91.6%
SWE-Verified
80.4%
GPQA Diamond
92.4%

このモデルを使用するエージェント

3

Qwen3.7-Plus

Mid-tier

マルチモーダルタスク、コスト効率の高いエージェント展開

公式価格

使用するタイミング: 長いコンテキスト要件とともに、テキスト、動画、画像の理解が必要なコスト効率の高いマルチモーダル展開に最適です。

アップグレードのポイント

  • マルチモーダル入力: 1つのモデルでテキスト + 動画 + 画像
  • $0.40/100万トークンの100万コンテキスト — Qwen3.7-Maxより6倍安い
  • ミッドティア価格で強力なエージェント性能
  • OpenAI互換API
入力価格
$0.400
per 1M tokens
出力価格
$1.60
per 1M tokens
キャッシュ入力
$0.100
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 1M
最大出力: 16,384 tokens
知識のカットオフ: 2026-05
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • ミッドティア価格で100万コンテキスト
  • マルチモーダル: テキスト、動画、画像入力
  • 強力な速度と性能のバランス
  • 独自仕様だが非常に手頃な価格

短所

  • 独自仕様 — セルフホスティング不可
  • 複雑な推論ではQwen3.7-Maxより性能が劣る
  • 最大出力16K

パフォーマンス

出力速度~80 tok/s
レート制限5,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU-Pro
84.2%
LiveCodeBench
78.5%
MMMU
72.1%

Qwen3-235B-A22B

Flagship

複雑な推論、多言語タスク

公式価格

使用するタイミング: 多言語ワークロード、複雑な推論、コスト重視の本番環境に最適なフラッグシップモデルです。

アップグレードのポイント

  • MoEアーキテクチャ: 235Bパラメータ、22Bのみアクティブ — GPT-4クラスを1/10の価格で
  • 131Kコンテキスト — 長文ドキュメントやコードベースを処理
  • 100以上の言語サポート — 非英語タスクで最高クラス
  • オープンソース: HuggingFaceで完全な重みを提供し、セルフホスティング可能
  • 1Mトークンあたり$0.40/$1.20 — GPT-4oより90%低価格
入力価格
$0.400
per 1M tokens
出力価格
$1.20
per 1M tokens
キャッシュ入力
$0.100
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 131K
最大出力: 8,192 tokens
知識のカットオフ: 2025-04
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • MoE 235B総数 / 22Bアクティブ — 低コストでフラッグシップ性能
  • 131Kコンテキストウィンドウ
  • 強力な多言語対応(100以上の言語)
  • オープンソースの重みを利用可能

短所

  • ビジョンサポートなし
  • 最大出力8Kトークン
  • GPT-4よりもエコシステム統合が少ない

パフォーマンス

出力速度~70 tok/s
レート制限5,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU
86.8%
LiveCodeBench
63.7%
IFEval
86.2%

このモデルを使用するエージェント

2

Qwen3-30B-A3B

Mid-tier

効率的な多言語推論

公式価格

使用するタイミング: コスト効率が最も重要な高スループット多言語タスク。

アップグレードのポイント

  • わずか3Bアクティブパラメータ — コンシューマーGPUで実行可能
  • $0.15/1M入力で131Kコンテキスト — 最も安価な長いコンテキストオプション
  • 完全カスタマイズ可能なオープンソース
  • エージェントワークフロー向けの強力な関数呼び出し
入力価格
$0.150
per 1M tokens
出力価格
$0.600
per 1M tokens
キャッシュ入力
$0.040
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 131K
最大出力: 8,192 tokens
知識のカットオフ: 2025-04
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • MoE 30B 合計 / 3B アクティブ — 超効率的
  • 131K コンテキスト
  • 優れたコストパフォーマンス比
  • オープンソース

短所

  • アクティブパラメータが少なく複雑な推論に制限
  • ビジョンなし
  • 最大8K出力

パフォーマンス

出力速度~120 tok/s
レート制限10,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU
78.5%
LiveCodeBench
48.2%

Qwen3-32B

Mid-tier

バランスの取れたパフォーマンスとコスト

公式価格

使用するタイミング: コーディングや一般的なタスクに信頼性の高い高密度モデルのパフォーマンスが必要な場合に使用します。

アップグレードのポイント

  • 高密度32Bアーキテクチャ — MoEルーティングオーバーヘッドなし
  • 長文コンテンツ向け131Kコンテキスト
  • 強力なコーディング: LiveCodeBench 55.3%
  • HuggingFace完全サポートのオープンソース
入力価格
$0.200
per 1M tokens
出力価格
$0.600
per 1M tokens
キャッシュ入力
$0.050
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 131K
最大出力: 8,192 tokens
知識のカットオフ: 2025-04
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • 高密度32B — 一貫したパフォーマンス
  • 131Kコンテキスト
  • 強力なコーディング能力
  • オープンソース

短所

  • ビジョン非対応
  • 最大8K出力
  • MoEバリアントより高いレイテンシ

パフォーマンス

出力速度~65 tok/s
レート制限5,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU
83.2%
LiveCodeBench
55.3%

Qwen3-14B

Lite

軽量な一般的なタスク

公式価格

使用するタイミング: 要約、翻訳、簡単なQ&Aに最適な予算に優しいオプションです。

アップグレードのポイント

  • 14B高密度 — 単一GPUに適合
  • 131Kコンテキスト、わずか$0.10/1M入力
  • ほとんどの日常タスクに十分
  • ファインチューニング用のオープンソース
入力価格
$0.100
per 1M tokens
出力価格
$0.300
per 1M tokens
キャッシュ入力
$0.030
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 131K
最大出力: 8,192 tokens
知識のカットオフ: 2025-04
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • コンパクトな14B高密度モデル
  • 131Kコンテキスト
  • 非常に低コスト
  • オープンソース

短所

  • 限られた複雑な推論
  • ビジョンなし
  • 最大8K出力

パフォーマンス

出力速度~90 tok/s
レート制限10,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU
77.1%
LiveCodeBench
42.8%

Qwen3-8B

Lite

エッジ展開、シンプルなタスク

公式価格

使用するタイミング: エッジデバイス、ローカル展開、または超低コストのバッチ処理に最適です。

アップグレードのポイント

  • 8Bパラメータ — RTX 3060または同等品で動作
  • $0.05/100万入力 — 最も安価なオプションの一つ
  • 小型ながら131Kコンテキスト
  • ローカル/オフライン展開に最適
入力価格
$0.050
per 1M tokens
出力価格
$0.150
per 1M tokens
キャッシュ入力
$0.010
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 131K
最大出力: 8,192 tokens
知識のカットオフ: 2025-04
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • 超小型8B — ノートPCのGPUで動作
  • 131Kコンテキスト
  • 非常に低コスト
  • オープンソース

短所

  • 基本的な推論のみ
  • ビジョン非対応
  • 最大8K出力

パフォーマンス

出力速度~150 tok/s
レート制限20,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMLU
71.5%
LiveCodeBench
33.1%

Qwen-VL-Plus

Mid-tier

マルチモーダル理解、文書分析

公式価格

使用するタイミング: 文書分析、画像キャプション、ビジュアルQ&A、マルチモーダルRAGパイプライン。

アップグレードのポイント

  • ネイティブマルチモーダル — 画像とテキストを一緒に処理
  • 131Kコンテキストで複数ページの文書を処理
  • 強力なOCR: チャート、表、図の理解
  • 100以上の言語に対応した多言語VQA
入力価格
$0.200
per 1M tokens
出力価格
$0.800
per 1M tokens
キャッシュ入力
$0.050
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 131K
最大出力: 8,192 tokens
知識のカットオフ: 2025-04
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • ネイティブビジョン言語モデル
  • 131Kコンテキストと画像対応
  • 強力な文書OCRとチャート理解
  • 多言語VQA

短所

  • ファインチューニング不可
  • 最大出力8K
  • テキスト専用Qwen3より高コスト

パフォーマンス

出力速度~55 tok/s
レート制限3,000 RPM

マルチモーダル

画像入力画像出力音声入力音声出力

ベンチマーク

MMMU
68.2%
MathVista
62.5%

Qwen-RobotManip

Flagship

ロボット操作、巧みなハンド制御

公式価格

使用するタイミング: ロボット操作タスク: 研究および産業環境での把持、組み立て、巧みなハンド制御。

アップグレードのポイント

  • 初のQwen-Robot VLA操作モデル
  • 38,100時間以上のオープンソーストレーニングデータ
  • ロボットタイプ間の統一状態-アクションスペース
  • カメラフレームエンドエフェクター増分ポーズ制御
  • 完全なQwen-Robot Suite(操作 + ナビ + ワールド)の一部
入力価格
$0.0000
per 1M tokens
出力価格
$0.0000
per 1M tokens
キャッシュ入力
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 0
最大出力: 0 tokens
知識のカットオフ: 2026-06
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • 精密なロボット操作のためのVLAモデル
  • オープンソースデータによる38,100時間以上のトレーニング
  • 統一アクションスペースによるマルチロボットタイプ対応
  • Apache 2.0ライセンスでオープンソース

短所

  • ロボット専用 — 汎用LLMではない
  • デプロイにロボットハードウェアまたはシミュレーターが必要
  • テキスト生成機能なし
  • 非常に新しい — コミュニティでの採用が限定的

パフォーマンス

出力速度
レート制限

マルチモーダル

画像入力画像出力音声入力音声出力

Qwen-RobotNav

Flagship

ロボットナビゲーション、経路計画、自律移動

公式価格

使用するタイミング: 移動ロボットナビゲーション:指示追従、ポイントナビゲーション、物体追跡、自律運転タスクに使用します。

アップグレードのポイント

  • 物理エージェント向けVLNモデル:ビジョン言語ナビゲーション
  • 4つのタスクタイプを統合:指示、ポイント/ゴール、追跡、運転
  • 制御された観測エンコーディング+ツールインターフェース
  • オープンソース:カスタマイズ用の完全な重み
  • 完全なQwen-Robot Suite(操作+ナビゲーション+世界)の一部
入力価格
$0.0000
per 1M tokens
出力価格
$0.0000
per 1M tokens
キャッシュ入力
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 0
最大出力: 0 tokens
知識のカットオフ: 2026-06
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • 4種類のナビゲーションタスクを統合するVLNモデル
  • 3D空間認識のための制御された観測エンコーディング
  • 指示追従、ポイント/ゴールナビゲーション、追跡、運転をカバー
  • Apache 2.0ライセンスでオープンソース

短所

  • ロボットナビゲーションに特化
  • ロボットハードウェアまたはシミュレーターが必要
  • テキスト生成不可
  • 非常に新しい — 実世界での検証が限定的

パフォーマンス

出力速度
レート制限

マルチモーダル

画像入力画像出力音声入力音声出力

Qwen-RobotWorld

Flagship

物理世界の予測、ロボット計画

公式価格

使用するタイミング: ロボット計画と世界シミュレーション: 操作、運転、ナビゲーションのシナリオにおける行動の結果を予測します。

アップグレードのポイント

  • 世界モデル: 物理的に妥当な未来を予測
  • クロスシーン: 操作、運転、ナビゲーションで動作
  • 自然言語アクションインターフェース
  • オープンソース: 研究と展開のための完全な重み
  • 完全なQwen-Robot Suite(Manip + Nav + World)の一部
入力価格
$0.0000
per 1M tokens
出力価格
$0.0000
per 1M tokens
キャッシュ入力
per 1M tokens
バッチ入力
per 1M tokens
コンテキストウィンドウ: 0
最大出力: 0 tokens
知識のカットオフ: 2026-06
ビジョン関数呼び出しファインチューニングJSONモード無料ティア

長所

  • 物理的に妥当な未来を予測する世界モデル
  • クロスシーン: 操作、運転、ナビゲーション
  • 直感的な制御のための自然言語アクションインターフェース
  • Apache 2.0に基づくオープンソース

短所

  • 世界シミュレーションのみに特化
  • テキスト生成やロボット制御なし
  • フルスタックにManip/Navとの統合が必要
  • 非常に新しい — 利用可能なベンチマークが限られている

パフォーマンス

出力速度
レート制限

マルチモーダル

画像入力画像出力音声入力音声出力

並べて比較

モデルティア入力出力コンテキスト
Qwen3.7-MaxFlagship$2.50$7.501M
Qwen3.7-PlusMid-tier$0.400$1.601M
Qwen3-235B-A22BFlagship$0.400$1.20131K
Qwen3-30B-A3BMid-tier$0.150$0.600131K
Qwen3-32BMid-tier$0.200$0.600131K
Qwen3-14BLite$0.100$0.300131K
Qwen3-8BLite$0.050$0.150131K
Qwen-VL-PlusMid-tier$0.200$0.800131K
Qwen-RobotManipFlagship$0.0000$0.00000
Qwen-RobotNavFlagship$0.0000$0.00000
Qwen-RobotWorldFlagship$0.0000$0.00000