Alibaba Cloud モデル
Alibaba Cloud の全 11 モデルを、詳細な価格、長所・短所、開発者向け推奨事項とともにご覧いただけます。
クイック推奨
Qwen3.7-Max
Flagship長期エージェントワークフロー、コーディングエージェント、複雑な推論
使用するタイミング: 長期間の自律実行を必要とする最先端エージェントワークロード、複雑な多段階コーディングタスク、深層研究分析。
アップグレードのポイント
- ◆100万トークンコンテキスト — ドキュメント中心のエージェント作業の制限を排除
- ◆65K最大出力 — 大規模単一生成
- ◆35時間の持続的自律カーネル最適化 (1,158回のツール呼び出し)
- ◆SWE-Verified 80.4、LiveCodeBench 91.6 — Claude Opus 4.6と競合
- ◆OpenAI + Anthropic API互換 — ドロップイン置換
長所
- ドキュメント中心のエージェント作業向け100万コンテキストウィンドウ
- Qwenファミリー最長の65K最大出力
- クロスハーネス互換性 (Claude Code、OpenClaw、Qwen Code)
- 35時間の持続的自律実行
- コーディングベンチマークでClaude Opus 4.6と競合
短所
- プロプライエタリ — オープンウェイトやセルフホスティング不可
- Qwen 3.6ラインより高コスト
- ビジョンサポートなし
- APIのみのアクセス
パフォーマンス
マルチモーダル
ベンチマーク
このモデルを使用するエージェント
3Qwen3.7-Plus
Mid-tierマルチモーダルタスク、コスト効率の高いエージェント展開
使用するタイミング: 長いコンテキスト要件とともに、テキスト、動画、画像の理解が必要なコスト効率の高いマルチモーダル展開に最適です。
アップグレードのポイント
- ◆マルチモーダル入力: 1つのモデルでテキスト + 動画 + 画像
- ◆$0.40/100万トークンの100万コンテキスト — Qwen3.7-Maxより6倍安い
- ◆ミッドティア価格で強力なエージェント性能
- ◆OpenAI互換API
長所
- ミッドティア価格で100万コンテキスト
- マルチモーダル: テキスト、動画、画像入力
- 強力な速度と性能のバランス
- 独自仕様だが非常に手頃な価格
短所
- 独自仕様 — セルフホスティング不可
- 複雑な推論ではQwen3.7-Maxより性能が劣る
- 最大出力16K
パフォーマンス
マルチモーダル
ベンチマーク
Qwen3-235B-A22B
Flagship複雑な推論、多言語タスク
使用するタイミング: 多言語ワークロード、複雑な推論、コスト重視の本番環境に最適なフラッグシップモデルです。
アップグレードのポイント
- ◆MoEアーキテクチャ: 235Bパラメータ、22Bのみアクティブ — GPT-4クラスを1/10の価格で
- ◆131Kコンテキスト — 長文ドキュメントやコードベースを処理
- ◆100以上の言語サポート — 非英語タスクで最高クラス
- ◆オープンソース: HuggingFaceで完全な重みを提供し、セルフホスティング可能
- ◆1Mトークンあたり$0.40/$1.20 — GPT-4oより90%低価格
長所
- MoE 235B総数 / 22Bアクティブ — 低コストでフラッグシップ性能
- 131Kコンテキストウィンドウ
- 強力な多言語対応(100以上の言語)
- オープンソースの重みを利用可能
短所
- ビジョンサポートなし
- 最大出力8Kトークン
- GPT-4よりもエコシステム統合が少ない
パフォーマンス
マルチモーダル
ベンチマーク
このモデルを使用するエージェント
2Qwen3-30B-A3B
Mid-tier効率的な多言語推論
使用するタイミング: コスト効率が最も重要な高スループット多言語タスク。
アップグレードのポイント
- ◆わずか3Bアクティブパラメータ — コンシューマーGPUで実行可能
- ◆$0.15/1M入力で131Kコンテキスト — 最も安価な長いコンテキストオプション
- ◆完全カスタマイズ可能なオープンソース
- ◆エージェントワークフロー向けの強力な関数呼び出し
長所
- MoE 30B 合計 / 3B アクティブ — 超効率的
- 131K コンテキスト
- 優れたコストパフォーマンス比
- オープンソース
短所
- アクティブパラメータが少なく複雑な推論に制限
- ビジョンなし
- 最大8K出力
パフォーマンス
マルチモーダル
ベンチマーク
Qwen3-32B
Mid-tierバランスの取れたパフォーマンスとコスト
使用するタイミング: コーディングや一般的なタスクに信頼性の高い高密度モデルのパフォーマンスが必要な場合に使用します。
アップグレードのポイント
- ◆高密度32Bアーキテクチャ — MoEルーティングオーバーヘッドなし
- ◆長文コンテンツ向け131Kコンテキスト
- ◆強力なコーディング: LiveCodeBench 55.3%
- ◆HuggingFace完全サポートのオープンソース
長所
- 高密度32B — 一貫したパフォーマンス
- 131Kコンテキスト
- 強力なコーディング能力
- オープンソース
短所
- ビジョン非対応
- 最大8K出力
- MoEバリアントより高いレイテンシ
パフォーマンス
マルチモーダル
ベンチマーク
Qwen3-14B
Lite軽量な一般的なタスク
使用するタイミング: 要約、翻訳、簡単なQ&Aに最適な予算に優しいオプションです。
アップグレードのポイント
- ◆14B高密度 — 単一GPUに適合
- ◆131Kコンテキスト、わずか$0.10/1M入力
- ◆ほとんどの日常タスクに十分
- ◆ファインチューニング用のオープンソース
長所
- コンパクトな14B高密度モデル
- 131Kコンテキスト
- 非常に低コスト
- オープンソース
短所
- 限られた複雑な推論
- ビジョンなし
- 最大8K出力
パフォーマンス
マルチモーダル
ベンチマーク
Qwen3-8B
Liteエッジ展開、シンプルなタスク
使用するタイミング: エッジデバイス、ローカル展開、または超低コストのバッチ処理に最適です。
アップグレードのポイント
- ◆8Bパラメータ — RTX 3060または同等品で動作
- ◆$0.05/100万入力 — 最も安価なオプションの一つ
- ◆小型ながら131Kコンテキスト
- ◆ローカル/オフライン展開に最適
長所
- 超小型8B — ノートPCのGPUで動作
- 131Kコンテキスト
- 非常に低コスト
- オープンソース
短所
- 基本的な推論のみ
- ビジョン非対応
- 最大8K出力
パフォーマンス
マルチモーダル
ベンチマーク
Qwen-VL-Plus
Mid-tierマルチモーダル理解、文書分析
使用するタイミング: 文書分析、画像キャプション、ビジュアルQ&A、マルチモーダルRAGパイプライン。
アップグレードのポイント
- ◆ネイティブマルチモーダル — 画像とテキストを一緒に処理
- ◆131Kコンテキストで複数ページの文書を処理
- ◆強力なOCR: チャート、表、図の理解
- ◆100以上の言語に対応した多言語VQA
長所
- ネイティブビジョン言語モデル
- 131Kコンテキストと画像対応
- 強力な文書OCRとチャート理解
- 多言語VQA
短所
- ファインチューニング不可
- 最大出力8K
- テキスト専用Qwen3より高コスト
パフォーマンス
マルチモーダル
ベンチマーク
Qwen-RobotManip
Flagshipロボット操作、巧みなハンド制御
使用するタイミング: ロボット操作タスク: 研究および産業環境での把持、組み立て、巧みなハンド制御。
アップグレードのポイント
- ◆初のQwen-Robot VLA操作モデル
- ◆38,100時間以上のオープンソーストレーニングデータ
- ◆ロボットタイプ間の統一状態-アクションスペース
- ◆カメラフレームエンドエフェクター増分ポーズ制御
- ◆完全なQwen-Robot Suite(操作 + ナビ + ワールド)の一部
長所
- 精密なロボット操作のためのVLAモデル
- オープンソースデータによる38,100時間以上のトレーニング
- 統一アクションスペースによるマルチロボットタイプ対応
- Apache 2.0ライセンスでオープンソース
短所
- ロボット専用 — 汎用LLMではない
- デプロイにロボットハードウェアまたはシミュレーターが必要
- テキスト生成機能なし
- 非常に新しい — コミュニティでの採用が限定的
パフォーマンス
マルチモーダル
Qwen-RobotWorld
Flagship物理世界の予測、ロボット計画
使用するタイミング: ロボット計画と世界シミュレーション: 操作、運転、ナビゲーションのシナリオにおける行動の結果を予測します。
アップグレードのポイント
- ◆世界モデル: 物理的に妥当な未来を予測
- ◆クロスシーン: 操作、運転、ナビゲーションで動作
- ◆自然言語アクションインターフェース
- ◆オープンソース: 研究と展開のための完全な重み
- ◆完全なQwen-Robot Suite(Manip + Nav + World)の一部
長所
- 物理的に妥当な未来を予測する世界モデル
- クロスシーン: 操作、運転、ナビゲーション
- 直感的な制御のための自然言語アクションインターフェース
- Apache 2.0に基づくオープンソース
短所
- 世界シミュレーションのみに特化
- テキスト生成やロボット制御なし
- フルスタックにManip/Navとの統合が必要
- 非常に新しい — 利用可能なベンチマークが限られている
パフォーマンス
マルチモーダル
並べて比較
| モデル | ティア | 入力 | 出力 | コンテキスト |
|---|---|---|---|---|
| Qwen3.7-Max | Flagship | $2.50 | $7.50 | 1M |
| Qwen3.7-Plus | Mid-tier | $0.400 | $1.60 | 1M |
| Qwen3-235B-A22B | Flagship | $0.400 | $1.20 | 131K |
| Qwen3-30B-A3B | Mid-tier | $0.150 | $0.600 | 131K |
| Qwen3-32B | Mid-tier | $0.200 | $0.600 | 131K |
| Qwen3-14B | Lite | $0.100 | $0.300 | 131K |
| Qwen3-8B | Lite | $0.050 | $0.150 | 131K |
| Qwen-VL-Plus | Mid-tier | $0.200 | $0.800 | 131K |
| Qwen-RobotManip | Flagship | $0.0000 | $0.0000 | 0 |
| Qwen-RobotNav | Flagship | $0.0000 | $0.0000 | 0 |
| Qwen-RobotWorld | Flagship | $0.0000 | $0.0000 | 0 |