開発者ゾーンに戻る公式価格 公式価格 公式価格 公式価格
DeepSeek モデル
DeepSeek の全 4 モデルを、詳細な価格、長所・短所、開発者向け推奨事項とともにご覧いただけます。
4
モデル
$0.140
最安入力
1M
最大コンテキスト
2
品質ティア
クイック推奨
ベストバリュー: DeepSeek V4 Flash ($0.140/1M)
最高品質: DeepSeek V4 Flash
推論に最適: DeepSeek V4 Pro
DeepSeek V4 Pro
ReasoningDeep reasoning, complex analysis
使用するタイミング: Best budget reasoning model with massive output capacity for math, logic, and analysis.
アップグレードのポイント
- ◆384K max output — largest in the market (3x GPT-5.5's 128K)
- ◆1M context window — 16x increase over DeepSeek R1's 65K
- ◆99% cheaper than GPT-5.5 for reasoning ($0.435 vs $5/M input)
- ◆Cached input: $0.003625/M — 99.2% savings for repeated prefixes
- ◆Thinking mode: toggleable deep reasoning without extra cost
入力価格
$0.435
per 1M tokens
出力価格
$0.870
per 1M tokens
キャッシュ入力
$0.0036
per 1M tokens
バッチ入力
—
per 1M tokens
コンテキストウィンドウ: 1M
最大出力: 384,000 tokens
知識のカットオフ: 2025-06
ビジョン関数呼び出しファインチューニングJSONモード
長所
- 384K max output — largest available
- 1M context window
- 99% cheaper than GPT-5.5 for reasoning
短所
- No vision support
- No fine-tuning
- Thinking mode adds token overhead
パフォーマンス
出力速度~30 tok/s
レート制限2,000 RPM
マルチモーダル
画像入力画像出力音声入力音声出力
ベンチマーク
MMLU
88.0%
AIME 2024
85.0%
SWE-bench Verified
71.0%
MATH
82.5%
DeepSeek V4 Flash
FlagshipUltra-cheap coding, general tasks
使用するタイミング: Best for high-volume coding and general tasks where cost is the primary concern.
アップグレードのポイント
- ◆Cheapest LLM available: $0.14/M input, $0.28/M output
- ◆1M context + 384K output — same capacity as V4 Pro at 1/3 the price
- ◆Dual mode: thinking and non-thinking — switch based on task complexity
- ◆Cached input: $0.0028/M — 98% savings for system prompts
- ◆No vision — text-only; use GPT-4.1 or Gemini for multimodal needs
入力価格
$0.140
per 1M tokens
出力価格
$0.280
per 1M tokens
キャッシュ入力
$0.0028
per 1M tokens
バッチ入力
—
per 1M tokens
コンテキストウィンドウ: 1M
最大出力: 384,000 tokens
知識のカットオフ: 2025-06
ビジョン関数呼び出しファインチューニングJSONモード
長所
- Cheapest LLM available at $0.14/M input
- 1M context + 384K output
- Supports both thinking and non-thinking modes
短所
- No vision support
- Quality below GPT-5.4 for complex tasks
- No fine-tuning
パフォーマンス
出力速度~60 tok/s
レート制限5,000 RPM
マルチモーダル
画像入力画像出力音声入力音声出力
ベンチマーク
MMLU
84.5%
HumanEval
86.0%
SWE-bench Verified
55.0%
DeepSeek V3
FlagshipCoding, math, reasoning
使用するタイミング: Best budget flagship for coding-heavy workloads. 10x cheaper than GPT-4.1 for comparable quality.
アップグレードのポイント
- ◆10x cheaper than GPT-4.1 ($0.27 vs $2/M input) for comparable coding
- ◆Fine-tuning available — customize for domain-specific coding tasks
- ◆Prompt caching: $0.07/M — 74% savings for repeated system prompts
- ◆671B MoE params with 37B active — flagship intelligence at budget price
- ◆65K context is small vs 1M competitors — upgrade to V4 for long context
入力価格
$0.270
per 1M tokens
出力価格
$1.10
per 1M tokens
キャッシュ入力
$0.070
per 1M tokens
バッチ入力
—
per 1M tokens
コンテキストウィンドウ: 66K
最大出力: 8,192 tokens
知識のカットオフ: 2024-07
ビジョン関数呼び出しファインチューニングJSONモード
長所
- Extremely cheap for flagship quality
- Excellent coding & math
- Fine-tuning + caching available
短所
- Only 65K context
- No vision
- Limited function calling reliability
パフォーマンス
出力速度~50 tok/s
レート制限3,000 RPM
マルチモーダル
画像入力画像出力音声入力音声出力
ベンチマーク
MMLU
87.1%
SWE-bench Verified
50.0%
MATH
75.0%
HumanEval
89.0%
DeepSeek R1
ReasoningDeep reasoning, math proofs
使用するタイミング: Budget reasoning model — use when o3 cost is prohibitive for math/logic pipelines.
アップグレードのポイント
- ◆4x cheaper than o3 ($0.55 vs $2/M input) for comparable reasoning
- ◆AIME 2024: 79.8% — competitive with o1 on math benchmarks
- ◆Prompt caching: $0.14/M — 75% savings for repeated prefixes
- ◆Open-source reasoning model — self-host for unlimited usage
- ◆No function calling or vision — pure reasoning; upgrade to V4 Pro for tools
入力価格
$0.550
per 1M tokens
出力価格
$2.19
per 1M tokens
キャッシュ入力
$0.140
per 1M tokens
バッチ入力
—
per 1M tokens
コンテキストウィンドウ: 66K
最大出力: 8,192 tokens
知識のカットオフ: 2024-07
ビジョン関数呼び出しファインチューニングJSONモード
長所
- 4x cheaper than o3 for reasoning
- Strong math & logic
- Good prompt caching savings
短所
- No function calling
- No vision or fine-tuning
- Only 65K context
パフォーマンス
出力速度~20 tok/s
レート制限2,000 RPM
マルチモーダル
画像入力画像出力音声入力音声出力
ベンチマーク
AIME 2024
79.8%
MATH
97.3%
GPQA
71.5%
並べて比較
| モデル | ティア | 入力 | 出力 | コンテキスト |
|---|---|---|---|---|
| DeepSeek V4 Pro | Reasoning | $0.435 | $0.870 | 1M |
| DeepSeek V4 Flash | Flagship | $0.140 | $0.280 | 1M |
| DeepSeek V3 | Flagship | $0.270 | $1.10 | 66K |
| DeepSeek R1 | Reasoning | $0.550 | $2.19 | 66K |