DeepSeek Модели

Изучите все 4 моделей от DeepSeek с подробными ценами, плюсами и минусами, а также рекомендациями для разработчиков.

Модели

$0.140

Самая низкая входная цена

Макс. контекст

Уровни качества

Быстрые рекомендации

Лучшее соотношение цены и качества: DeepSeek V4 Flash ($0.140/1M)

Лучшее качество: DeepSeek V4 Flash

Лучшее для рассуждений: DeepSeek V4 Pro

DeepSeek V4 Pro

Reasoning

Deep reasoning, complex analysis

Официальные цены

Когда использовать: Best budget reasoning model with massive output capacity for math, logic, and analysis.

Ключевые улучшения

◆384K max output — largest in the market (3x GPT-5.5's 128K)
◆1M context window — 16x increase over DeepSeek R1's 65K
◆99% cheaper than GPT-5.5 for reasoning ($0.435 vs $5/M input)
◆Cached input: $0.003625/M — 99.2% savings for repeated prefixes
◆Thinking mode: toggleable deep reasoning without extra cost

Цена входа

$0.435

per 1M tokens

Цена выхода

$0.870

per 1M tokens

Кэшированный вход

$0.0036

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 1M

Макс. выход: 384,000 tokens

Дата обрезания знаний: 2025-06

ЗрениеВызов функцийТонкая настройкаРежим JSON

Плюсы

384K max output — largest available
1M context window
99% cheaper than GPT-5.5 for reasoning

Минусы

No vision support
No fine-tuning
Thinking mode adds token overhead

Производительность

Скорость вывода~30 tok/s

Ограничение скорости2,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

88.0%

AIME 2024

85.0%

SWE-bench Verified

71.0%

MATH

82.5%

DeepSeek V4 Flash

Flagship

Ultra-cheap coding, general tasks

Официальные цены

Когда использовать: Best for high-volume coding and general tasks where cost is the primary concern.

Ключевые улучшения

◆Cheapest LLM available: $0.14/M input, $0.28/M output
◆1M context + 384K output — same capacity as V4 Pro at 1/3 the price
◆Dual mode: thinking and non-thinking — switch based on task complexity
◆Cached input: $0.0028/M — 98% savings for system prompts
◆No vision — text-only; use GPT-4.1 or Gemini for multimodal needs

Цена входа

$0.140

per 1M tokens

Цена выхода

$0.280

per 1M tokens

Кэшированный вход

$0.0028

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 1M

Макс. выход: 384,000 tokens

Дата обрезания знаний: 2025-06

ЗрениеВызов функцийТонкая настройкаРежим JSON

Плюсы

Cheapest LLM available at $0.14/M input
1M context + 384K output
Supports both thinking and non-thinking modes

Минусы

No vision support
Quality below GPT-5.4 for complex tasks
No fine-tuning

Производительность

Скорость вывода~60 tok/s

Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

84.5%

HumanEval

86.0%

SWE-bench Verified

55.0%

DeepSeek V3

Flagship

Coding, math, reasoning

Официальные цены

Когда использовать: Best budget flagship for coding-heavy workloads. 10x cheaper than GPT-4.1 for comparable quality.

Ключевые улучшения

◆10x cheaper than GPT-4.1 ($0.27 vs $2/M input) for comparable coding
◆Fine-tuning available — customize for domain-specific coding tasks
◆Prompt caching: $0.07/M — 74% savings for repeated system prompts
◆671B MoE params with 37B active — flagship intelligence at budget price
◆65K context is small vs 1M competitors — upgrade to V4 for long context

Цена входа

$0.270

per 1M tokens

Цена выхода

$1.10

per 1M tokens

Кэшированный вход

$0.070

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 66K

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2024-07

ЗрениеВызов функцийТонкая настройкаРежим JSON

Плюсы

Extremely cheap for flagship quality
Excellent coding & math
Fine-tuning + caching available

Минусы

Only 65K context
No vision
Limited function calling reliability

Производительность

Скорость вывода~50 tok/s

Ограничение скорости3,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

87.1%

SWE-bench Verified

50.0%

MATH

75.0%

HumanEval

89.0%

Агенты, использующие эту модель

Aider MetaGPT

DeepSeek R1

Reasoning

Deep reasoning, math proofs

Официальные цены

Когда использовать: Budget reasoning model — use when o3 cost is prohibitive for math/logic pipelines.

Ключевые улучшения

◆4x cheaper than o3 ($0.55 vs $2/M input) for comparable reasoning
◆AIME 2024: 79.8% — competitive with o1 on math benchmarks
◆Prompt caching: $0.14/M — 75% savings for repeated prefixes
◆Open-source reasoning model — self-host for unlimited usage
◆No function calling or vision — pure reasoning; upgrade to V4 Pro for tools

Цена входа

$0.550

per 1M tokens

Цена выхода

$2.19

per 1M tokens

Кэшированный вход

$0.140

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 66K

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2024-07

ЗрениеВызов функцийТонкая настройкаРежим JSON

Плюсы

4x cheaper than o3 for reasoning
Strong math & logic
Good prompt caching savings

Минусы

No function calling
No vision or fine-tuning
Only 65K context

Производительность

Скорость вывода~20 tok/s

Ограничение скорости2,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

AIME 2024

79.8%

MATH

97.3%

GPQA

71.5%

Сравнение бок о бок

Модель	Уровень	Вход	Выход	Кэш	Контекст	Макс. выход
DeepSeek V4 Pro	Reasoning	$0.435	$0.870	$0.0036	1M	384,000
DeepSeek V4 Flash	Flagship	$0.140	$0.280	$0.0028	1M	384,000
DeepSeek V3	Flagship	$0.270	$1.10	$0.070	66K	8,192
DeepSeek R1	Reasoning	$0.550	$2.19	$0.140	66K	8,192