Google Модели

Изучите все 6 моделей от Google с подробными ценами, плюсами и минусами, а также рекомендациями для разработчиков.

Модели

$0.100

Самая низкая входная цена

1.0M

Макс. контекст

Уровни качества

Быстрые рекомендации

Лучшее соотношение цены и качества: Gemini 2.0 Flash ($0.100/1M)

Лучшее качество: Gemini 3.1 Pro

Gemini 3.1 Pro

Flagship

Advanced reasoning, coding

Официальные цены

Когда использовать: Best Google model for complex reasoning and professional coding tasks.

Ключевые улучшения

◆MMLU: 89.2% — significantly improved reasoning over Gemini 2.5 Pro
◆1M context with 65K output — same context, better quality
◆50% batch discount ($1/$6) — cheapest batch flagship available
◆Context caching: $0.50/M — 75% savings for repeated prefixes
◆Paid-only preview — no free tier, but production-grade reliability

Цена входа

$2.00

per 1M tokens

Цена выхода

$12.00

per 1M tokens

Кэшированный вход

$0.500

per 1M tokens

Пакетный вход

$1.00

per 1M tokens

Окно контекста: 1M

Макс. выход: 65,536 tokens

Дата обрезания знаний: 2025-06

ЗрениеВызов функцийТонкая настройкаРежим JSON

Плюсы

1M context with 65K output
Significantly improved reasoning over 3.0
50% batch discount available

Минусы

No free tier (paid-only preview)
Long-context input 2x above 200K
Still maturing

Производительность

Скорость вывода~55 tok/s

Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

89.2%

SWE-bench Verified

68.0%

GPQA

74.5%

Gemini 3.5 Flash

Mid-tier

Fast, intelligent generation

Официальные цены

Когда использовать: Best balance of speed and intelligence for production apps needing multimodal capability.

Ключевые улучшения

◆Frontier intelligence at mid-tier price — matches Gemini 2.5 Pro quality
◆1M context + 65K output at $1.50/$9 — 8x cheaper than flagship
◆Free tier available with rate limits — best free-tier model from Google
◆Context caching: $0.375/M — 75% savings for cached input
◆Multimodal (text + vision) at flash speed — sub-1s typical latency

Цена входа

$1.50

per 1M tokens

Цена выхода

$9.00

per 1M tokens

Кэшированный вход

$0.375

per 1M tokens

Пакетный вход

$0.750

per 1M tokens

Окно контекста: 1M

Макс. выход: 65,536 tokens

Дата обрезания знаний: 2025-06

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Frontier intelligence at mid-tier price
1M context + 65K output
Free tier with rate limits

Минусы

More expensive than 3.1 Flash-Lite
Output cost at $9/M is significant at scale
No fine-tuning

Производительность

Скорость вывода~95 tok/s

Ограничение скорости10,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

86.5%

HumanEval

85.0%

MATH

73.0%

Gemini 3.1 Flash-Lite

Lite

High-volume, low-latency tasks

Официальные цены

Когда использовать: Best budget model for high-volume classification, extraction, and lightweight generation.

Ключевые улучшения

◆1M context at $0.25/M input — 6x cheaper than Gemini 2.5 Flash
◆65K max output — same as Pro tier at lite pricing
◆Context caching: $0.0625/M — 90% savings, best caching value
◆Batch API: $0.125/$0.75 — 50% savings for async processing
◆Free tier with rate limits — unlimited prototyping at zero cost

Цена входа

$0.250

per 1M tokens

Цена выхода

$1.50

per 1M tokens

Кэшированный вход

$0.063

per 1M tokens

Пакетный вход

$0.125

per 1M tokens

Окно контекста: 1M

Макс. выход: 65,536 tokens

Дата обрезания знаний: 2025-04

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

1M context at $0.25/M input — incredible value
65K max output
90% context caching savings

Минусы

Quality below 3.5 Flash for complex tasks
No fine-tuning
Newer model, less battle-tested

Производительность

Скорость вывода~130 tok/s

Ограничение скорости15,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

79.0%

HumanEval

74.5%

Gemini 2.5 Pro

Flagship

Complex reasoning, long context

Официальные цены

Когда использовать: Best value flagship model — 1M context at lower cost than GPT-4.1 or Claude Sonnet.

Ключевые улучшения

◆Cheapest flagship input: $1.25/M — 40% cheaper than GPT-4.1
◆1M context window with 65K output — largest output among flagships
◆Context caching: $0.315/M — 75% savings for repeated prefixes
◆Free tier available — only flagship model with free access
◆MMLU: 85.4% — competitive with GPT-4.1 at half the cost

Цена входа

$1.25

per 1M tokens

Цена выхода

$10.00

per 1M tokens

Кэшированный вход

$0.315

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 1.0M

Макс. выход: 65,536 tokens

Дата обрезания знаний: 2025-01

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

1M context window
Cheapest flagship input at $1.25
65K max output

Минусы

No batch API
No fine-tuning
Higher output cost

Производительность

Скорость вывода~50 tok/s

Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

85.4%

SWE-bench Verified

63.8%

MATH

72.0%

Агенты, использующие эту модель

Gemini Deep Research LangGraph

Gemini 2.5 Flash

Mid-tier

Fast, efficient generation

Официальные цены

Когда использовать: Incredible value for production apps — 1M context for $0.15/1M input tokens.

Ключевые улучшения

◆Same 1M context as Pro at 1/8th the input price ($0.15 vs $1.25/M)
◆65K max output — identical to Pro tier for generation capacity
◆Context caching: $0.0375/M — 97% savings for cached prefixes
◆Free tier with generous rate limits — production-ready at zero cost
◆Sub-second latency — fastest Google model for real-time apps

Цена входа

$0.150

per 1M tokens

Цена выхода

$0.600

per 1M tokens

Кэшированный вход

$0.037

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 1.0M

Макс. выход: 65,536 tokens

Дата обрезания знаний: 2025-01

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Same 1M context as Pro at 1/8th price
65K max output
Best cached input savings

Минусы

No batch API
Quality below Pro for hard tasks
No fine-tuning

Производительность

Скорость вывода~100 tok/s

Ограничение скорости10,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

83.0%

HumanEval

82.5%

MATH

68.0%

Агенты, использующие эту модель

Genspark LaVague Flowise Haystack

Gemini 2.0 Flash

Lite

Ultra-fast, low cost

Официальные цены

Когда использовать: Best budget option for high-volume extraction, classification, and fine-tuned models.

Ключевые улучшения

◆Cheapest model with 1M context: $0.10/M input — lowest in market
◆Only lite model with fine-tuning + vision — full feature set
◆Context caching: $0.025/M — 97.5% savings for repeated prefixes
◆8K max output is low — upgrade to 2.5 Flash for 65K output
◆Fine-tuning support — best for domain-specific classification models

Цена входа

$0.100

per 1M tokens

Цена выхода

$0.400

per 1M tokens

Кэшированный вход

$0.025

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 1.0M

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2024-08

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Cheapest model in market with 1M context
Only lite model with fine-tuning + vision
Full feature set

Минусы

8K max output is low
Older knowledge cutoff
Quality below 2.5 Flash

Производительность

Скорость вывода~140 tok/s

Ограничение скорости15,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

78.5%

HumanEval

75.0%

MATH

62.0%

Сравнение бок о бок

Модель	Уровень	Вход	Выход	Кэш	Контекст	Макс. выход
Gemini 3.1 Pro	Flagship	$2.00	$12.00	$0.500	1M	65,536
Gemini 3.5 Flash	Mid-tier	$1.50	$9.00	$0.375	1M	65,536
Gemini 3.1 Flash-Lite	Lite	$0.250	$1.50	$0.063	1M	65,536
Gemini 2.5 Pro	Flagship	$1.25	$10.00	$0.315	1.0M	65,536
Gemini 2.5 Flash	Mid-tier	$0.150	$0.600	$0.037	1.0M	65,536
Gemini 2.0 Flash	Lite	$0.100	$0.400	$0.025	1.0M	8,192