Назад в зону разработчика

Google Модели

Изучите все 6 моделей от Google с подробными ценами, плюсами и минусами, а также рекомендациями для разработчиков.

6
Модели
$0.100
Самая низкая входная цена
1.0M
Макс. контекст
3
Уровни качества

Быстрые рекомендации

Лучшее соотношение цены и качества: Gemini 2.0 Flash ($0.100/1M)
Лучшее качество: Gemini 3.1 Pro

Gemini 3.1 Pro

Flagship

Advanced reasoning, coding

Официальные цены

Когда использовать: Best Google model for complex reasoning and professional coding tasks.

Ключевые улучшения

  • MMLU: 89.2% — significantly improved reasoning over Gemini 2.5 Pro
  • 1M context with 65K output — same context, better quality
  • 50% batch discount ($1/$6) — cheapest batch flagship available
  • Context caching: $0.50/M — 75% savings for repeated prefixes
  • Paid-only preview — no free tier, but production-grade reliability
Цена входа
$2.00
per 1M tokens
Цена выхода
$12.00
per 1M tokens
Кэшированный вход
$0.500
per 1M tokens
Пакетный вход
$1.00
per 1M tokens
Окно контекста: 1M
Макс. выход: 65,536 tokens
Дата обрезания знаний: 2025-06
ЗрениеВызов функцийТонкая настройкаРежим JSON

Плюсы

  • 1M context with 65K output
  • Significantly improved reasoning over 3.0
  • 50% batch discount available

Минусы

  • No free tier (paid-only preview)
  • Long-context input 2x above 200K
  • Still maturing

Производительность

Скорость вывода~55 tok/s
Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
89.2%
SWE-bench Verified
68.0%
GPQA
74.5%

Gemini 3.5 Flash

Mid-tier

Fast, intelligent generation

Официальные цены

Когда использовать: Best balance of speed and intelligence for production apps needing multimodal capability.

Ключевые улучшения

  • Frontier intelligence at mid-tier price — matches Gemini 2.5 Pro quality
  • 1M context + 65K output at $1.50/$9 — 8x cheaper than flagship
  • Free tier available with rate limits — best free-tier model from Google
  • Context caching: $0.375/M — 75% savings for cached input
  • Multimodal (text + vision) at flash speed — sub-1s typical latency
Цена входа
$1.50
per 1M tokens
Цена выхода
$9.00
per 1M tokens
Кэшированный вход
$0.375
per 1M tokens
Пакетный вход
$0.750
per 1M tokens
Окно контекста: 1M
Макс. выход: 65,536 tokens
Дата обрезания знаний: 2025-06
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Frontier intelligence at mid-tier price
  • 1M context + 65K output
  • Free tier with rate limits

Минусы

  • More expensive than 3.1 Flash-Lite
  • Output cost at $9/M is significant at scale
  • No fine-tuning

Производительность

Скорость вывода~95 tok/s
Ограничение скорости10,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
86.5%
HumanEval
85.0%
MATH
73.0%

Gemini 3.1 Flash-Lite

Lite

High-volume, low-latency tasks

Официальные цены

Когда использовать: Best budget model for high-volume classification, extraction, and lightweight generation.

Ключевые улучшения

  • 1M context at $0.25/M input — 6x cheaper than Gemini 2.5 Flash
  • 65K max output — same as Pro tier at lite pricing
  • Context caching: $0.0625/M — 90% savings, best caching value
  • Batch API: $0.125/$0.75 — 50% savings for async processing
  • Free tier with rate limits — unlimited prototyping at zero cost
Цена входа
$0.250
per 1M tokens
Цена выхода
$1.50
per 1M tokens
Кэшированный вход
$0.063
per 1M tokens
Пакетный вход
$0.125
per 1M tokens
Окно контекста: 1M
Макс. выход: 65,536 tokens
Дата обрезания знаний: 2025-04
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • 1M context at $0.25/M input — incredible value
  • 65K max output
  • 90% context caching savings

Минусы

  • Quality below 3.5 Flash for complex tasks
  • No fine-tuning
  • Newer model, less battle-tested

Производительность

Скорость вывода~130 tok/s
Ограничение скорости15,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
79.0%
HumanEval
74.5%

Gemini 2.5 Pro

Flagship

Complex reasoning, long context

Официальные цены

Когда использовать: Best value flagship model — 1M context at lower cost than GPT-4.1 or Claude Sonnet.

Ключевые улучшения

  • Cheapest flagship input: $1.25/M — 40% cheaper than GPT-4.1
  • 1M context window with 65K output — largest output among flagships
  • Context caching: $0.315/M — 75% savings for repeated prefixes
  • Free tier available — only flagship model with free access
  • MMLU: 85.4% — competitive with GPT-4.1 at half the cost
Цена входа
$1.25
per 1M tokens
Цена выхода
$10.00
per 1M tokens
Кэшированный вход
$0.315
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 1.0M
Макс. выход: 65,536 tokens
Дата обрезания знаний: 2025-01
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • 1M context window
  • Cheapest flagship input at $1.25
  • 65K max output

Минусы

  • No batch API
  • No fine-tuning
  • Higher output cost

Производительность

Скорость вывода~50 tok/s
Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
85.4%
SWE-bench Verified
63.8%
MATH
72.0%

Агенты, использующие эту модель

2

Gemini 2.5 Flash

Mid-tier

Fast, efficient generation

Официальные цены

Когда использовать: Incredible value for production apps — 1M context for $0.15/1M input tokens.

Ключевые улучшения

  • Same 1M context as Pro at 1/8th the input price ($0.15 vs $1.25/M)
  • 65K max output — identical to Pro tier for generation capacity
  • Context caching: $0.0375/M — 97% savings for cached prefixes
  • Free tier with generous rate limits — production-ready at zero cost
  • Sub-second latency — fastest Google model for real-time apps
Цена входа
$0.150
per 1M tokens
Цена выхода
$0.600
per 1M tokens
Кэшированный вход
$0.037
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 1.0M
Макс. выход: 65,536 tokens
Дата обрезания знаний: 2025-01
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Same 1M context as Pro at 1/8th price
  • 65K max output
  • Best cached input savings

Минусы

  • No batch API
  • Quality below Pro for hard tasks
  • No fine-tuning

Производительность

Скорость вывода~100 tok/s
Ограничение скорости10,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
83.0%
HumanEval
82.5%
MATH
68.0%

Агенты, использующие эту модель

4

Gemini 2.0 Flash

Lite

Ultra-fast, low cost

Официальные цены

Когда использовать: Best budget option for high-volume extraction, classification, and fine-tuned models.

Ключевые улучшения

  • Cheapest model with 1M context: $0.10/M input — lowest in market
  • Only lite model with fine-tuning + vision — full feature set
  • Context caching: $0.025/M — 97.5% savings for repeated prefixes
  • 8K max output is low — upgrade to 2.5 Flash for 65K output
  • Fine-tuning support — best for domain-specific classification models
Цена входа
$0.100
per 1M tokens
Цена выхода
$0.400
per 1M tokens
Кэшированный вход
$0.025
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 1.0M
Макс. выход: 8,192 tokens
Дата обрезания знаний: 2024-08
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Cheapest model in market with 1M context
  • Only lite model with fine-tuning + vision
  • Full feature set

Минусы

  • 8K max output is low
  • Older knowledge cutoff
  • Quality below 2.5 Flash

Производительность

Скорость вывода~140 tok/s
Ограничение скорости15,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
78.5%
HumanEval
75.0%
MATH
62.0%

Сравнение бок о бок

МодельУровеньВходВыходКонтекст
Gemini 3.1 ProFlagship$2.00$12.001M
Gemini 3.5 FlashMid-tier$1.50$9.001M
Gemini 3.1 Flash-LiteLite$0.250$1.501M
Gemini 2.5 ProFlagship$1.25$10.001.0M
Gemini 2.5 FlashMid-tier$0.150$0.6001.0M
Gemini 2.0 FlashLite$0.100$0.4001.0M