Назад в зону разработчикаОфициальные цены Официальные цены Официальные цены
xAI Модели
Изучите все 3 моделей от xAI с подробными ценами, плюсами и минусами, а также рекомендациями для разработчиков.
3
Модели
$0.200
Самая низкая входная цена
2M
Макс. контекст
2
Уровни качества
Быстрые рекомендации
Лучшее соотношение цены и качества: Grok 4.1 Fast ($0.200/1M)
Лучшее качество: Grok 4.3
Grok 4.3
FlagshipGeneral-purpose, max capability
Когда использовать: Best xAI model for general-purpose applications requiring real-time knowledge access.
Ключевые улучшения
- ◆1M context window — 8x increase over Grok 3's 128K
- ◆Price: $1.25/$2.50 — 60% cheaper than Grok 3 ($3/$15)
- ◆Real-time web + X (Twitter) search — unique live knowledge access
- ◆Context caching: $0.20/M — 84% savings for repeated prefixes
- ◆32K max output — 4x Grok 3's 8K for long-form generation
Цена входа
$1.25
per 1M tokens
Цена выхода
$2.50
per 1M tokens
Кэшированный вход
$0.200
per 1M tokens
Пакетный вход
—
per 1M tokens
Окно контекста: 1M
Макс. выход: 32,000 tokens
Дата обрезания знаний: 2025-06
ЗрениеВызов функцийТонкая настройкаРежим JSON
Плюсы
- 1M context window at $1.25/M input
- Most intelligent xAI model
- Real-time web and X search
Минусы
- No batch API
- No fine-tuning
- Newer ecosystem
Производительность
Скорость вывода~65 tok/s
Ограничение скорости3,000 RPM
Мультимодальность
Ввод изображенияВывод изображенияВвод аудиоВывод аудио
Бенчмарки
MMLU
87.5%
SWE-bench Verified
62.0%
GPQA
73.0%
Grok 4.1 Fast
Mid-tierCost-optimized production workloads
Когда использовать: Best for latency-sensitive production apps and long-document processing on a budget.
Ключевые улучшения
- ◆2M context window — largest among all mid-tier models
- ◆$0.20/M input — 6x cheaper than Grok 4.3 for high-volume tasks
- ◆Ultra-low latency — optimized for sub-500ms response times
- ◆16K max output — 2x Grok 3's 8K for longer generations
- ◆Context caching: $0.05/M — 75% savings for repeated prefixes
Цена входа
$0.200
per 1M tokens
Цена выхода
$0.500
per 1M tokens
Кэшированный вход
$0.050
per 1M tokens
Пакетный вход
—
per 1M tokens
Окно контекста: 2M
Макс. выход: 16,000 tokens
Дата обрезания знаний: 2025-04
ЗрениеВызов функцийТонкая настройкаРежим JSON
Плюсы
- 2M context window — largest among mid-tier
- Extremely fast response times
- One of lowest rates for frontier APIs
Минусы
- Lower quality than Grok 4.3
- No batch API
- No fine-tuning
Производительность
Скорость вывода~110 tok/s
Ограничение скорости8,000 RPM
Мультимодальность
Ввод изображенияВывод изображенияВвод аудиоВывод аудио
Бенчмарки
MMLU
83.0%
HumanEval
80.0%
Grok 3
FlagshipReal-time info, analysis
Когда использовать: When real-time X/Twitter data or very current knowledge is essential.
Ключевые улучшения
- ◆Real-time X/Twitter integration — unique live social media knowledge
- ◆Knowledge cutoff: 2025-02 — one of the most current available
- ◆Vision + function calling — full multimodal capability at launch
- ◆No caching or batch API — upgrade to Grok 4.3 for caching support
- ◆128K context — superseded by Grok 4.3's 1M for long-document tasks
Цена входа
$3.00
per 1M tokens
Цена выхода
$15.00
per 1M tokens
Кэшированный вход
—
per 1M tokens
Пакетный вход
—
per 1M tokens
Окно контекста: 131K
Макс. выход: 8,192 tokens
Дата обрезания знаний: 2025-02
ЗрениеВызов функцийТонкая настройкаРежим JSON
Плюсы
- Very recent knowledge cutoff
- Real-time X/Twitter integration
- Vision + function calling
Минусы
- Expensive ($3/$15)
- No caching or batch
- No fine-tuning
Производительность
Скорость вывода~55 tok/s
Ограничение скорости2,000 RPM
Мультимодальность
Ввод изображенияВывод изображенияВвод аудиоВывод аудио
Бенчмарки
MMLU
85.0%
GPQA
68.0%
MATH
70.0%
Сравнение бок о бок
| Модель | Уровень | Вход | Выход | Контекст |
|---|---|---|---|---|
| Grok 4.3 | Flagship | $1.25 | $2.50 | 1M |
| Grok 4.1 Fast | Mid-tier | $0.200 | $0.500 | 2M |
| Grok 3 | Flagship | $3.00 | $15.00 | 131K |