Meta Модели

Изучите все 2 моделей от Meta с подробными ценами, плюсами и минусами, а также рекомендациями для разработчиков.

Модели

$0.100

Самая низкая входная цена

10M

Макс. контекст

Уровни качества

Быстрые рекомендации

Лучшее соотношение цены и качества: Llama 4 Scout ($0.100/1M)

Лучшее качество: Llama 4 Maverick

Llama 4 Maverick

Flagship

Open-source, multimodal

Официальные цены

Когда использовать: For teams wanting open-source control or self-hosting with multimodal needs.

Ключевые улучшения

◆Open-source — self-host for free, full model weight control
◆1M context window — first open-source model with this capacity
◆Multimodal (text + vision) + fine-tunable — unique combination
◆17B active params (109B total) — MoE architecture for efficiency
◆4K max output is limiting — use for input-heavy, short-output tasks

Цена входа

$0.200

per 1M tokens

Цена выхода

$0.600

per 1M tokens

Кэшированный вход

—

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 1M

Макс. выход: 4,096 tokens

Дата обрезания знаний: 2024-08

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Open-source — can self-host for free
1M context window
Multimodal + fine-tunable

Минусы

Only 4K max output
No JSON mode
Hosted pricing via third-party (Together AI)

Производительность

Скорость вывода~80 tok/s

Ограничение скорости—

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

84.5%

HumanEval

83.0%

SWE-bench Verified

44.2%

Llama 4 Scout

Mid-tier

Open-source, long context

Официальные цены

Когда использовать: Unmatched for processing very long documents. Best for RAG with massive context windows.

Ключевые улучшения

◆10M token context — 10x larger than any other model available
◆Open-source + fine-tunable — self-host for unlimited usage
◆$0.10/M input — cheapest per-token model in the market
◆17B active params (109B total) — same efficient MoE as Maverick
◆4K max output — designed for retrieval/analysis, not long generation

Цена входа

$0.100

per 1M tokens

Цена выхода

$0.300

per 1M tokens

Кэшированный вход

—

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 10M

Макс. выход: 4,096 tokens

Дата обрезания знаний: 2024-08

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

10M token context — largest available
Cheapest per-token model
Open-source + fine-tunable

Минусы

Only 4K max output
No JSON mode
Quality below proprietary flagships

Производительность

Скорость вывода~90 tok/s

Ограничение скорости—

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

81.0%

HumanEval

78.5%

Сравнение бок о бок

Модель	Уровень	Вход	Выход	Кэш	Контекст	Макс. выход
Llama 4 Maverick	Flagship	$0.200	$0.600	—	1M	4,096
Llama 4 Scout	Mid-tier	$0.100	$0.300	—	10M	4,096