Voltar à Zona do DesenvolvedorPreços Oficiais Preços Oficiais
Meta Modelos
Explore todos os 2 modelos de Meta com preços detalhados, prós e contras e recomendações para desenvolvedores.
2
Modelos
$0.100
Menor Entrada
10M
Contexto Máximo
2
Níveis de Qualidade
Recomendações Rápidas
Melhor Custo-Benefício: Llama 4 Scout ($0.100/1M)
Melhor Qualidade: Llama 4 Maverick
Llama 4 Maverick
FlagshipOpen-source, multimodal
Quando usar: For teams wanting open-source control or self-hosting with multimodal needs.
Destaques da Atualização
- ◆Open-source — self-host for free, full model weight control
- ◆1M context window — first open-source model with this capacity
- ◆Multimodal (text + vision) + fine-tunable — unique combination
- ◆17B active params (109B total) — MoE architecture for efficiency
- ◆4K max output is limiting — use for input-heavy, short-output tasks
Preço de Entrada
$0.200
per 1M tokens
Preço de Saída
$0.600
per 1M tokens
Entrada em Cache
—
per 1M tokens
Entrada em Lote
—
per 1M tokens
Janela de Contexto: 1M
Saída Máxima: 4,096 tokens
Corte de Conhecimento: 2024-08
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito
Prós
- Open-source — can self-host for free
- 1M context window
- Multimodal + fine-tunable
Contras
- Only 4K max output
- No JSON mode
- Hosted pricing via third-party (Together AI)
Desempenho
Velocidade de saída~80 tok/s
Limite de taxa—
Multimodal
Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio
Benchmarks
MMLU
84.5%
HumanEval
83.0%
SWE-bench Verified
44.2%
Llama 4 Scout
Mid-tierOpen-source, long context
Quando usar: Unmatched for processing very long documents. Best for RAG with massive context windows.
Destaques da Atualização
- ◆10M token context — 10x larger than any other model available
- ◆Open-source + fine-tunable — self-host for unlimited usage
- ◆$0.10/M input — cheapest per-token model in the market
- ◆17B active params (109B total) — same efficient MoE as Maverick
- ◆4K max output — designed for retrieval/analysis, not long generation
Preço de Entrada
$0.100
per 1M tokens
Preço de Saída
$0.300
per 1M tokens
Entrada em Cache
—
per 1M tokens
Entrada em Lote
—
per 1M tokens
Janela de Contexto: 10M
Saída Máxima: 4,096 tokens
Corte de Conhecimento: 2024-08
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito
Prós
- 10M token context — largest available
- Cheapest per-token model
- Open-source + fine-tunable
Contras
- Only 4K max output
- No JSON mode
- Quality below proprietary flagships
Desempenho
Velocidade de saída~90 tok/s
Limite de taxa—
Multimodal
Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio
Benchmarks
MMLU
81.0%
HumanEval
78.5%
Comparação Lado a Lado
| Modelo | Nível | Entrada | Saída | Contexto |
|---|---|---|---|---|
| Llama 4 Maverick | Flagship | $0.200 | $0.600 | 1M |
| Llama 4 Scout | Mid-tier | $0.100 | $0.300 | 10M |