Meta Modelos

Explore todos os 2 modelos de Meta com preços detalhados, prós e contras e recomendações para desenvolvedores.

Modelos

$0.100

Menor Entrada

10M

Contexto Máximo

Níveis de Qualidade

Recomendações Rápidas

Melhor Custo-Benefício: Llama 4 Scout ($0.100/1M)

Melhor Qualidade: Llama 4 Maverick

Llama 4 Maverick

Flagship

Open-source, multimodal

Preços Oficiais

Quando usar: For teams wanting open-source control or self-hosting with multimodal needs.

Destaques da Atualização

◆Open-source — self-host for free, full model weight control
◆1M context window — first open-source model with this capacity
◆Multimodal (text + vision) + fine-tunable — unique combination
◆17B active params (109B total) — MoE architecture for efficiency
◆4K max output is limiting — use for input-heavy, short-output tasks

Preço de Entrada

$0.200

per 1M tokens

Preço de Saída

$0.600

per 1M tokens

Entrada em Cache

—

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 1M

Saída Máxima: 4,096 tokens

Corte de Conhecimento: 2024-08

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Open-source — can self-host for free
1M context window
Multimodal + fine-tunable

Contras

Only 4K max output
No JSON mode
Hosted pricing via third-party (Together AI)

Desempenho

Velocidade de saída~80 tok/s

Limite de taxa—

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU

84.5%

HumanEval

83.0%

SWE-bench Verified

44.2%

Llama 4 Scout

Mid-tier

Open-source, long context

Preços Oficiais

Quando usar: Unmatched for processing very long documents. Best for RAG with massive context windows.

Destaques da Atualização

◆10M token context — 10x larger than any other model available
◆Open-source + fine-tunable — self-host for unlimited usage
◆$0.10/M input — cheapest per-token model in the market
◆17B active params (109B total) — same efficient MoE as Maverick
◆4K max output — designed for retrieval/analysis, not long generation

Preço de Entrada

$0.100

per 1M tokens

Preço de Saída

$0.300

per 1M tokens

Entrada em Cache

—

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 10M

Saída Máxima: 4,096 tokens

Corte de Conhecimento: 2024-08

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

10M token context — largest available
Cheapest per-token model
Open-source + fine-tunable

Contras

Only 4K max output
No JSON mode
Quality below proprietary flagships

Desempenho

Velocidade de saída~90 tok/s

Limite de taxa—

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU

81.0%

HumanEval

78.5%

Comparação Lado a Lado

Modelo	Nível	Entrada	Saída	Em Cache	Contexto	Saída Máxima
Llama 4 Maverick	Flagship	$0.200	$0.600	—	1M	4,096
Llama 4 Scout	Mid-tier	$0.100	$0.300	—	10M	4,096