Voltar à Zona do Desenvolvedor

Meta Modelos

Explore todos os 2 modelos de Meta com preços detalhados, prós e contras e recomendações para desenvolvedores.

2
Modelos
$0.100
Menor Entrada
10M
Contexto Máximo
2
Níveis de Qualidade

Recomendações Rápidas

Melhor Custo-Benefício: Llama 4 Scout ($0.100/1M)
Melhor Qualidade: Llama 4 Maverick

Llama 4 Maverick

Flagship

Open-source, multimodal

Preços Oficiais

Quando usar: For teams wanting open-source control or self-hosting with multimodal needs.

Destaques da Atualização

  • Open-source — self-host for free, full model weight control
  • 1M context window — first open-source model with this capacity
  • Multimodal (text + vision) + fine-tunable — unique combination
  • 17B active params (109B total) — MoE architecture for efficiency
  • 4K max output is limiting — use for input-heavy, short-output tasks
Preço de Entrada
$0.200
per 1M tokens
Preço de Saída
$0.600
per 1M tokens
Entrada em Cache
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 1M
Saída Máxima: 4,096 tokens
Corte de Conhecimento: 2024-08
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Open-source — can self-host for free
  • 1M context window
  • Multimodal + fine-tunable

Contras

  • Only 4K max output
  • No JSON mode
  • Hosted pricing via third-party (Together AI)

Desempenho

Velocidade de saída~80 tok/s
Limite de taxa

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU
84.5%
HumanEval
83.0%
SWE-bench Verified
44.2%

Llama 4 Scout

Mid-tier

Open-source, long context

Preços Oficiais

Quando usar: Unmatched for processing very long documents. Best for RAG with massive context windows.

Destaques da Atualização

  • 10M token context — 10x larger than any other model available
  • Open-source + fine-tunable — self-host for unlimited usage
  • $0.10/M input — cheapest per-token model in the market
  • 17B active params (109B total) — same efficient MoE as Maverick
  • 4K max output — designed for retrieval/analysis, not long generation
Preço de Entrada
$0.100
per 1M tokens
Preço de Saída
$0.300
per 1M tokens
Entrada em Cache
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 10M
Saída Máxima: 4,096 tokens
Corte de Conhecimento: 2024-08
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • 10M token context — largest available
  • Cheapest per-token model
  • Open-source + fine-tunable

Contras

  • Only 4K max output
  • No JSON mode
  • Quality below proprietary flagships

Desempenho

Velocidade de saída~90 tok/s
Limite de taxa

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU
81.0%
HumanEval
78.5%

Comparação Lado a Lado

ModeloNívelEntradaSaídaContexto
Llama 4 MaverickFlagship$0.200$0.6001M
Llama 4 ScoutMid-tier$0.100$0.30010M