Voltar à Zona do Desenvolvedor

Mistral Modelos

Explore todos os 3 modelos de Mistral com preços detalhados, prós e contras e recomendações para desenvolvedores.

3
Modelos
$0.400
Menor Entrada
131K
Contexto Máximo
2
Níveis de Qualidade

Recomendações Rápidas

Melhor Custo-Benefício: Mistral Medium 3 ($0.400/1M)
Melhor Qualidade: Mistral Large 2

Mistral Large 2

Flagship

Multilingual, complex tasks

Preços Oficiais

Quando usar: Top pick for multilingual enterprise apps, especially EU-based deployments.

Destaques da Atualização

  • MMLU: 84.0% — competitive with GPT-4 class models
  • Fine-tuning available — customize for domain-specific tasks
  • EU-based (GDPR compliant) — only major flagship with EU sovereignty
  • 12 languages optimized — best-in-class for French, German, Spanish
  • 128K context is smaller vs 1M competitors — trade-off for EU compliance
Preço de Entrada
$2.00
per 1M tokens
Preço de Saída
$6.00
per 1M tokens
Entrada em Cache
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 131K
Saída Máxima: 8,192 tokens
Corte de Conhecimento: 2024-07
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Excellent multilingual (French, German, etc.)
  • Fine-tuning available
  • EU-based (GDPR friendly)

Contras

  • No vision
  • 128K context is small vs competitors
  • No cached/batch pricing

Desempenho

Velocidade de saída~55 tok/s
Limite de taxa3,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU
84.0%
HumanEval
82.0%
MATH
65.0%

Mistral Medium 3

Mid-tier

Balanced multilingual

Preços Oficiais

Quando usar: Cost-effective multilingual + vision for European market applications.

Destaques da Atualização

  • Vision added at mid-tier — multimodal capability at $0.40/M input
  • 5x cheaper than Mistral Large ($0.40 vs $2/M) for lighter tasks
  • EU-based infrastructure — GDPR compliant for European data
  • 128K context — sufficient for most enterprise document processing
  • No fine-tuning — upgrade to Large 2 for custom model training
Preço de Entrada
$0.400
per 1M tokens
Preço de Saída
$2.00
per 1M tokens
Entrada em Cache
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 131K
Saída Máxima: 8,192 tokens
Corte de Conhecimento: 2024-07
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Vision at mid-tier price
  • Good multilingual balance
  • EU-based

Contras

  • No fine-tuning
  • No cached/batch pricing
  • Smaller context than competitors

Desempenho

Velocidade de saída~75 tok/s
Limite de taxa5,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU
80.5%
HumanEval
78.0%

Mixtral 8x22B

Mid-tier

Open-weight, high throughput

Preços Oficiais

Quando usar: For self-hosting or fine-tuning on domain-specific data with high throughput needs.

Destaques da Atualização

  • Open-weight MoE: 8x22B params, only 39B active per token — high throughput
  • Fine-tunable — full weight access for domain adaptation
  • Function calling + JSON mode — enterprise-ready tool integration
  • 65K context — smaller than newer models but sufficient for most tasks
  • Self-hostable — no per-token cost when running on own infrastructure
Preço de Entrada
$0.900
per 1M tokens
Preço de Saída
$2.70
per 1M tokens
Entrada em Cache
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 66K
Saída Máxima: 4,096 tokens
Corte de Conhecimento: 2024-01
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Open-weight MoE architecture
  • Fine-tunable
  • High throughput via sparse activation

Contras

  • Only 65K context
  • No vision
  • Older knowledge cutoff (2024-01)

Desempenho

Velocidade de saída~85 tok/s
Limite de taxa

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU
77.8%
HumanEval
75.5%
MATH
58.0%

Comparação Lado a Lado

ModeloNívelEntradaSaídaContexto
Mistral Large 2Flagship$2.00$6.00131K
Mistral Medium 3Mid-tier$0.400$2.00131K
Mixtral 8x22BMid-tier$0.900$2.7066K