Mistral Modelos

Explore todos os 3 modelos de Mistral com preços detalhados, prós e contras e recomendações para desenvolvedores.

Modelos

$0.400

Menor Entrada

131K

Contexto Máximo

Níveis de Qualidade

Recomendações Rápidas

Melhor Custo-Benefício: Mistral Medium 3 ($0.400/1M)

Melhor Qualidade: Mistral Large 2

Mistral Large 2

Flagship

Multilingual, complex tasks

Preços Oficiais

Quando usar: Top pick for multilingual enterprise apps, especially EU-based deployments.

Destaques da Atualização

◆MMLU: 84.0% — competitive with GPT-4 class models
◆Fine-tuning available — customize for domain-specific tasks
◆EU-based (GDPR compliant) — only major flagship with EU sovereignty
◆12 languages optimized — best-in-class for French, German, Spanish
◆128K context is smaller vs 1M competitors — trade-off for EU compliance

Preço de Entrada

$2.00

per 1M tokens

Preço de Saída

$6.00

per 1M tokens

Entrada em Cache

—

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 131K

Saída Máxima: 8,192 tokens

Corte de Conhecimento: 2024-07

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Excellent multilingual (French, German, etc.)
Fine-tuning available
EU-based (GDPR friendly)

Contras

No vision
128K context is small vs competitors
No cached/batch pricing

Desempenho

Velocidade de saída~55 tok/s

Limite de taxa3,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU

84.0%

HumanEval

82.0%

MATH

65.0%

Mistral Medium 3

Mid-tier

Balanced multilingual

Preços Oficiais

Quando usar: Cost-effective multilingual + vision for European market applications.

Destaques da Atualização

◆Vision added at mid-tier — multimodal capability at $0.40/M input
◆5x cheaper than Mistral Large ($0.40 vs $2/M) for lighter tasks
◆EU-based infrastructure — GDPR compliant for European data
◆128K context — sufficient for most enterprise document processing
◆No fine-tuning — upgrade to Large 2 for custom model training

Preço de Entrada

$0.400

per 1M tokens

Preço de Saída

$2.00

per 1M tokens

Entrada em Cache

—

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 131K

Saída Máxima: 8,192 tokens

Corte de Conhecimento: 2024-07

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Vision at mid-tier price
Good multilingual balance
EU-based

Contras

No fine-tuning
No cached/batch pricing
Smaller context than competitors

Desempenho

Velocidade de saída~75 tok/s

Limite de taxa5,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU

80.5%

HumanEval

78.0%

Mixtral 8x22B

Mid-tier

Open-weight, high throughput

Preços Oficiais

Quando usar: For self-hosting or fine-tuning on domain-specific data with high throughput needs.

Destaques da Atualização

◆Open-weight MoE: 8x22B params, only 39B active per token — high throughput
◆Fine-tunable — full weight access for domain adaptation
◆Function calling + JSON mode — enterprise-ready tool integration
◆65K context — smaller than newer models but sufficient for most tasks
◆Self-hostable — no per-token cost when running on own infrastructure

Preço de Entrada

$0.900

per 1M tokens

Preço de Saída

$2.70

per 1M tokens

Entrada em Cache

—

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 66K

Saída Máxima: 4,096 tokens

Corte de Conhecimento: 2024-01

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Open-weight MoE architecture
Fine-tunable
High throughput via sparse activation

Contras

Only 65K context
No vision
Older knowledge cutoff (2024-01)

Desempenho

Velocidade de saída~85 tok/s

Limite de taxa—

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU

77.8%

HumanEval

75.5%

MATH

58.0%

Comparação Lado a Lado

Modelo	Nível	Entrada	Saída	Em Cache	Contexto	Saída Máxima
Mistral Large 2	Flagship	$2.00	$6.00	—	131K	8,192
Mistral Medium 3	Mid-tier	$0.400	$2.00	—	131K	8,192
Mixtral 8x22B	Mid-tier	$0.900	$2.70	—	66K	4,096