Voltar à Zona do DesenvolvedorPreços Oficiais Preços Oficiais
Cohere Modelos
Explore todos os 2 modelos de Cohere com preços detalhados, prós e contras e recomendações para desenvolvedores.
2
Modelos
$1.00
Menor Entrada
256K
Contexto Máximo
2
Níveis de Qualidade
Recomendações Rápidas
Melhor Custo-Benefício: Command A ($1.00/1M)
Melhor Qualidade: Command A
Command A
FlagshipTool use, RAG, agents
Quando usar: Best Cohere model for enterprise tool use, RAG, and multilingual agent workloads.
Destaques da Atualização
- ◆111B params — Cohere's largest and most capable model
- ◆256K context — 2x Command R+'s 128K for longer documents
- ◆150% higher throughput than Command R+ — faster production serving
- ◆23 languages supported — widest multilingual coverage at Cohere
- ◆Fine-tuning + function calling — purpose-built for enterprise agents
Preço de Entrada
$1.00
per 1M tokens
Preço de Saída
$2.00
per 1M tokens
Entrada em Cache
—
per 1M tokens
Entrada em Lote
—
per 1M tokens
Janela de Contexto: 256K
Saída Máxima: 8,000 tokens
Corte de Conhecimento: 2025-03
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito
Prós
- 111B params, 256K context
- 150% higher throughput than Command R+
- 23 languages supported
Contras
- No vision support
- Smaller context than competitors
- Limited benchmarks available
Desempenho
Velocidade de saída~60 tok/s
Limite de taxa3,000 RPM
Multimodal
Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio
Benchmarks
MMLU
82.0%
HumanEval
79.0%
Command R+
Mid-tierRAG, enterprise search
Quando usar: Specialized for enterprise RAG and search — use when retrieval quality is the priority.
Destaques da Atualização
- ◆Purpose-built for RAG pipelines — grounded generation with citations
- ◆Enterprise search optimization — best-in-class retrieval accuracy
- ◆Fine-tuning available — customize for domain-specific knowledge bases
- ◆4K max output is limiting — upgrade to Command A for 8K output
- ◆Expensive at $2.50/$10 — Command A offers more at $1/$2
Preço de Entrada
$2.50
per 1M tokens
Preço de Saída
$10.00
per 1M tokens
Entrada em Cache
—
per 1M tokens
Entrada em Lote
—
per 1M tokens
Janela de Contexto: 128K
Saída Máxima: 4,000 tokens
Corte de Conhecimento: 2024-08
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito
Prós
- Purpose-built for RAG pipelines
- Enterprise search optimization
- Fine-tuning available
Contras
- Only 4K max output
- No vision
- Expensive for mid-tier
Desempenho
Velocidade de saída~50 tok/s
Limite de taxa2,000 RPM
Multimodal
Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio
Benchmarks
MMLU
78.0%
HumanEval
73.0%
Comparação Lado a Lado
| Modelo | Nível | Entrada | Saída | Contexto |
|---|---|---|---|---|
| Command A | Flagship | $1.00 | $2.00 | 256K |
| Command R+ | Mid-tier | $2.50 | $10.00 | 128K |