Voltar à Zona do Desenvolvedor

Alibaba Cloud Modelos

Explore todos os 11 modelos de Alibaba Cloud com preços detalhados, prós e contras e recomendações para desenvolvedores.

11
Modelos
$0.0000
Menor Entrada
1M
Contexto Máximo
3
Níveis de Qualidade

Recomendações Rápidas

Melhor Custo-Benefício: Qwen-RobotWorld ($0.0000/1M)
Melhor Qualidade: Qwen3.7-Max

Qwen3.7-Max

Flagship

Fluxos de trabalho de agentes de longo horizonte, agentes de codificação, raciocínio complexo

Preços Oficiais

Quando usar: Cargas de trabalho de agente de fronteira que exigem longas execuções autônomas, tarefas complexas de codificação em várias etapas e análise de pesquisa aprofundada.

Destaques da Atualização

  • Contexto de 1M de tokens — elimina limites no trabalho de agente com muitos documentos
  • 65K de saída máxima — geração massiva em uma única rodada
  • Otimização autônoma sustentada de kernel por 35 horas (1.158 chamadas de ferramentas)
  • SWE-Verified 80.4, LiveCodeBench 91.6 — rivaliza com Claude Opus 4.6
  • Compatível com APIs OpenAI + Anthropic — substituição direta
Preço de Entrada
$2.50
per 1M tokens
Preço de Saída
$7.50
per 1M tokens
Entrada em Cache
$0.250
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 1M
Saída Máxima: 65,536 tokens
Corte de Conhecimento: 2026-05
VisãoChamada de FunçãoAjuste FinoModo JSON

Prós

  • Janela de contexto de 1M para trabalho de agente com muitos documentos
  • 65K de saída máxima — a mais longa da família Qwen
  • Compatibilidade entre harnesses (Claude Code, OpenClaw, Qwen Code)
  • Execução autônoma sustentada de 35 horas
  • Competitivo com Claude Opus 4.6 em benchmarks de codificação

Contras

  • Proprietário — sem pesos abertos ou auto-hospedagem
  • Custo mais alto que a linha Qwen 3.6
  • Sem suporte para visão
  • Acesso apenas via API

Desempenho

Velocidade de saída~55 tok/s
Limite de taxa2,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU-Pro
89.6%
LiveCodeBench
91.6%
SWE-Verified
80.4%
GPQA Diamond
92.4%

Agentes que usam este modelo

3

Qwen3.7-Plus

Mid-tier

Tarefas multimodais, implantação de agentes com boa relação custo-benefício

Preços Oficiais

Quando usar: Implantações multimodais com boa relação custo-benefício que exigem compreensão de vídeo e imagem junto com texto, com requisitos de contexto longo.

Destaques da Atualização

  • Entrada multimodal: texto + vídeo + imagem em um único modelo
  • Contexto de 1M a $0,40/1M — 6x mais barato que Qwen3.7-Max
  • Forte capacidade de agente a custo intermediário
  • API compatível com OpenAI
Preço de Entrada
$0.400
per 1M tokens
Preço de Saída
$1.60
per 1M tokens
Entrada em Cache
$0.100
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 1M
Saída Máxima: 16,384 tokens
Corte de Conhecimento: 2026-05
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Contexto de 1M a preço intermediário
  • Multimodal: entrada de texto, vídeo e imagem
  • Bom equilíbrio entre velocidade e capacidade
  • Proprietário, mas muito acessível

Contras

  • Proprietário — sem auto-hospedagem
  • Menos capaz que Qwen3.7-Max em raciocínio complexo
  • Saída máxima de 16K

Desempenho

Velocidade de saída~80 tok/s
Limite de taxa5,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU-Pro
84.2%
LiveCodeBench
78.5%
MMMU
72.1%

Qwen3-235B-A22B

Flagship

Raciocínio complexo, tarefas multilíngues

Preços Oficiais

Quando usar: Melhor custo-benefício para cargas de trabalho multilíngues, raciocínio complexo e implantações de produção sensíveis a custo.

Destaques da Atualização

  • Arquitetura MoE: 235B parâmetros, apenas 22B ativos — classe GPT-4 por 1/10 do preço
  • Contexto de 131K — lida com documentos longos e bases de código
  • Suporte a mais de 100 idiomas — melhor da classe para tarefas não-inglesas
  • Open-source: pesos completos no HuggingFace para auto-hospedagem
  • $0,40/$1,20 por 1M tokens — 90% mais barato que GPT-4o
Preço de Entrada
$0.400
per 1M tokens
Preço de Saída
$1.20
per 1M tokens
Entrada em Cache
$0.100
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 131K
Saída Máxima: 8,192 tokens
Corte de Conhecimento: 2025-04
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • MoE 235B total / 22B ativo — desempenho de ponta a baixo custo
  • Janela de contexto de 131K
  • Forte suporte multilíngue (100+ idiomas)
  • Pesos open-source disponíveis

Contras

  • Sem suporte para visão
  • Saída máxima de 8K tokens
  • Menos integração com ecossistema do que GPT-4

Desempenho

Velocidade de saída~70 tok/s
Limite de taxa5,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU
86.8%
LiveCodeBench
63.7%
IFEval
86.2%

Agentes que usam este modelo

2

Qwen3-30B-A3B

Mid-tier

Inferência multilíngue eficiente

Preços Oficiais

Quando usar: Tarefas multilíngues de alto rendimento onde a eficiência de custo é mais importante.

Destaques da Atualização

  • Apenas 3B parâmetros ativos — roda em GPUs de consumo
  • Contexto de 131K a $0,15/1M de entrada — opção mais barata para contexto longo
  • Código aberto para personalização total
  • Chamada de função forte para fluxos de agente
Preço de Entrada
$0.150
per 1M tokens
Preço de Saída
$0.600
per 1M tokens
Entrada em Cache
$0.040
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 131K
Saída Máxima: 8,192 tokens
Corte de Conhecimento: 2025-04
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • MoE 30B total / 3B ativo — ultraeficiente
  • Contexto de 131K
  • Excelente relação custo-desempenho
  • Código aberto

Contras

  • Parâmetros ativos menores limitam raciocínio complexo
  • Sem visão
  • Saída máxima de 8K

Desempenho

Velocidade de saída~120 tok/s
Limite de taxa10,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU
78.5%
LiveCodeBench
48.2%

Qwen3-32B

Mid-tier

Desempenho equilibrado e custo

Preços Oficiais

Quando usar: Quando você precisa de desempenho confiável de modelo denso para codificação e tarefas gerais.

Destaques da Atualização

  • Arquitetura densa 32B — sem sobrecarga de roteamento MoE
  • Contexto de 131K para conteúdo longo
  • Codificação forte: LiveCodeBench 55,3%
  • Código aberto com suporte completo do HuggingFace
Preço de Entrada
$0.200
per 1M tokens
Preço de Saída
$0.600
per 1M tokens
Entrada em Cache
$0.050
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 131K
Saída Máxima: 8,192 tokens
Corte de Conhecimento: 2025-04
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Denso 32B — desempenho consistente
  • Contexto de 131K
  • Forte capacidade de codificação
  • Código aberto

Contras

  • Sem visão
  • Máximo de 8K de saída
  • Latência maior que variantes MoE

Desempenho

Velocidade de saída~65 tok/s
Limite de taxa5,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU
83.2%
LiveCodeBench
55.3%

Qwen3-14B

Lite

Tarefas gerais leves

Preços Oficiais

Quando usar: Opção econômica para sumarização, tradução e perguntas e respostas simples.

Destaques da Atualização

  • 14B denso — cabe em uma única GPU
  • Contexto de 131K por apenas $0,10/1M de entrada
  • Bom o suficiente para a maioria das tarefas diárias
  • Código aberto para ajuste fino
Preço de Entrada
$0.100
per 1M tokens
Preço de Saída
$0.300
per 1M tokens
Entrada em Cache
$0.030
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 131K
Saída Máxima: 8,192 tokens
Corte de Conhecimento: 2025-04
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Modelo denso compacto de 14B
  • Contexto de 131K
  • Custo muito baixo
  • Código aberto

Contras

  • Raciocínio complexo limitado
  • Sem visão
  • Máximo de 8K de saída

Desempenho

Velocidade de saída~90 tok/s
Limite de taxa10,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU
77.1%
LiveCodeBench
42.8%

Qwen3-8B

Lite

Implantação em borda, tarefas simples

Preços Oficiais

Quando usar: Dispositivos de borda, implantação local ou processamento em lote de custo ultrabaixo.

Destaques da Atualização

  • 8B parâmetros — roda em RTX 3060 ou equivalente
  • $0,05/1M de entrada — entre os mais baratos disponíveis
  • Contexto de 131K apesar do tamanho pequeno
  • Ideal para implantação local/offline
Preço de Entrada
$0.050
per 1M tokens
Preço de Saída
$0.150
per 1M tokens
Entrada em Cache
$0.010
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 131K
Saída Máxima: 8,192 tokens
Corte de Conhecimento: 2025-04
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Pequeno 8B — roda em GPUs de laptop
  • Contexto de 131K
  • Extremamente barato
  • Código aberto

Contras

  • Raciocínio básico apenas
  • Sem visão
  • Saída máxima de 8K

Desempenho

Velocidade de saída~150 tok/s
Limite de taxa20,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU
71.5%
LiveCodeBench
33.1%

Qwen-VL-Plus

Mid-tier

Compreensão multimodal, análise de documentos

Preços Oficiais

Quando usar: Análise de documentos, legendagem de imagens, Q&A visual e pipelines RAG multimodais.

Destaques da Atualização

  • Multimodal nativo — processa imagens e texto juntos
  • Contexto de 131K lida com documentos de várias páginas
  • Forte OCR: compreensão de gráficos, tabelas e diagramas
  • VQA multilíngue em mais de 100 idiomas
Preço de Entrada
$0.200
per 1M tokens
Preço de Saída
$0.800
per 1M tokens
Entrada em Cache
$0.050
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 131K
Saída Máxima: 8,192 tokens
Corte de Conhecimento: 2025-04
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Modelo nativo de visão-linguagem
  • Contexto de 131K com imagens
  • Forte OCR de documentos e compreensão de gráficos
  • VQA multilíngue

Contras

  • Sem ajuste fino
  • Máximo de 8K de saída
  • Custo mais alto que Qwen3 apenas texto

Desempenho

Velocidade de saída~55 tok/s
Limite de taxa3,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMMU
68.2%
MathVista
62.5%

Qwen-RobotManip

Flagship

Manipulação robótica, controle de mão hábil

Preços Oficiais

Quando usar: Para tarefas de manipulação robótica: preensão, montagem e controle de mão hábil em ambientes de pesquisa e industriais.

Destaques da Atualização

  • Primeiro modelo VLA de manipulação Qwen-Robot
  • Mais de 38.100 horas de dados de treinamento de código aberto
  • Espaço de estado-ação unificado entre tipos de robôs
  • Controle incremental de pose do efetuador final no quadro da câmera
  • Parte do conjunto completo Qwen-Robot Suite (Manip + Nav + World)
Preço de Entrada
$0.0000
per 1M tokens
Preço de Saída
$0.0000
per 1M tokens
Entrada em Cache
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 0
Saída Máxima: 0 tokens
Corte de Conhecimento: 2026-06
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Modelo VLA para manipulação robótica precisa
  • Mais de 38.100 horas de treinamento com dados de código aberto
  • Suporte a múltiplos tipos de robôs via espaço de ação unificado
  • Código aberto sob Apache 2.0

Contras

  • Especializado em robótica — não é um LLM geral
  • Requer hardware de robô ou simulador para implantação
  • Sem capacidades de geração de texto
  • Muito novo — adoção limitada pela comunidade

Desempenho

Velocidade de saída
Limite de taxa

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Qwen-RobotNav

Flagship

Navegação de robôs, planejamento de caminhos, mobilidade autônoma

Preços Oficiais

Quando usar: Para navegação de robôs móveis: tarefas de seguir instruções, navegação por ponto, rastreamento de objetos e direção autônoma.

Destaques da Atualização

  • Modelo VLN: navegação visão-linguagem para agentes físicos
  • Unificou 4 tipos de tarefas: instrução, ponto/objetivo, rastreamento, direção
  • Codificação controlada de observação + interface de ferramentas
  • Código aberto: pesos completos para personalização
  • Parte do conjunto completo Qwen-Robot Suite (Manip + Nav + World)
Preço de Entrada
$0.0000
per 1M tokens
Preço de Saída
$0.0000
per 1M tokens
Entrada em Cache
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 0
Saída Máxima: 0 tokens
Corte de Conhecimento: 2026-06
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Modelo VLN unificando 4 tipos de tarefas de navegação
  • Codificação controlada de observação para consciência espacial 3D
  • Cobre instruções de seguimento, navegação por ponto/objetivo, rastreamento e direção
  • Código aberto sob Apache 2.0

Contras

  • Especializado apenas para navegação robótica
  • Requer hardware de robô ou simulador
  • Sem geração de texto
  • Muito novo — validação real limitada

Desempenho

Velocidade de saída
Limite de taxa

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Qwen-RobotWorld

Flagship

Previsão do mundo físico, planejamento de robôs

Preços Oficiais

Quando usar: Para planejamento de robôs e simulação de mundo: prever resultados de ações em cenários de manipulação, direção e navegação.

Destaques da Atualização

  • Modelo de mundo: prevê futuros fisicamente plausíveis
  • Multi-cena: funciona em manipulação, direção e navegação
  • Interface de ação em linguagem natural
  • Código aberto: pesos completos para pesquisa e implantação
  • Parte do Qwen-Robot Suite completo (Manip + Nav + World)
Preço de Entrada
$0.0000
per 1M tokens
Preço de Saída
$0.0000
per 1M tokens
Entrada em Cache
per 1M tokens
Entrada em Lote
per 1M tokens
Janela de Contexto: 0
Saída Máxima: 0 tokens
Corte de Conhecimento: 2026-06
VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

  • Modelo de mundo para prever futuros fisicamente plausíveis
  • Multi-cena: manipulação, direção e navegação
  • Interface de ação em linguagem natural para controle intuitivo
  • Código aberto sob Apache 2.0

Contras

  • Especializado apenas para simulação de mundo
  • Sem geração de texto ou controle de robô
  • Requer integração com Manip/Nav para pilha completa
  • Muito novo — benchmarks limitados disponíveis

Desempenho

Velocidade de saída
Limite de taxa

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Comparação Lado a Lado

ModeloNívelEntradaSaídaContexto
Qwen3.7-MaxFlagship$2.50$7.501M
Qwen3.7-PlusMid-tier$0.400$1.601M
Qwen3-235B-A22BFlagship$0.400$1.20131K
Qwen3-30B-A3BMid-tier$0.150$0.600131K
Qwen3-32BMid-tier$0.200$0.600131K
Qwen3-14BLite$0.100$0.300131K
Qwen3-8BLite$0.050$0.150131K
Qwen-VL-PlusMid-tier$0.200$0.800131K
Qwen-RobotManipFlagship$0.0000$0.00000
Qwen-RobotNavFlagship$0.0000$0.00000
Qwen-RobotWorldFlagship$0.0000$0.00000