Alibaba Cloud Modelos

Explore todos os 11 modelos de Alibaba Cloud com preços detalhados, prós e contras e recomendações para desenvolvedores.

Modelos

$0.0000

Menor Entrada

Contexto Máximo

Níveis de Qualidade

Recomendações Rápidas

Melhor Custo-Benefício: Qwen-RobotWorld ($0.0000/1M)

Melhor Qualidade: Qwen3.7-Max

Qwen3.7-Max

Flagship

Fluxos de trabalho de agentes de longo horizonte, agentes de codificação, raciocínio complexo

Preços Oficiais

Quando usar: Cargas de trabalho de agente de fronteira que exigem longas execuções autônomas, tarefas complexas de codificação em várias etapas e análise de pesquisa aprofundada.

Destaques da Atualização

◆Contexto de 1M de tokens — elimina limites no trabalho de agente com muitos documentos
◆65K de saída máxima — geração massiva em uma única rodada
◆Otimização autônoma sustentada de kernel por 35 horas (1.158 chamadas de ferramentas)
◆SWE-Verified 80.4, LiveCodeBench 91.6 — rivaliza com Claude Opus 4.6
◆Compatível com APIs OpenAI + Anthropic — substituição direta

Preço de Entrada

$2.50

per 1M tokens

Preço de Saída

$7.50

per 1M tokens

Entrada em Cache

$0.250

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 1M

Saída Máxima: 65,536 tokens

Corte de Conhecimento: 2026-05

VisãoChamada de FunçãoAjuste FinoModo JSON

Prós

Janela de contexto de 1M para trabalho de agente com muitos documentos
65K de saída máxima — a mais longa da família Qwen
Compatibilidade entre harnesses (Claude Code, OpenClaw, Qwen Code)
Execução autônoma sustentada de 35 horas
Competitivo com Claude Opus 4.6 em benchmarks de codificação

Contras

Proprietário — sem pesos abertos ou auto-hospedagem
Custo mais alto que a linha Qwen 3.6
Sem suporte para visão
Acesso apenas via API

Desempenho

Velocidade de saída~55 tok/s

Limite de taxa2,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU-Pro

89.6%

LiveCodeBench

91.6%

SWE-Verified

80.4%

GPQA Diamond

92.4%

Agentes que usam este modelo

QoderWork Qoder Cloud Agents JVS Agent Suite

Qwen3.7-Plus

Mid-tier

Tarefas multimodais, implantação de agentes com boa relação custo-benefício

Preços Oficiais

Quando usar: Implantações multimodais com boa relação custo-benefício que exigem compreensão de vídeo e imagem junto com texto, com requisitos de contexto longo.

Destaques da Atualização

◆Entrada multimodal: texto + vídeo + imagem em um único modelo
◆Contexto de 1M a $0,40/1M — 6x mais barato que Qwen3.7-Max
◆Forte capacidade de agente a custo intermediário
◆API compatível com OpenAI

Preço de Entrada

$0.400

per 1M tokens

Preço de Saída

$1.60

per 1M tokens

Entrada em Cache

$0.100

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 1M

Saída Máxima: 16,384 tokens

Corte de Conhecimento: 2026-05

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Contexto de 1M a preço intermediário
Multimodal: entrada de texto, vídeo e imagem
Bom equilíbrio entre velocidade e capacidade
Proprietário, mas muito acessível

Contras

Proprietário — sem auto-hospedagem
Menos capaz que Qwen3.7-Max em raciocínio complexo
Saída máxima de 16K

Desempenho

Velocidade de saída~80 tok/s

Limite de taxa5,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU-Pro

84.2%

LiveCodeBench

78.5%

MMMU

72.1%

Qwen3-235B-A22B

Flagship

Raciocínio complexo, tarefas multilíngues

Preços Oficiais

Quando usar: Melhor custo-benefício para cargas de trabalho multilíngues, raciocínio complexo e implantações de produção sensíveis a custo.

Destaques da Atualização

◆Arquitetura MoE: 235B parâmetros, apenas 22B ativos — classe GPT-4 por 1/10 do preço
◆Contexto de 131K — lida com documentos longos e bases de código
◆Suporte a mais de 100 idiomas — melhor da classe para tarefas não-inglesas
◆Open-source: pesos completos no HuggingFace para auto-hospedagem
◆$0,40/$1,20 por 1M tokens — 90% mais barato que GPT-4o

Preço de Entrada

$0.400

per 1M tokens

Preço de Saída

$1.20

per 1M tokens

Entrada em Cache

$0.100

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 131K

Saída Máxima: 8,192 tokens

Corte de Conhecimento: 2025-04

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

MoE 235B total / 22B ativo — desempenho de ponta a baixo custo
Janela de contexto de 131K
Forte suporte multilíngue (100+ idiomas)
Pesos open-source disponíveis

Contras

Sem suporte para visão
Saída máxima de 8K tokens
Menos integração com ecossistema do que GPT-4

Desempenho

Velocidade de saída~70 tok/s

Limite de taxa5,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU

86.8%

LiveCodeBench

63.7%

IFEval

86.2%

Agentes que usam este modelo

Smolagents Dify

Qwen3-30B-A3B

Mid-tier

Inferência multilíngue eficiente

Preços Oficiais

Quando usar: Tarefas multilíngues de alto rendimento onde a eficiência de custo é mais importante.

Destaques da Atualização

◆Apenas 3B parâmetros ativos — roda em GPUs de consumo
◆Contexto de 131K a $0,15/1M de entrada — opção mais barata para contexto longo
◆Código aberto para personalização total
◆Chamada de função forte para fluxos de agente

Preço de Entrada

$0.150

per 1M tokens

Preço de Saída

$0.600

per 1M tokens

Entrada em Cache

$0.040

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 131K

Saída Máxima: 8,192 tokens

Corte de Conhecimento: 2025-04

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

MoE 30B total / 3B ativo — ultraeficiente
Contexto de 131K
Excelente relação custo-desempenho
Código aberto

Contras

Parâmetros ativos menores limitam raciocínio complexo
Sem visão
Saída máxima de 8K

Desempenho

Velocidade de saída~120 tok/s

Limite de taxa10,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU

78.5%

LiveCodeBench

48.2%

Qwen3-32B

Mid-tier

Desempenho equilibrado e custo

Preços Oficiais

Quando usar: Quando você precisa de desempenho confiável de modelo denso para codificação e tarefas gerais.

Destaques da Atualização

◆Arquitetura densa 32B — sem sobrecarga de roteamento MoE
◆Contexto de 131K para conteúdo longo
◆Codificação forte: LiveCodeBench 55,3%
◆Código aberto com suporte completo do HuggingFace

Preço de Entrada

$0.200

per 1M tokens

Preço de Saída

$0.600

per 1M tokens

Entrada em Cache

$0.050

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 131K

Saída Máxima: 8,192 tokens

Corte de Conhecimento: 2025-04

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Denso 32B — desempenho consistente
Contexto de 131K
Forte capacidade de codificação
Código aberto

Contras

Sem visão
Máximo de 8K de saída
Latência maior que variantes MoE

Desempenho

Velocidade de saída~65 tok/s

Limite de taxa5,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU

83.2%

LiveCodeBench

55.3%

Qwen3-14B

Lite

Tarefas gerais leves

Preços Oficiais

Quando usar: Opção econômica para sumarização, tradução e perguntas e respostas simples.

Destaques da Atualização

◆14B denso — cabe em uma única GPU
◆Contexto de 131K por apenas $0,10/1M de entrada
◆Bom o suficiente para a maioria das tarefas diárias
◆Código aberto para ajuste fino

Preço de Entrada

$0.100

per 1M tokens

Preço de Saída

$0.300

per 1M tokens

Entrada em Cache

$0.030

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 131K

Saída Máxima: 8,192 tokens

Corte de Conhecimento: 2025-04

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Modelo denso compacto de 14B
Contexto de 131K
Custo muito baixo
Código aberto

Contras

Raciocínio complexo limitado
Sem visão
Máximo de 8K de saída

Desempenho

Velocidade de saída~90 tok/s

Limite de taxa10,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU

77.1%

LiveCodeBench

42.8%

Qwen3-8B

Lite

Implantação em borda, tarefas simples

Preços Oficiais

Quando usar: Dispositivos de borda, implantação local ou processamento em lote de custo ultrabaixo.

Destaques da Atualização

◆8B parâmetros — roda em RTX 3060 ou equivalente
◆$0,05/1M de entrada — entre os mais baratos disponíveis
◆Contexto de 131K apesar do tamanho pequeno
◆Ideal para implantação local/offline

Preço de Entrada

$0.050

per 1M tokens

Preço de Saída

$0.150

per 1M tokens

Entrada em Cache

$0.010

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 131K

Saída Máxima: 8,192 tokens

Corte de Conhecimento: 2025-04

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Pequeno 8B — roda em GPUs de laptop
Contexto de 131K
Extremamente barato
Código aberto

Contras

Raciocínio básico apenas
Sem visão
Saída máxima de 8K

Desempenho

Velocidade de saída~150 tok/s

Limite de taxa20,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMLU

71.5%

LiveCodeBench

33.1%

Qwen-VL-Plus

Mid-tier

Compreensão multimodal, análise de documentos

Preços Oficiais

Quando usar: Análise de documentos, legendagem de imagens, Q&A visual e pipelines RAG multimodais.

Destaques da Atualização

◆Multimodal nativo — processa imagens e texto juntos
◆Contexto de 131K lida com documentos de várias páginas
◆Forte OCR: compreensão de gráficos, tabelas e diagramas
◆VQA multilíngue em mais de 100 idiomas

Preço de Entrada

$0.200

per 1M tokens

Preço de Saída

$0.800

per 1M tokens

Entrada em Cache

$0.050

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 131K

Saída Máxima: 8,192 tokens

Corte de Conhecimento: 2025-04

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Modelo nativo de visão-linguagem
Contexto de 131K com imagens
Forte OCR de documentos e compreensão de gráficos
VQA multilíngue

Contras

Sem ajuste fino
Máximo de 8K de saída
Custo mais alto que Qwen3 apenas texto

Desempenho

Velocidade de saída~55 tok/s

Limite de taxa3,000 RPM

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Benchmarks

MMMU

68.2%

MathVista

62.5%

Qwen-RobotManip

Flagship

Manipulação robótica, controle de mão hábil

Preços Oficiais

Quando usar: Para tarefas de manipulação robótica: preensão, montagem e controle de mão hábil em ambientes de pesquisa e industriais.

Destaques da Atualização

◆Primeiro modelo VLA de manipulação Qwen-Robot
◆Mais de 38.100 horas de dados de treinamento de código aberto
◆Espaço de estado-ação unificado entre tipos de robôs
◆Controle incremental de pose do efetuador final no quadro da câmera
◆Parte do conjunto completo Qwen-Robot Suite (Manip + Nav + World)

Preço de Entrada

$0.0000

per 1M tokens

Preço de Saída

$0.0000

per 1M tokens

Entrada em Cache

—

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 0

Saída Máxima: 0 tokens

Corte de Conhecimento: 2026-06

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Modelo VLA para manipulação robótica precisa
Mais de 38.100 horas de treinamento com dados de código aberto
Suporte a múltiplos tipos de robôs via espaço de ação unificado
Código aberto sob Apache 2.0

Contras

Especializado em robótica — não é um LLM geral
Requer hardware de robô ou simulador para implantação
Sem capacidades de geração de texto
Muito novo — adoção limitada pela comunidade

Desempenho

Velocidade de saída—

Limite de taxa—

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Qwen-RobotNav

Flagship

Navegação de robôs, planejamento de caminhos, mobilidade autônoma

Preços Oficiais

Quando usar: Para navegação de robôs móveis: tarefas de seguir instruções, navegação por ponto, rastreamento de objetos e direção autônoma.

Destaques da Atualização

◆Modelo VLN: navegação visão-linguagem para agentes físicos
◆Unificou 4 tipos de tarefas: instrução, ponto/objetivo, rastreamento, direção
◆Codificação controlada de observação + interface de ferramentas
◆Código aberto: pesos completos para personalização
◆Parte do conjunto completo Qwen-Robot Suite (Manip + Nav + World)

Preço de Entrada

$0.0000

per 1M tokens

Preço de Saída

$0.0000

per 1M tokens

Entrada em Cache

—

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 0

Saída Máxima: 0 tokens

Corte de Conhecimento: 2026-06

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Modelo VLN unificando 4 tipos de tarefas de navegação
Codificação controlada de observação para consciência espacial 3D
Cobre instruções de seguimento, navegação por ponto/objetivo, rastreamento e direção
Código aberto sob Apache 2.0

Contras

Especializado apenas para navegação robótica
Requer hardware de robô ou simulador
Sem geração de texto
Muito novo — validação real limitada

Desempenho

Velocidade de saída—

Limite de taxa—

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Qwen-RobotWorld

Flagship

Previsão do mundo físico, planejamento de robôs

Preços Oficiais

Quando usar: Para planejamento de robôs e simulação de mundo: prever resultados de ações em cenários de manipulação, direção e navegação.

Destaques da Atualização

◆Modelo de mundo: prevê futuros fisicamente plausíveis
◆Multi-cena: funciona em manipulação, direção e navegação
◆Interface de ação em linguagem natural
◆Código aberto: pesos completos para pesquisa e implantação
◆Parte do Qwen-Robot Suite completo (Manip + Nav + World)

Preço de Entrada

$0.0000

per 1M tokens

Preço de Saída

$0.0000

per 1M tokens

Entrada em Cache

—

per 1M tokens

Entrada em Lote

—

per 1M tokens

Janela de Contexto: 0

Saída Máxima: 0 tokens

Corte de Conhecimento: 2026-06

VisãoChamada de FunçãoAjuste FinoModo JSONNível Gratuito

Prós

Modelo de mundo para prever futuros fisicamente plausíveis
Multi-cena: manipulação, direção e navegação
Interface de ação em linguagem natural para controle intuitivo
Código aberto sob Apache 2.0

Contras

Especializado apenas para simulação de mundo
Sem geração de texto ou controle de robô
Requer integração com Manip/Nav para pilha completa
Muito novo — benchmarks limitados disponíveis

Desempenho

Velocidade de saída—

Limite de taxa—

Multimodal

Entrada de imagemSaída de imagemEntrada de áudioSaída de áudio

Comparação Lado a Lado

Modelo	Nível	Entrada	Saída	Em Cache	Contexto	Saída Máxima
Qwen3.7-Max	Flagship	$2.50	$7.50	$0.250	1M	65,536
Qwen3.7-Plus	Mid-tier	$0.400	$1.60	$0.100	1M	16,384
Qwen3-235B-A22B	Flagship	$0.400	$1.20	$0.100	131K	8,192
Qwen3-30B-A3B	Mid-tier	$0.150	$0.600	$0.040	131K	8,192
Qwen3-32B	Mid-tier	$0.200	$0.600	$0.050	131K	8,192
Qwen3-14B	Lite	$0.100	$0.300	$0.030	131K	8,192
Qwen3-8B	Lite	$0.050	$0.150	$0.010	131K	8,192
Qwen-VL-Plus	Mid-tier	$0.200	$0.800	$0.050	131K	8,192
Qwen-RobotManip	Flagship	$0.0000	$0.0000	—	0	0
Qwen-RobotNav	Flagship	$0.0000	$0.0000	—	0	0
Qwen-RobotWorld	Flagship	$0.0000	$0.0000	—	0	0