Alibaba Cloud Модели

Изучите все 11 моделей от Alibaba Cloud с подробными ценами, плюсами и минусами, а также рекомендациями для разработчиков.

Модели

$0.0000

Самая низкая входная цена

Макс. контекст

Уровни качества

Быстрые рекомендации

Лучшее соотношение цены и качества: Qwen-RobotWorld ($0.0000/1M)

Лучшее качество: Qwen3.7-Max

Qwen3.7-Max

Flagship

Долгосрочные агентные рабочие процессы, агенты кодирования, сложные рассуждения

Официальные цены

Когда использовать: Передовые агентные рабочие нагрузки, требующие длительных автономных запусков, сложных многошаговых задач кодирования и глубокого исследовательского анализа.

Ключевые улучшения

◆Контекст 1M токенов — снимает ограничения на работу с документами агентов
◆Максимальный вывод 65K — массивная одношаговая генерация
◆Автономная оптимизация ядра в течение 35 часов (1158 вызовов инструментов)
◆SWE-Verified 80.4, LiveCodeBench 91.6 — соперничает с Claude Opus 4.6
◆Совместимость с API OpenAI + Anthropic — замена без изменений

Цена входа

$2.50

per 1M tokens

Цена выхода

$7.50

per 1M tokens

Кэшированный вход

$0.250

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 1M

Макс. выход: 65,536 tokens

Дата обрезания знаний: 2026-05

ЗрениеВызов функцийТонкая настройкаРежим JSON

Плюсы

Окно контекста 1M для работы с документами агентов
Максимальный вывод 65K — самый длинный в семействе Qwen
Совместимость с несколькими платформами (Claude Code, OpenClaw, Qwen Code)
Автономное выполнение в течение 35 часов
Конкурентоспособен с Claude Opus 4.6 по бенчмаркам кодирования

Минусы

Проприетарный — нет открытых весов или самостоятельного хостинга
Более высокая стоимость, чем у линейки Qwen 3.6
Отсутствие поддержки зрения
Доступ только через API

Производительность

Скорость вывода~55 tok/s

Ограничение скорости2,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU-Pro

89.6%

LiveCodeBench

91.6%

SWE-Verified

80.4%

GPQA Diamond

92.4%

Агенты, использующие эту модель

QoderWork Qoder Cloud Agents JVS Agent Suite

Qwen3.7-Plus

Mid-tier

Мультимодальные задачи, экономичное развертывание агентов

Официальные цены

Когда использовать: Экономичные мультимодальные развертывания, требующие понимания видео и изображений вместе с текстом, с длинными контекстными требованиями.

Ключевые улучшения

◆Мультимодальный ввод: текст + видео + изображение в одной модели
◆1M контекст за $0.40/1M — в 6 раз дешевле, чем Qwen3.7-Max
◆Сильная способность агента по средней цене
◆API, совместимый с OpenAI

Цена входа

$0.400

per 1M tokens

Цена выхода

$1.60

per 1M tokens

Кэшированный вход

$0.100

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 1M

Макс. выход: 16,384 tokens

Дата обрезания знаний: 2026-05

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

1M контекст по средней цене
Мультимодальность: ввод текста, видео и изображений
Сильный баланс скорости и возможностей
Проприетарный, но очень доступный

Минусы

Проприетарный — нет самостоятельного хостинга
Менее способен, чем Qwen3.7-Max в сложных рассуждениях
Максимальный вывод 16K

Производительность

Скорость вывода~80 tok/s

Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU-Pro

84.2%

LiveCodeBench

78.5%

MMMU

72.1%

Qwen3-235B-A22B

Flagship

Сложные рассуждения, многоязычные задачи

Официальные цены

Когда использовать: Лучший флагман по соотношению цена/качество для многоязычных рабочих нагрузок, сложных рассуждений и чувствительных к стоимости производственных развертываний.

Ключевые улучшения

◆Архитектура MoE: 235B параметров, только 22B активных — класс GPT-4 по 1/10 цены
◆Контекст 131K — обрабатывает длинные документы и кодовые базы
◆Поддержка 100+ языков — лучший в своем классе для неанглийских задач
◆Открытый исходный код: полные веса на HuggingFace для самостоятельного хостинга
◆$0.40/$1.20 за 1M токенов — на 90% дешевле GPT-4o

Цена входа

$0.400

per 1M tokens

Цена выхода

$1.20

per 1M tokens

Кэшированный вход

$0.100

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 131K

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2025-04

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

MoE 235B всего / 22B активных — флагманская производительность по низкой цене
Окно контекста 131K
Сильная многоязычность (100+ языков)
Доступны веса с открытым исходным кодом

Минусы

Нет поддержки зрения
Максимальный вывод 8K токенов
Меньшая интеграция в экосистему, чем у GPT-4

Производительность

Скорость вывода~70 tok/s

Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

86.8%

LiveCodeBench

63.7%

IFEval

86.2%

Агенты, использующие эту модель

Smolagents Dify

Qwen3-30B-A3B

Mid-tier

Эффективный многоязычный вывод

Официальные цены

Когда использовать: Высокопроизводительные многоязычные задачи, где важна экономическая эффективность.

Ключевые улучшения

◆Всего 3B активных параметров — работает на потребительских GPU
◆131K контекст за $0.15/1M ввода — самый дешевый вариант с длинным контекстом
◆Открытый исходный код для полной настройки
◆Мощный вызов функций для рабочих процессов агентов

Цена входа

$0.150

per 1M tokens

Цена выхода

$0.600

per 1M tokens

Кэшированный вход

$0.040

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 131K

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2025-04

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

MoE 30B всего / 3B активных — сверхэффективно
131K контекст
Отличное соотношение цены и производительности
Открытый исходный код

Минусы

Меньшее количество активных параметров ограничивает сложные рассуждения
Нет зрения
Максимальный вывод 8K

Производительность

Скорость вывода~120 tok/s

Ограничение скорости10,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

78.5%

LiveCodeBench

48.2%

Qwen3-32B

Mid-tier

Сбалансированная производительность и стоимость

Официальные цены

Когда использовать: Когда вам нужна надежная производительность плотной модели для кодирования и общих задач.

Ключевые улучшения

◆Архитектура плотной 32B — без накладных расходов маршрутизации MoE
◆Контекст 131K для длинного контента
◆Сильное кодирование: LiveCodeBench 55,3%
◆Открытый исходный код с полной поддержкой HuggingFace

Цена входа

$0.200

per 1M tokens

Цена выхода

$0.600

per 1M tokens

Кэшированный вход

$0.050

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 131K

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2025-04

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Плотная 32B — стабильная производительность
Контекст 131K
Сильные навыки кодирования
Открытый исходный код

Минусы

Нет зрения
Максимальный вывод 8K
Более высокая задержка по сравнению с вариантами MoE

Производительность

Скорость вывода~65 tok/s

Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

83.2%

LiveCodeBench

55.3%

Qwen3-14B

Lite

Легкие общие задачи

Официальные цены

Когда использовать: Бюджетный вариант для суммаризации, перевода и простых вопросов-ответов.

Ключевые улучшения

◆14B плотная — помещается на одном GPU
◆Контекст 131K всего за $0.10/1M ввода
◆Достаточно хороша для большинства повседневных задач
◆Открытый исходный код для тонкой настройки

Цена входа

$0.100

per 1M tokens

Цена выхода

$0.300

per 1M tokens

Кэшированный вход

$0.030

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 131K

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2025-04

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Компактная плотная модель 14B
Контекст 131K
Очень низкая стоимость
Открытый исходный код

Минусы

Ограниченные сложные рассуждения
Нет зрения
Максимальный вывод 8K

Производительность

Скорость вывода~90 tok/s

Ограничение скорости10,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

77.1%

LiveCodeBench

42.8%

Qwen3-8B

Lite

Развертывание на периферии, простые задачи

Официальные цены

Когда использовать: Периферийные устройства, локальное развертывание или сверхдешевая пакетная обработка.

Ключевые улучшения

◆8B параметров — работает на RTX 3060 или аналогах
◆$0.05/1M ввод — один из самых дешевых
◆Контекст 131K несмотря на малый размер
◆Идеально для локального/офлайн развертывания

Цена входа

$0.050

per 1M tokens

Цена выхода

$0.150

per 1M tokens

Кэшированный вход

$0.010

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 131K

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2025-04

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Крошечная 8B — работает на ноутбучных GPU
Контекст 131K
Чрезвычайно дешево
Открытый исходный код

Минусы

Только базовые рассуждения
Нет зрения
Максимальный вывод 8K

Производительность

Скорость вывода~150 tok/s

Ограничение скорости20,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

71.5%

LiveCodeBench

33.1%

Qwen-VL-Plus

Mid-tier

Мультимодальное понимание, анализ документов

Официальные цены

Когда использовать: Анализ документов, создание подписей к изображениям, визуальные вопросы и ответы, а также мультимодальные конвейеры RAG.

Ключевые улучшения

◆Нативная мультимодальность — обрабатывает изображения и текст вместе
◆131K контекст обрабатывает многостраничные документы
◆Сильное OCR: понимание диаграмм, таблиц и схем
◆Многоязычный VQA на более чем 100 языках

Цена входа

$0.200

per 1M tokens

Цена выхода

$0.800

per 1M tokens

Кэшированный вход

$0.050

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 131K

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2025-04

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Нативная модель зрения-языка
131K контекст с изображениями
Сильное понимание OCR документов и диаграмм
Многоязычный VQA

Минусы

Нет тонкой настройки
Максимум 8K вывода
Более высокая стоимость, чем текстовый Qwen3

Производительность

Скорость вывода~55 tok/s

Ограничение скорости3,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMMU

68.2%

MathVista

62.5%

Qwen-RobotManip

Flagship

Роботизированное манипулирование, управление ловкими руками

Официальные цены

Когда использовать: Для задач роботизированного манипулирования: захват, сборка и управление ловкими руками в исследовательских и промышленных условиях.

Ключевые улучшения

◆Первая модель манипулирования VLA Qwen-Robot
◆38,100+ часов обучающих данных с открытым исходным кодом
◆Единое пространство состояний-действий для разных типов роботов
◆Инкрементальное управление позой конечного эффектора в кадре камеры
◆Часть полного набора Qwen-Robot Suite (Манипуляция + Навигация + Мир)

Цена входа

$0.0000

per 1M tokens

Цена выхода

$0.0000

per 1M tokens

Кэшированный вход

—

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 0

Макс. выход: 0 tokens

Дата обрезания знаний: 2026-06

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Модель VLA для точного роботизированного манипулирования
38,100+ часов обучения на данных с открытым исходным кодом
Поддержка нескольких типов роботов через единое пространство действий
Открытый исходный код под лицензией Apache 2.0

Минусы

Специализирована для робототехники — не является общей LLM
Требует наличия роботизированного оборудования или симулятора для развертывания
Не имеет возможностей генерации текста
Очень новая — ограниченное принятие сообществом

Производительность

Скорость вывода—

Ограничение скорости—

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Qwen-RobotNav

Flagship

Навигация роботов, планирование маршрутов, автономное передвижение

Официальные цены

Когда использовать: Для навигации мобильных роботов: следование инструкциям, навигация по точкам, отслеживание объектов и задачи автономного вождения.

Ключевые улучшения

◆Модель VLN: визуально-языковая навигация для физических агентов
◆Объединяет 4 типа задач: инструкция, точка/цель, отслеживание, вождение
◆Контролируемое кодирование наблюдений + интерфейс инструментов
◆Открытый исходный код: полные веса для настройки
◆Часть полного набора Qwen-Robot Suite (Манипуляция + Навигация + Мир)

Цена входа

$0.0000

per 1M tokens

Цена выхода

$0.0000

per 1M tokens

Кэшированный вход

—

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 0

Макс. выход: 0 tokens

Дата обрезания знаний: 2026-06

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Модель VLN, объединяющая 4 типа задач навигации
Контролируемое кодирование наблюдений для 3D-пространственного восприятия
Охватывает следование инструкциям, навигацию по точкам/целям, отслеживание, вождение
Открытый исходный код под лицензией Apache 2.0

Минусы

Специализирована только для навигации роботов
Требует аппаратного обеспечения робота или симулятора
Не генерирует текст
Очень новая — ограниченная проверка в реальных условиях

Производительность

Скорость вывода—

Ограничение скорости—

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Qwen-RobotWorld

Flagship

Прогнозирование физического мира, планирование роботов

Официальные цены

Когда использовать: Для планирования роботов и симуляции мира: прогнозирование результатов действий в сценариях манипуляции, вождения и навигации.

Ключевые улучшения

◆Мировая модель: прогнозирует физически правдоподобные будущие состояния
◆Кросс-сценарный: работает в манипуляции, вождении, навигации
◆Интерфейс действий на естественном языке
◆Открытый исходный код: полные веса для исследований и развертывания
◆Часть полного набора Qwen-Robot Suite (Manip + Nav + World)

Цена входа

$0.0000

per 1M tokens

Цена выхода

$0.0000

per 1M tokens

Кэшированный вход

—

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 0

Макс. выход: 0 tokens

Дата обрезания знаний: 2026-06

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Мировая модель для прогнозирования физически правдоподобных будущих состояний
Кросс-сценарный: манипуляции, вождение и навигация
Интерфейс действий на естественном языке для интуитивного управления
Открытый исходный код под лицензией Apache 2.0

Минусы

Специализирован только для симуляции мира
Нет генерации текста или управления роботом
Требует интеграции с Manip/Nav для полного стека
Очень новый — доступно ограниченное количество бенчмарков

Производительность

Скорость вывода—

Ограничение скорости—

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Сравнение бок о бок

Модель	Уровень	Вход	Выход	Кэш	Контекст	Макс. выход
Qwen3.7-Max	Flagship	$2.50	$7.50	$0.250	1M	65,536
Qwen3.7-Plus	Mid-tier	$0.400	$1.60	$0.100	1M	16,384
Qwen3-235B-A22B	Flagship	$0.400	$1.20	$0.100	131K	8,192
Qwen3-30B-A3B	Mid-tier	$0.150	$0.600	$0.040	131K	8,192
Qwen3-32B	Mid-tier	$0.200	$0.600	$0.050	131K	8,192
Qwen3-14B	Lite	$0.100	$0.300	$0.030	131K	8,192
Qwen3-8B	Lite	$0.050	$0.150	$0.010	131K	8,192
Qwen-VL-Plus	Mid-tier	$0.200	$0.800	$0.050	131K	8,192
Qwen-RobotManip	Flagship	$0.0000	$0.0000	—	0	0
Qwen-RobotNav	Flagship	$0.0000	$0.0000	—	0	0
Qwen-RobotWorld	Flagship	$0.0000	$0.0000	—	0	0