Назад в зону разработчика

Alibaba Cloud Модели

Изучите все 11 моделей от Alibaba Cloud с подробными ценами, плюсами и минусами, а также рекомендациями для разработчиков.

11
Модели
$0.0000
Самая низкая входная цена
1M
Макс. контекст
3
Уровни качества

Быстрые рекомендации

Лучшее соотношение цены и качества: Qwen-RobotWorld ($0.0000/1M)
Лучшее качество: Qwen3.7-Max

Qwen3.7-Max

Flagship

Долгосрочные агентные рабочие процессы, агенты кодирования, сложные рассуждения

Официальные цены

Когда использовать: Передовые агентные рабочие нагрузки, требующие длительных автономных запусков, сложных многошаговых задач кодирования и глубокого исследовательского анализа.

Ключевые улучшения

  • Контекст 1M токенов — снимает ограничения на работу с документами агентов
  • Максимальный вывод 65K — массивная одношаговая генерация
  • Автономная оптимизация ядра в течение 35 часов (1158 вызовов инструментов)
  • SWE-Verified 80.4, LiveCodeBench 91.6 — соперничает с Claude Opus 4.6
  • Совместимость с API OpenAI + Anthropic — замена без изменений
Цена входа
$2.50
per 1M tokens
Цена выхода
$7.50
per 1M tokens
Кэшированный вход
$0.250
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 1M
Макс. выход: 65,536 tokens
Дата обрезания знаний: 2026-05
ЗрениеВызов функцийТонкая настройкаРежим JSON

Плюсы

  • Окно контекста 1M для работы с документами агентов
  • Максимальный вывод 65K — самый длинный в семействе Qwen
  • Совместимость с несколькими платформами (Claude Code, OpenClaw, Qwen Code)
  • Автономное выполнение в течение 35 часов
  • Конкурентоспособен с Claude Opus 4.6 по бенчмаркам кодирования

Минусы

  • Проприетарный — нет открытых весов или самостоятельного хостинга
  • Более высокая стоимость, чем у линейки Qwen 3.6
  • Отсутствие поддержки зрения
  • Доступ только через API

Производительность

Скорость вывода~55 tok/s
Ограничение скорости2,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU-Pro
89.6%
LiveCodeBench
91.6%
SWE-Verified
80.4%
GPQA Diamond
92.4%

Агенты, использующие эту модель

3

Qwen3.7-Plus

Mid-tier

Мультимодальные задачи, экономичное развертывание агентов

Официальные цены

Когда использовать: Экономичные мультимодальные развертывания, требующие понимания видео и изображений вместе с текстом, с длинными контекстными требованиями.

Ключевые улучшения

  • Мультимодальный ввод: текст + видео + изображение в одной модели
  • 1M контекст за $0.40/1M — в 6 раз дешевле, чем Qwen3.7-Max
  • Сильная способность агента по средней цене
  • API, совместимый с OpenAI
Цена входа
$0.400
per 1M tokens
Цена выхода
$1.60
per 1M tokens
Кэшированный вход
$0.100
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 1M
Макс. выход: 16,384 tokens
Дата обрезания знаний: 2026-05
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • 1M контекст по средней цене
  • Мультимодальность: ввод текста, видео и изображений
  • Сильный баланс скорости и возможностей
  • Проприетарный, но очень доступный

Минусы

  • Проприетарный — нет самостоятельного хостинга
  • Менее способен, чем Qwen3.7-Max в сложных рассуждениях
  • Максимальный вывод 16K

Производительность

Скорость вывода~80 tok/s
Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU-Pro
84.2%
LiveCodeBench
78.5%
MMMU
72.1%

Qwen3-235B-A22B

Flagship

Сложные рассуждения, многоязычные задачи

Официальные цены

Когда использовать: Лучший флагман по соотношению цена/качество для многоязычных рабочих нагрузок, сложных рассуждений и чувствительных к стоимости производственных развертываний.

Ключевые улучшения

  • Архитектура MoE: 235B параметров, только 22B активных — класс GPT-4 по 1/10 цены
  • Контекст 131K — обрабатывает длинные документы и кодовые базы
  • Поддержка 100+ языков — лучший в своем классе для неанглийских задач
  • Открытый исходный код: полные веса на HuggingFace для самостоятельного хостинга
  • $0.40/$1.20 за 1M токенов — на 90% дешевле GPT-4o
Цена входа
$0.400
per 1M tokens
Цена выхода
$1.20
per 1M tokens
Кэшированный вход
$0.100
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 131K
Макс. выход: 8,192 tokens
Дата обрезания знаний: 2025-04
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • MoE 235B всего / 22B активных — флагманская производительность по низкой цене
  • Окно контекста 131K
  • Сильная многоязычность (100+ языков)
  • Доступны веса с открытым исходным кодом

Минусы

  • Нет поддержки зрения
  • Максимальный вывод 8K токенов
  • Меньшая интеграция в экосистему, чем у GPT-4

Производительность

Скорость вывода~70 tok/s
Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
86.8%
LiveCodeBench
63.7%
IFEval
86.2%

Агенты, использующие эту модель

2

Qwen3-30B-A3B

Mid-tier

Эффективный многоязычный вывод

Официальные цены

Когда использовать: Высокопроизводительные многоязычные задачи, где важна экономическая эффективность.

Ключевые улучшения

  • Всего 3B активных параметров — работает на потребительских GPU
  • 131K контекст за $0.15/1M ввода — самый дешевый вариант с длинным контекстом
  • Открытый исходный код для полной настройки
  • Мощный вызов функций для рабочих процессов агентов
Цена входа
$0.150
per 1M tokens
Цена выхода
$0.600
per 1M tokens
Кэшированный вход
$0.040
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 131K
Макс. выход: 8,192 tokens
Дата обрезания знаний: 2025-04
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • MoE 30B всего / 3B активных — сверхэффективно
  • 131K контекст
  • Отличное соотношение цены и производительности
  • Открытый исходный код

Минусы

  • Меньшее количество активных параметров ограничивает сложные рассуждения
  • Нет зрения
  • Максимальный вывод 8K

Производительность

Скорость вывода~120 tok/s
Ограничение скорости10,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
78.5%
LiveCodeBench
48.2%

Qwen3-32B

Mid-tier

Сбалансированная производительность и стоимость

Официальные цены

Когда использовать: Когда вам нужна надежная производительность плотной модели для кодирования и общих задач.

Ключевые улучшения

  • Архитектура плотной 32B — без накладных расходов маршрутизации MoE
  • Контекст 131K для длинного контента
  • Сильное кодирование: LiveCodeBench 55,3%
  • Открытый исходный код с полной поддержкой HuggingFace
Цена входа
$0.200
per 1M tokens
Цена выхода
$0.600
per 1M tokens
Кэшированный вход
$0.050
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 131K
Макс. выход: 8,192 tokens
Дата обрезания знаний: 2025-04
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Плотная 32B — стабильная производительность
  • Контекст 131K
  • Сильные навыки кодирования
  • Открытый исходный код

Минусы

  • Нет зрения
  • Максимальный вывод 8K
  • Более высокая задержка по сравнению с вариантами MoE

Производительность

Скорость вывода~65 tok/s
Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
83.2%
LiveCodeBench
55.3%

Qwen3-14B

Lite

Легкие общие задачи

Официальные цены

Когда использовать: Бюджетный вариант для суммаризации, перевода и простых вопросов-ответов.

Ключевые улучшения

  • 14B плотная — помещается на одном GPU
  • Контекст 131K всего за $0.10/1M ввода
  • Достаточно хороша для большинства повседневных задач
  • Открытый исходный код для тонкой настройки
Цена входа
$0.100
per 1M tokens
Цена выхода
$0.300
per 1M tokens
Кэшированный вход
$0.030
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 131K
Макс. выход: 8,192 tokens
Дата обрезания знаний: 2025-04
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Компактная плотная модель 14B
  • Контекст 131K
  • Очень низкая стоимость
  • Открытый исходный код

Минусы

  • Ограниченные сложные рассуждения
  • Нет зрения
  • Максимальный вывод 8K

Производительность

Скорость вывода~90 tok/s
Ограничение скорости10,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
77.1%
LiveCodeBench
42.8%

Qwen3-8B

Lite

Развертывание на периферии, простые задачи

Официальные цены

Когда использовать: Периферийные устройства, локальное развертывание или сверхдешевая пакетная обработка.

Ключевые улучшения

  • 8B параметров — работает на RTX 3060 или аналогах
  • $0.05/1M ввод — один из самых дешевых
  • Контекст 131K несмотря на малый размер
  • Идеально для локального/офлайн развертывания
Цена входа
$0.050
per 1M tokens
Цена выхода
$0.150
per 1M tokens
Кэшированный вход
$0.010
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 131K
Макс. выход: 8,192 tokens
Дата обрезания знаний: 2025-04
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Крошечная 8B — работает на ноутбучных GPU
  • Контекст 131K
  • Чрезвычайно дешево
  • Открытый исходный код

Минусы

  • Только базовые рассуждения
  • Нет зрения
  • Максимальный вывод 8K

Производительность

Скорость вывода~150 tok/s
Ограничение скорости20,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
71.5%
LiveCodeBench
33.1%

Qwen-VL-Plus

Mid-tier

Мультимодальное понимание, анализ документов

Официальные цены

Когда использовать: Анализ документов, создание подписей к изображениям, визуальные вопросы и ответы, а также мультимодальные конвейеры RAG.

Ключевые улучшения

  • Нативная мультимодальность — обрабатывает изображения и текст вместе
  • 131K контекст обрабатывает многостраничные документы
  • Сильное OCR: понимание диаграмм, таблиц и схем
  • Многоязычный VQA на более чем 100 языках
Цена входа
$0.200
per 1M tokens
Цена выхода
$0.800
per 1M tokens
Кэшированный вход
$0.050
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 131K
Макс. выход: 8,192 tokens
Дата обрезания знаний: 2025-04
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Нативная модель зрения-языка
  • 131K контекст с изображениями
  • Сильное понимание OCR документов и диаграмм
  • Многоязычный VQA

Минусы

  • Нет тонкой настройки
  • Максимум 8K вывода
  • Более высокая стоимость, чем текстовый Qwen3

Производительность

Скорость вывода~55 tok/s
Ограничение скорости3,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMMU
68.2%
MathVista
62.5%

Qwen-RobotManip

Flagship

Роботизированное манипулирование, управление ловкими руками

Официальные цены

Когда использовать: Для задач роботизированного манипулирования: захват, сборка и управление ловкими руками в исследовательских и промышленных условиях.

Ключевые улучшения

  • Первая модель манипулирования VLA Qwen-Robot
  • 38,100+ часов обучающих данных с открытым исходным кодом
  • Единое пространство состояний-действий для разных типов роботов
  • Инкрементальное управление позой конечного эффектора в кадре камеры
  • Часть полного набора Qwen-Robot Suite (Манипуляция + Навигация + Мир)
Цена входа
$0.0000
per 1M tokens
Цена выхода
$0.0000
per 1M tokens
Кэшированный вход
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 0
Макс. выход: 0 tokens
Дата обрезания знаний: 2026-06
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Модель VLA для точного роботизированного манипулирования
  • 38,100+ часов обучения на данных с открытым исходным кодом
  • Поддержка нескольких типов роботов через единое пространство действий
  • Открытый исходный код под лицензией Apache 2.0

Минусы

  • Специализирована для робототехники — не является общей LLM
  • Требует наличия роботизированного оборудования или симулятора для развертывания
  • Не имеет возможностей генерации текста
  • Очень новая — ограниченное принятие сообществом

Производительность

Скорость вывода
Ограничение скорости

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Qwen-RobotNav

Flagship

Навигация роботов, планирование маршрутов, автономное передвижение

Официальные цены

Когда использовать: Для навигации мобильных роботов: следование инструкциям, навигация по точкам, отслеживание объектов и задачи автономного вождения.

Ключевые улучшения

  • Модель VLN: визуально-языковая навигация для физических агентов
  • Объединяет 4 типа задач: инструкция, точка/цель, отслеживание, вождение
  • Контролируемое кодирование наблюдений + интерфейс инструментов
  • Открытый исходный код: полные веса для настройки
  • Часть полного набора Qwen-Robot Suite (Манипуляция + Навигация + Мир)
Цена входа
$0.0000
per 1M tokens
Цена выхода
$0.0000
per 1M tokens
Кэшированный вход
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 0
Макс. выход: 0 tokens
Дата обрезания знаний: 2026-06
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Модель VLN, объединяющая 4 типа задач навигации
  • Контролируемое кодирование наблюдений для 3D-пространственного восприятия
  • Охватывает следование инструкциям, навигацию по точкам/целям, отслеживание, вождение
  • Открытый исходный код под лицензией Apache 2.0

Минусы

  • Специализирована только для навигации роботов
  • Требует аппаратного обеспечения робота или симулятора
  • Не генерирует текст
  • Очень новая — ограниченная проверка в реальных условиях

Производительность

Скорость вывода
Ограничение скорости

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Qwen-RobotWorld

Flagship

Прогнозирование физического мира, планирование роботов

Официальные цены

Когда использовать: Для планирования роботов и симуляции мира: прогнозирование результатов действий в сценариях манипуляции, вождения и навигации.

Ключевые улучшения

  • Мировая модель: прогнозирует физически правдоподобные будущие состояния
  • Кросс-сценарный: работает в манипуляции, вождении, навигации
  • Интерфейс действий на естественном языке
  • Открытый исходный код: полные веса для исследований и развертывания
  • Часть полного набора Qwen-Robot Suite (Manip + Nav + World)
Цена входа
$0.0000
per 1M tokens
Цена выхода
$0.0000
per 1M tokens
Кэшированный вход
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 0
Макс. выход: 0 tokens
Дата обрезания знаний: 2026-06
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Мировая модель для прогнозирования физически правдоподобных будущих состояний
  • Кросс-сценарный: манипуляции, вождение и навигация
  • Интерфейс действий на естественном языке для интуитивного управления
  • Открытый исходный код под лицензией Apache 2.0

Минусы

  • Специализирован только для симуляции мира
  • Нет генерации текста или управления роботом
  • Требует интеграции с Manip/Nav для полного стека
  • Очень новый — доступно ограниченное количество бенчмарков

Производительность

Скорость вывода
Ограничение скорости

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Сравнение бок о бок

МодельУровеньВходВыходКонтекст
Qwen3.7-MaxFlagship$2.50$7.501M
Qwen3.7-PlusMid-tier$0.400$1.601M
Qwen3-235B-A22BFlagship$0.400$1.20131K
Qwen3-30B-A3BMid-tier$0.150$0.600131K
Qwen3-32BMid-tier$0.200$0.600131K
Qwen3-14BLite$0.100$0.300131K
Qwen3-8BLite$0.050$0.150131K
Qwen-VL-PlusMid-tier$0.200$0.800131K
Qwen-RobotManipFlagship$0.0000$0.00000
Qwen-RobotNavFlagship$0.0000$0.00000
Qwen-RobotWorldFlagship$0.0000$0.00000