Zhipu AI Модели

Изучите все 6 моделей от Zhipu AI с подробными ценами, плюсами и минусами, а также рекомендациями для разработчиков.

Модели

$0.050

Самая низкая входная цена

Макс. контекст

Уровни качества

Быстрые рекомендации

Лучшее соотношение цены и качества: GLM-4-Flash ($0.050/1M)

Лучшее качество: GLM-5.1

GLM-5.1

Flagship

Сложное кодирование, долгосрочные агентные задачи, развертывание с открытым исходным кодом

Официальные цены

Когда использовать: Помощник по кодированию с открытым исходным кодом, внутренние инструменты разработчика, агентные рабочие процессы кодирования и команды, нуждающиеся в самостоятельном размещении флагманских моделей.

Ключевые улучшения

◆754B MoE с открытым весом — лицензия MIT, полное коммерческое использование
◆SWE-bench соответствует GPT-5.4 — флагманская производительность кодирования
◆8-часовое автономное выполнение задачи над одной проблемой
◆Размышление: итеративное внутреннее рассуждение для корректности
◆Самостоятельное размещение на собственных GPU — без привязки к вендору

Цена входа

$0.830

per 1M tokens

Цена выхода

$3.31

per 1M tokens

Кэшированный вход

$0.170

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 1M

Макс. выход: 16,384 tokens

Дата обрезания знаний: 2026-04

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

754B MoE с открытым весом (лицензия MIT)
Соответствует GPT-5.4 по кодированию SWE-bench
8-часовое автономное выполнение задач
Самостоятельное размещение с полными коммерческими правами
Архитектура размышления для глубокого анализа

Минусы

754B параметров требует значительной инфраструктуры GPU для самостоятельного размещения
Слабый английский по сравнению с закрытыми флагманскими моделями в общих задачах
Нет зрения в базовой модели

Производительность

Скорость вывода~40 tok/s

Ограничение скорости3,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU (CN)

91.2%

C-Eval

93.5%

SWE-Verified

78.6%

CMMLU

92.1%

GLM-4.6

Flagship

Китайские языковые задачи, корпоративный ИИ

Официальные цены

Когда использовать: Корпоративные приложения на китайском языке, боты обслуживания клиентов и генерация контента, ориентированная на китайские рынки.

Ключевые улучшения

◆Лучшее в своем классе понимание и генерация китайского языка — превосходит GPT-4 на китайских тестах
◆128K контекст с максимальным выводом 16K — самый длинный вывод в классе
◆Полный вызов функций для рабочих процессов агентов
◆Тонкая настройка доступна для адаптации к домену
◆$0.50/$2.00 — конкурентоспособно с GPT-4o по половине цены

Цена входа

$0.500

per 1M tokens

Цена выхода

$2.00

per 1M tokens

Кэшированный вход

$0.100

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 128K

Макс. выход: 16,000 tokens

Дата обрезания знаний: 2025-03

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Лучшая производительность на китайском языке
128K контекст, 16K вывод
Мощный вызов функций
Поддержка тонкой настройки

Минусы

Слабее английский по сравнению с GPT-4
Нет зрения на базовой модели
Меньшая экосистема

Производительность

Скорость вывода~60 tok/s

Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU (CN)

84.5%

C-Eval

89.2%

CMMLU

88.7%

GLM-4.5

Mid-tier

Сбалансированные задачи на китайском/английском

Официальные цены

Когда использовать: Двуязычные приложения, требующие хорошего китайского и английского по средней цене.

Ключевые улучшения

◆Сильный двуязычный: конкурентоспособен как в китайском, так и в английском
◆Контекст 128K за $0.30/1M — доступный длинный контекст
◆Максимальный вывод 16K для длинной генерации
◆Поддержка тонкой настройки для кастомизации

Цена входа

$0.300

per 1M tokens

Цена выхода

$1.20

per 1M tokens

Кэшированный вход

$0.080

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 128K

Макс. выход: 16,000 tokens

Дата обрезания знаний: 2025-03

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Сильная двуязычная производительность
Контекст 128K
Максимальный вывод 16K
Экономически эффективный

Минусы

Менее мощный, чем GLM-4.6
Нет зрения
Меньшая экосистема моделей

Производительность

Скорость вывода~75 tok/s

Ограничение скорости8,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

76.8%

C-Eval

83.1%

GLM-4-Plus

Mid-tier

Общего назначения, интеграция API

Официальные цены

Когда использовать: Интеграция API общего назначения, чат-боты и генерация контента по бюджетной цене.

Ключевые улучшения

◆Универсальная модель среднего уровня для большинства случаев
◆Контекст 128K всего за $0.20/1M ввода
◆Полный вызов функций для использования инструментов
◆Доступна тонкая настройка

Цена входа

$0.200

per 1M tokens

Цена выхода

$0.800

per 1M tokens

Кэшированный вход

$0.050

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 128K

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2025-03

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Хороший универсал
Контекст 128K
Доступная цена
Вызов функций

Минусы

Максимум 8K на выход
Нет зрения
Слабее в сложных рассуждениях

Производительность

Скорость вывода~85 tok/s

Ограничение скорости10,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

73.5%

C-Eval

79.8%

GLM-4-Flash

Lite

Высокопроизводительные задачи с низкой задержкой

Официальные цены

Когда использовать: Высокообъемные задачи, такие как классификация, суммаризация и простые вопросы-ответы, где важны скорость и стоимость.

Ключевые улучшения

◆Самая быстрая модель GLM — оптимизирована для пропускной способности
◆$0.05/1M ввод — сверхбюджетно
◆Контекст 128K, несмотря на легкий уровень
◆Бесплатный тариф: 1M токенов/день для разработки

Цена входа

$0.050

per 1M tokens

Цена выхода

$0.200

per 1M tokens

Кэшированный вход

$0.010

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 128K

Макс. выход: 8,192 tokens

Дата обрезания знаний: 2025-03

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Чрезвычайно быстрый вывод
Контекст 128K
Очень низкая стоимость
Доступен бесплатный тариф

Минусы

Только базовые рассуждения
Нет тонкой настройки
Нет зрения

Производительность

Скорость вывода~200 tok/s

Ограничение скорости30,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU

65.2%

C-Eval

72.1%

GLM-4V-Plus

Mid-tier

Китайская мультимодальная модель, ИИ для документов

Официальные цены

Когда использовать: Анализ китайских документов, обработка чеков/счетов и визуальные вопросы-ответы для китайского рынка.

Ключевые улучшения

◆Встроенная мультимодальность с сильным китайским OCR
◆ИИ для документов: чеки, счета, формы
◆Визуальные вопросы-ответы, оптимизированные для китайского контента
◆Вызов функций для мультимодальных агентских рабочих процессов

Цена входа

$0.300

per 1M tokens

Цена выхода

$1.20

per 1M tokens

Кэшированный вход

$0.080

per 1M tokens

Пакетный вход

—

per 1M tokens

Окно контекста: 8K

Макс. выход: 4,096 tokens

Дата обрезания знаний: 2025-03

ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

Встроенное зрение-язык
Сильное китайское OCR
Понимание документов и диаграмм
Вызов функций

Минусы

Только 8K контекст
Максимум 4K вывод
Нет тонкой настройки

Производительность

Скорость вывода~50 tok/s

Ограничение скорости3,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMMU (CN)

62.8%

DocVQA

85.3%

Сравнение бок о бок

Модель	Уровень	Вход	Выход	Кэш	Контекст	Макс. выход
GLM-5.1	Flagship	$0.830	$3.31	$0.170	1M	16,384
GLM-4.6	Flagship	$0.500	$2.00	$0.100	128K	16,000
GLM-4.5	Mid-tier	$0.300	$1.20	$0.080	128K	16,000
GLM-4-Plus	Mid-tier	$0.200	$0.800	$0.050	128K	8,192
GLM-4-Flash	Lite	$0.050	$0.200	$0.010	128K	8,192
GLM-4V-Plus	Mid-tier	$0.300	$1.20	$0.080	8K	4,096