Назад в зону разработчика

Zhipu AI Модели

Изучите все 6 моделей от Zhipu AI с подробными ценами, плюсами и минусами, а также рекомендациями для разработчиков.

6
Модели
$0.050
Самая низкая входная цена
1M
Макс. контекст
3
Уровни качества

Быстрые рекомендации

Лучшее соотношение цены и качества: GLM-4-Flash ($0.050/1M)
Лучшее качество: GLM-5.1

GLM-5.1

Flagship

Сложное кодирование, долгосрочные агентные задачи, развертывание с открытым исходным кодом

Официальные цены

Когда использовать: Помощник по кодированию с открытым исходным кодом, внутренние инструменты разработчика, агентные рабочие процессы кодирования и команды, нуждающиеся в самостоятельном размещении флагманских моделей.

Ключевые улучшения

  • 754B MoE с открытым весом — лицензия MIT, полное коммерческое использование
  • SWE-bench соответствует GPT-5.4 — флагманская производительность кодирования
  • 8-часовое автономное выполнение задачи над одной проблемой
  • Размышление: итеративное внутреннее рассуждение для корректности
  • Самостоятельное размещение на собственных GPU — без привязки к вендору
Цена входа
$0.830
per 1M tokens
Цена выхода
$3.31
per 1M tokens
Кэшированный вход
$0.170
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 1M
Макс. выход: 16,384 tokens
Дата обрезания знаний: 2026-04
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • 754B MoE с открытым весом (лицензия MIT)
  • Соответствует GPT-5.4 по кодированию SWE-bench
  • 8-часовое автономное выполнение задач
  • Самостоятельное размещение с полными коммерческими правами
  • Архитектура размышления для глубокого анализа

Минусы

  • 754B параметров требует значительной инфраструктуры GPU для самостоятельного размещения
  • Слабый английский по сравнению с закрытыми флагманскими моделями в общих задачах
  • Нет зрения в базовой модели

Производительность

Скорость вывода~40 tok/s
Ограничение скорости3,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU (CN)
91.2%
C-Eval
93.5%
SWE-Verified
78.6%
CMMLU
92.1%

GLM-4.6

Flagship

Китайские языковые задачи, корпоративный ИИ

Официальные цены

Когда использовать: Корпоративные приложения на китайском языке, боты обслуживания клиентов и генерация контента, ориентированная на китайские рынки.

Ключевые улучшения

  • Лучшее в своем классе понимание и генерация китайского языка — превосходит GPT-4 на китайских тестах
  • 128K контекст с максимальным выводом 16K — самый длинный вывод в классе
  • Полный вызов функций для рабочих процессов агентов
  • Тонкая настройка доступна для адаптации к домену
  • $0.50/$2.00 — конкурентоспособно с GPT-4o по половине цены
Цена входа
$0.500
per 1M tokens
Цена выхода
$2.00
per 1M tokens
Кэшированный вход
$0.100
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 128K
Макс. выход: 16,000 tokens
Дата обрезания знаний: 2025-03
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Лучшая производительность на китайском языке
  • 128K контекст, 16K вывод
  • Мощный вызов функций
  • Поддержка тонкой настройки

Минусы

  • Слабее английский по сравнению с GPT-4
  • Нет зрения на базовой модели
  • Меньшая экосистема

Производительность

Скорость вывода~60 tok/s
Ограничение скорости5,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU (CN)
84.5%
C-Eval
89.2%
CMMLU
88.7%

GLM-4.5

Mid-tier

Сбалансированные задачи на китайском/английском

Официальные цены

Когда использовать: Двуязычные приложения, требующие хорошего китайского и английского по средней цене.

Ключевые улучшения

  • Сильный двуязычный: конкурентоспособен как в китайском, так и в английском
  • Контекст 128K за $0.30/1M — доступный длинный контекст
  • Максимальный вывод 16K для длинной генерации
  • Поддержка тонкой настройки для кастомизации
Цена входа
$0.300
per 1M tokens
Цена выхода
$1.20
per 1M tokens
Кэшированный вход
$0.080
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 128K
Макс. выход: 16,000 tokens
Дата обрезания знаний: 2025-03
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Сильная двуязычная производительность
  • Контекст 128K
  • Максимальный вывод 16K
  • Экономически эффективный

Минусы

  • Менее мощный, чем GLM-4.6
  • Нет зрения
  • Меньшая экосистема моделей

Производительность

Скорость вывода~75 tok/s
Ограничение скорости8,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
76.8%
C-Eval
83.1%

GLM-4-Plus

Mid-tier

Общего назначения, интеграция API

Официальные цены

Когда использовать: Интеграция API общего назначения, чат-боты и генерация контента по бюджетной цене.

Ключевые улучшения

  • Универсальная модель среднего уровня для большинства случаев
  • Контекст 128K всего за $0.20/1M ввода
  • Полный вызов функций для использования инструментов
  • Доступна тонкая настройка
Цена входа
$0.200
per 1M tokens
Цена выхода
$0.800
per 1M tokens
Кэшированный вход
$0.050
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 128K
Макс. выход: 8,192 tokens
Дата обрезания знаний: 2025-03
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Хороший универсал
  • Контекст 128K
  • Доступная цена
  • Вызов функций

Минусы

  • Максимум 8K на выход
  • Нет зрения
  • Слабее в сложных рассуждениях

Производительность

Скорость вывода~85 tok/s
Ограничение скорости10,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
73.5%
C-Eval
79.8%

GLM-4-Flash

Lite

Высокопроизводительные задачи с низкой задержкой

Официальные цены

Когда использовать: Высокообъемные задачи, такие как классификация, суммаризация и простые вопросы-ответы, где важны скорость и стоимость.

Ключевые улучшения

  • Самая быстрая модель GLM — оптимизирована для пропускной способности
  • $0.05/1M ввод — сверхбюджетно
  • Контекст 128K, несмотря на легкий уровень
  • Бесплатный тариф: 1M токенов/день для разработки
Цена входа
$0.050
per 1M tokens
Цена выхода
$0.200
per 1M tokens
Кэшированный вход
$0.010
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 128K
Макс. выход: 8,192 tokens
Дата обрезания знаний: 2025-03
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Чрезвычайно быстрый вывод
  • Контекст 128K
  • Очень низкая стоимость
  • Доступен бесплатный тариф

Минусы

  • Только базовые рассуждения
  • Нет тонкой настройки
  • Нет зрения

Производительность

Скорость вывода~200 tok/s
Ограничение скорости30,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMLU
65.2%
C-Eval
72.1%

GLM-4V-Plus

Mid-tier

Китайская мультимодальная модель, ИИ для документов

Официальные цены

Когда использовать: Анализ китайских документов, обработка чеков/счетов и визуальные вопросы-ответы для китайского рынка.

Ключевые улучшения

  • Встроенная мультимодальность с сильным китайским OCR
  • ИИ для документов: чеки, счета, формы
  • Визуальные вопросы-ответы, оптимизированные для китайского контента
  • Вызов функций для мультимодальных агентских рабочих процессов
Цена входа
$0.300
per 1M tokens
Цена выхода
$1.20
per 1M tokens
Кэшированный вход
$0.080
per 1M tokens
Пакетный вход
per 1M tokens
Окно контекста: 8K
Макс. выход: 4,096 tokens
Дата обрезания знаний: 2025-03
ЗрениеВызов функцийТонкая настройкаРежим JSONБесплатный уровень

Плюсы

  • Встроенное зрение-язык
  • Сильное китайское OCR
  • Понимание документов и диаграмм
  • Вызов функций

Минусы

  • Только 8K контекст
  • Максимум 4K вывод
  • Нет тонкой настройки

Производительность

Скорость вывода~50 tok/s
Ограничение скорости3,000 RPM

Мультимодальность

Ввод изображенияВывод изображенияВвод аудиоВывод аудио

Бенчмарки

MMMU (CN)
62.8%
DocVQA
85.3%

Сравнение бок о бок

МодельУровеньВходВыходКонтекст
GLM-5.1Flagship$0.830$3.311M
GLM-4.6Flagship$0.500$2.00128K
GLM-4.5Mid-tier$0.300$1.20128K
GLM-4-PlusMid-tier$0.200$0.800128K
GLM-4-FlashLite$0.050$0.200128K
GLM-4V-PlusMid-tier$0.300$1.208K