Zurück zur Entwicklerzone

Zhipu AI Modelle

Entdecken Sie alle 6 Modelle von Zhipu AI mit detaillierten Preisen, Vor- und Nachteilen sowie Entwicklerempfehlungen.

6
Modelle
$0.050
Niedrigster Input
1M
Max. Kontext
3
Qualitätsstufen

Schnellempfehlungen

Bestes Preis-Leistungs-Verhältnis: GLM-4-Flash ($0.050/1M)
Beste Qualität: GLM-5.1

GLM-5.1

Flagship

Komplexe Codierung, langfristige agentische Aufgaben, Open-Source-Bereitstellung

Offizielle Preise

Wann verwenden: Open-Source-Codierungsassistent, interne Entwicklerwerkzeuge, agentische Codierungs-Workflows und Teams, die selbst gehostete Frontier-fähige Modelle benötigen.

Upgrade-Highlights

  • 754B MoE mit offenen Gewichten — MIT-Lizenz, vollständige kommerzielle Nutzung
  • SWE-bench entspricht GPT-5.4 — Frontier-Codierungsleistung
  • 8-stündige autonome Aufgabenausführung an einem einzigen Problem
  • Rumination: iteratives internes Denken für Korrektheit
  • Selbst hosten auf eigenen GPUs — keine Anbieterbindung
Input-Preis
$0.830
per 1M tokens
Output-Preis
$3.31
per 1M tokens
Cached Input
$0.170
per 1M tokens
Batch-Input
per 1M tokens
Kontextfenster: 1M
Max. Output: 16,384 tokens
Wissensstand: 2026-04
VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

  • 754B MoE mit offenen Gewichten (MIT-Lizenz)
  • Entspricht GPT-5.4 bei SWE-bench Codierung
  • 8-stündige autonome Aufgabenausführung
  • Selbst hostbar mit vollständigen kommerziellen Rechten
  • Ruminationsarchitektur für tiefgehendes Denken

Nachteile

  • 754B Parameter erfordert erhebliche GPU-Infrastruktur für Selbsthosting
  • Schwächeres Englisch im Vergleich zu geschlossenen Frontier-Modellen bei allgemeinen Aufgaben
  • Keine Sicht auf Basismodell

Leistung

Ausgabegeschwindigkeit~40 tok/s
Rate-Limit3,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMLU (CN)
91.2%
C-Eval
93.5%
SWE-Verified
78.6%
CMMLU
92.1%

GLM-4.6

Flagship

Chinesische Sprachaufgaben, Unternehmens-KI

Offizielle Preise

Wann verwenden: Chinesischsprachige Unternehmensanwendungen, Kundendienst-Bots und Content-Erstellung für den chinesischen Markt.

Upgrade-Highlights

  • Hochwertige chinesische NLU und Generierung — übertrifft GPT-4 bei chinesischen Benchmarks
  • 128K Kontext mit 16K maximaler Ausgabe — längste Ausgabe ihrer Klasse
  • Vollständige Funktionsaufrufe für Agenten-Workflows
  • Feinabstimmung für Domänenanpassung verfügbar
  • $0.50/$2.00 — wettbewerbsfähig mit GPT-4o zum halben Preis
Input-Preis
$0.500
per 1M tokens
Output-Preis
$2.00
per 1M tokens
Cached Input
$0.100
per 1M tokens
Batch-Input
per 1M tokens
Kontextfenster: 128K
Max. Output: 16,000 tokens
Wissensstand: 2025-03
VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

  • Beste chinesische Sprachleistung
  • 128K Kontext, 16K Ausgabe
  • Starke Funktionsaufrufe
  • Feinabstimmungsunterstützung

Nachteile

  • Schwächeres Englisch im Vergleich zu GPT-4
  • Keine Bildverarbeitung im Basismodell
  • Kleineres Ökosystem

Leistung

Ausgabegeschwindigkeit~60 tok/s
Rate-Limit5,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMLU (CN)
84.5%
C-Eval
89.2%
CMMLU
88.7%

GLM-4.5

Mid-tier

Ausgewogene chinesische/englische Aufgaben

Offizielle Preise

Wann verwenden: Zweisprachige Anwendungen, die gutes Chinesisch und Englisch zu mittleren Preisen benötigen.

Upgrade-Highlights

  • Stark zweisprachig: wettbewerbsfähig in Chinesisch und Englisch
  • 128K Kontext für $0,30/1M — erschwinglicher langer Kontext
  • 16K maximale Ausgabe für lange Textgenerierung
  • Feinabstimmungsunterstützung für Anpassung
Input-Preis
$0.300
per 1M tokens
Output-Preis
$1.20
per 1M tokens
Cached Input
$0.080
per 1M tokens
Batch-Input
per 1M tokens
Kontextfenster: 128K
Max. Output: 16,000 tokens
Wissensstand: 2025-03
VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

  • Starke zweisprachige Leistung
  • 128K Kontext
  • 16K maximale Ausgabe
  • Kosteneffizient

Nachteile

  • Weniger leistungsfähig als GLM-4.6
  • Keine Bildverarbeitung
  • Kleineres Modell-Ökosystem

Leistung

Ausgabegeschwindigkeit~75 tok/s
Rate-Limit8,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMLU
76.8%
C-Eval
83.1%

GLM-4-Plus

Mid-tier

Allzweck, API-Integration

Offizielle Preise

Wann verwenden: Allzweck-API-Integration, Chatbots und Inhaltserstellung zu budgetfreundlichen Preisen.

Upgrade-Highlights

  • Vielseitiges Mittelklasse-Modell für die meisten Anwendungsfälle
  • 128K Kontext für nur $0,20/1M Eingabe
  • Vollständiger Funktionsaufruf für Tool-Nutzung
  • Feinabstimmung verfügbar
Input-Preis
$0.200
per 1M tokens
Output-Preis
$0.800
per 1M tokens
Cached Input
$0.050
per 1M tokens
Batch-Input
per 1M tokens
Kontextfenster: 128K
Max. Output: 8,192 tokens
Wissensstand: 2025-03
VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

  • Guter Allrounder
  • 128K Kontext
  • Erschwingliche Preise
  • Funktionsaufruf

Nachteile

  • Maximal 8K Ausgabe
  • Keine Bilderkennung
  • Schwächer bei komplexem Denken

Leistung

Ausgabegeschwindigkeit~85 tok/s
Rate-Limit10,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMLU
73.5%
C-Eval
79.8%

GLM-4-Flash

Lite

Aufgaben mit hohem Durchsatz und niedriger Latenz

Offizielle Preise

Wann verwenden: Aufgaben mit hohem Volumen wie Klassifizierung, Zusammenfassung und einfache Frage-Antwort, bei denen Geschwindigkeit und Kosten wichtig sind.

Upgrade-Highlights

  • Schnellstes GLM-Modell — optimiert für Durchsatz
  • $0,05/1M Eingabe — extrem budgetfreundlich
  • 128K Kontext trotz leichter Stufe
  • Kostenlose Stufe: 1M Token/Tag für Entwicklung
Input-Preis
$0.050
per 1M tokens
Output-Preis
$0.200
per 1M tokens
Cached Input
$0.010
per 1M tokens
Batch-Input
per 1M tokens
Kontextfenster: 128K
Max. Output: 8,192 tokens
Wissensstand: 2025-03
VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

  • Extrem schnelle Inferenz
  • 128K Kontext
  • Sehr niedrige Kosten
  • Kostenlose Stufe verfügbar

Nachteile

  • Nur grundlegendes Denken
  • Kein Feintuning
  • Keine Bildverarbeitung

Leistung

Ausgabegeschwindigkeit~200 tok/s
Rate-Limit30,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMLU
65.2%
C-Eval
72.1%

GLM-4V-Plus

Mid-tier

Chinesisches multimodales, Dokumenten-KI

Offizielle Preise

Wann verwenden: Chinesische Dokumentenanalyse, Beleg-/Rechnungsverarbeitung und visuelle Q&A für chinesische Märkte.

Upgrade-Highlights

  • Natives multimodales mit starker chinesischer OCR
  • Dokumenten-KI: Belege, Rechnungen, Formulare
  • Visuelle Q&A optimiert für chinesische Inhalte
  • Funktionsaufruf für multimodale Agenten-Workflows
Input-Preis
$0.300
per 1M tokens
Output-Preis
$1.20
per 1M tokens
Cached Input
$0.080
per 1M tokens
Batch-Input
per 1M tokens
Kontextfenster: 8K
Max. Output: 4,096 tokens
Wissensstand: 2025-03
VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

  • Native Vision-Language
  • Starke chinesische OCR
  • Dokumenten- und Diagrammverständnis
  • Funktionsaufruf

Nachteile

  • Nur 8K Kontext
  • Maximal 4K Ausgabe
  • Kein Feintuning

Leistung

Ausgabegeschwindigkeit~50 tok/s
Rate-Limit3,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMMU (CN)
62.8%
DocVQA
85.3%

Nebeneinander-Vergleich

ModellStufeInputOutputKontext
GLM-5.1Flagship$0.830$3.311M
GLM-4.6Flagship$0.500$2.00128K
GLM-4.5Mid-tier$0.300$1.20128K
GLM-4-PlusMid-tier$0.200$0.800128K
GLM-4-FlashLite$0.050$0.200128K
GLM-4V-PlusMid-tier$0.300$1.208K