Zhipu AI Modelle

Entdecken Sie alle 6 Modelle von Zhipu AI mit detaillierten Preisen, Vor- und Nachteilen sowie Entwicklerempfehlungen.

Modelle

$0.050

Niedrigster Input

Max. Kontext

Qualitätsstufen

Schnellempfehlungen

Bestes Preis-Leistungs-Verhältnis: GLM-4-Flash ($0.050/1M)

Beste Qualität: GLM-5.1

GLM-5.1

Flagship

Komplexe Codierung, langfristige agentische Aufgaben, Open-Source-Bereitstellung

Offizielle Preise

Wann verwenden: Open-Source-Codierungsassistent, interne Entwicklerwerkzeuge, agentische Codierungs-Workflows und Teams, die selbst gehostete Frontier-fähige Modelle benötigen.

Upgrade-Highlights

◆754B MoE mit offenen Gewichten — MIT-Lizenz, vollständige kommerzielle Nutzung
◆SWE-bench entspricht GPT-5.4 — Frontier-Codierungsleistung
◆8-stündige autonome Aufgabenausführung an einem einzigen Problem
◆Rumination: iteratives internes Denken für Korrektheit
◆Selbst hosten auf eigenen GPUs — keine Anbieterbindung

Input-Preis

$0.830

per 1M tokens

Output-Preis

$3.31

per 1M tokens

Cached Input

$0.170

per 1M tokens

Batch-Input

—

per 1M tokens

Kontextfenster: 1M

Max. Output: 16,384 tokens

Wissensstand: 2026-04

VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

754B MoE mit offenen Gewichten (MIT-Lizenz)
Entspricht GPT-5.4 bei SWE-bench Codierung
8-stündige autonome Aufgabenausführung
Selbst hostbar mit vollständigen kommerziellen Rechten
Ruminationsarchitektur für tiefgehendes Denken

Nachteile

754B Parameter erfordert erhebliche GPU-Infrastruktur für Selbsthosting
Schwächeres Englisch im Vergleich zu geschlossenen Frontier-Modellen bei allgemeinen Aufgaben
Keine Sicht auf Basismodell

Leistung

Ausgabegeschwindigkeit~40 tok/s

Rate-Limit3,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMLU (CN)

91.2%

C-Eval

93.5%

SWE-Verified

78.6%

CMMLU

92.1%

GLM-4.6

Flagship

Chinesische Sprachaufgaben, Unternehmens-KI

Offizielle Preise

Wann verwenden: Chinesischsprachige Unternehmensanwendungen, Kundendienst-Bots und Content-Erstellung für den chinesischen Markt.

Upgrade-Highlights

◆Hochwertige chinesische NLU und Generierung — übertrifft GPT-4 bei chinesischen Benchmarks
◆128K Kontext mit 16K maximaler Ausgabe — längste Ausgabe ihrer Klasse
◆Vollständige Funktionsaufrufe für Agenten-Workflows
◆Feinabstimmung für Domänenanpassung verfügbar
◆$0.50/$2.00 — wettbewerbsfähig mit GPT-4o zum halben Preis

Input-Preis

$0.500

per 1M tokens

Output-Preis

$2.00

per 1M tokens

Cached Input

$0.100

per 1M tokens

Batch-Input

—

per 1M tokens

Kontextfenster: 128K

Max. Output: 16,000 tokens

Wissensstand: 2025-03

VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

Beste chinesische Sprachleistung
128K Kontext, 16K Ausgabe
Starke Funktionsaufrufe
Feinabstimmungsunterstützung

Nachteile

Schwächeres Englisch im Vergleich zu GPT-4
Keine Bildverarbeitung im Basismodell
Kleineres Ökosystem

Leistung

Ausgabegeschwindigkeit~60 tok/s

Rate-Limit5,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMLU (CN)

84.5%

C-Eval

89.2%

CMMLU

88.7%

GLM-4.5

Mid-tier

Ausgewogene chinesische/englische Aufgaben

Offizielle Preise

Wann verwenden: Zweisprachige Anwendungen, die gutes Chinesisch und Englisch zu mittleren Preisen benötigen.

Upgrade-Highlights

◆Stark zweisprachig: wettbewerbsfähig in Chinesisch und Englisch
◆128K Kontext für $0,30/1M — erschwinglicher langer Kontext
◆16K maximale Ausgabe für lange Textgenerierung
◆Feinabstimmungsunterstützung für Anpassung

Input-Preis

$0.300

per 1M tokens

Output-Preis

$1.20

per 1M tokens

Cached Input

$0.080

per 1M tokens

Batch-Input

—

per 1M tokens

Kontextfenster: 128K

Max. Output: 16,000 tokens

Wissensstand: 2025-03

VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

Starke zweisprachige Leistung
128K Kontext
16K maximale Ausgabe
Kosteneffizient

Nachteile

Weniger leistungsfähig als GLM-4.6
Keine Bildverarbeitung
Kleineres Modell-Ökosystem

Leistung

Ausgabegeschwindigkeit~75 tok/s

Rate-Limit8,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMLU

76.8%

C-Eval

83.1%

GLM-4-Plus

Mid-tier

Allzweck, API-Integration

Offizielle Preise

Wann verwenden: Allzweck-API-Integration, Chatbots und Inhaltserstellung zu budgetfreundlichen Preisen.

Upgrade-Highlights

◆Vielseitiges Mittelklasse-Modell für die meisten Anwendungsfälle
◆128K Kontext für nur $0,20/1M Eingabe
◆Vollständiger Funktionsaufruf für Tool-Nutzung
◆Feinabstimmung verfügbar

Input-Preis

$0.200

per 1M tokens

Output-Preis

$0.800

per 1M tokens

Cached Input

$0.050

per 1M tokens

Batch-Input

—

per 1M tokens

Kontextfenster: 128K

Max. Output: 8,192 tokens

Wissensstand: 2025-03

VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

Guter Allrounder
128K Kontext
Erschwingliche Preise
Funktionsaufruf

Nachteile

Maximal 8K Ausgabe
Keine Bilderkennung
Schwächer bei komplexem Denken

Leistung

Ausgabegeschwindigkeit~85 tok/s

Rate-Limit10,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMLU

73.5%

C-Eval

79.8%

GLM-4-Flash

Lite

Aufgaben mit hohem Durchsatz und niedriger Latenz

Offizielle Preise

Wann verwenden: Aufgaben mit hohem Volumen wie Klassifizierung, Zusammenfassung und einfache Frage-Antwort, bei denen Geschwindigkeit und Kosten wichtig sind.

Upgrade-Highlights

◆Schnellstes GLM-Modell — optimiert für Durchsatz
◆$0,05/1M Eingabe — extrem budgetfreundlich
◆128K Kontext trotz leichter Stufe
◆Kostenlose Stufe: 1M Token/Tag für Entwicklung

Input-Preis

$0.050

per 1M tokens

Output-Preis

$0.200

per 1M tokens

Cached Input

$0.010

per 1M tokens

Batch-Input

—

per 1M tokens

Kontextfenster: 128K

Max. Output: 8,192 tokens

Wissensstand: 2025-03

VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

Extrem schnelle Inferenz
128K Kontext
Sehr niedrige Kosten
Kostenlose Stufe verfügbar

Nachteile

Nur grundlegendes Denken
Kein Feintuning
Keine Bildverarbeitung

Leistung

Ausgabegeschwindigkeit~200 tok/s

Rate-Limit30,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMLU

65.2%

C-Eval

72.1%

GLM-4V-Plus

Mid-tier

Chinesisches multimodales, Dokumenten-KI

Offizielle Preise

Wann verwenden: Chinesische Dokumentenanalyse, Beleg-/Rechnungsverarbeitung und visuelle Q&A für chinesische Märkte.

Upgrade-Highlights

◆Natives multimodales mit starker chinesischer OCR
◆Dokumenten-KI: Belege, Rechnungen, Formulare
◆Visuelle Q&A optimiert für chinesische Inhalte
◆Funktionsaufruf für multimodale Agenten-Workflows

Input-Preis

$0.300

per 1M tokens

Output-Preis

$1.20

per 1M tokens

Cached Input

$0.080

per 1M tokens

Batch-Input

—

per 1M tokens

Kontextfenster: 8K

Max. Output: 4,096 tokens

Wissensstand: 2025-03

VisionFunktionsaufrufFeinabstimmungJSON-ModusKostenlose Stufe

Vorteile

Native Vision-Language
Starke chinesische OCR
Dokumenten- und Diagrammverständnis
Funktionsaufruf

Nachteile

Nur 8K Kontext
Maximal 4K Ausgabe
Kein Feintuning

Leistung

Ausgabegeschwindigkeit~50 tok/s

Rate-Limit3,000 RPM

Multimodal

BildeingabeBildausgabeAudioeingabeAudioausgabe

Benchmarks

MMMU (CN)

62.8%

DocVQA

85.3%

Nebeneinander-Vergleich

Modell	Stufe	Input	Output	Cached	Kontext	Max. Output
GLM-5.1	Flagship	$0.830	$3.31	$0.170	1M	16,384
GLM-4.6	Flagship	$0.500	$2.00	$0.100	128K	16,000
GLM-4.5	Mid-tier	$0.300	$1.20	$0.080	128K	16,000
GLM-4-Plus	Mid-tier	$0.200	$0.800	$0.050	128K	8,192
GLM-4-Flash	Lite	$0.050	$0.200	$0.010	128K	8,192
GLM-4V-Plus	Mid-tier	$0.300	$1.20	$0.080	8K	4,096