Zhipu AI Modèles
Explorez les 6 modèles de Zhipu AI avec des prix détaillés, avantages et inconvénients, et recommandations pour développeurs.
Recommandations rapides
GLM-5.1
FlagshipCodage complexe, tâches agentiques à long horizon, déploiement open-source
Quand l'utiliser: Assistant de codage open-source, outils de développement internes, workflows de codage agentiques, et équipes ayant besoin de modèles frontaliers auto-hébergés.
Points clés de la mise à niveau
- ◆754B MoE open-weight — licence MIT, usage commercial complet
- ◆SWE-bench égal à GPT-5.4 — performance de codage frontalière
- ◆Exécution autonome de tâches pendant 8 heures sur un seul problème
- ◆Rumination : raisonnement interne itératif pour la correction
- ◆Auto-hébergement sur vos propres GPU — pas de dépendance envers un fournisseur
Avantages
- 754B MoE open-weight (licence MIT)
- Égal à GPT-5.4 sur SWE-bench en codage
- Exécution autonome de tâches pendant 8 heures
- Auto-hébergement avec droits commerciaux complets
- Architecture de rumination pour un raisonnement profond
Inconvénients
- 754B paramètres nécessite une infrastructure GPU conséquente pour l'auto-hébergement
- Anglais moins performant que les modèles frontaliers fermés sur les tâches généralistes
- Pas de vision sur le modèle de base
Performance
Multimodal
Benchmarks
GLM-4.6
FlagshipTâches en langue chinoise, IA d'entreprise
Quand l'utiliser: Applications d'entreprise en langue chinoise, chatbots de service client et génération de contenu ciblant les marchés chinois.
Points clés de la mise à niveau
- ◆NLU et génération chinoises de premier ordre — bat GPT-4 sur les benchmarks chinois
- ◆Contexte de 128K avec sortie max de 16K — sortie la plus longue de sa catégorie
- ◆Appel de fonction complet pour les workflows d'agents
- ◆Réglage fin disponible pour l'adaptation au domaine
- ◆0,50 $/2,00 $ — compétitif avec GPT-4o à moitié prix
Avantages
- Meilleure performance en langue chinoise
- Contexte de 128K, sortie de 16K
- Appel de fonction puissant
- Support de réglage fin
Inconvénients
- Anglais plus faible que GPT-4
- Pas de vision sur le modèle de base
- Écosystème plus petit
Performance
Multimodal
Benchmarks
GLM-4.5
Mid-tierTâches équilibrées chinois/anglais
Quand l'utiliser: Applications bilingues nécessitant un bon chinois et anglais à un prix milieu de gamme.
Points clés de la mise à niveau
- ◆Bilingue solide : compétitif en chinois et en anglais
- ◆Contexte 128K à 0,30 $/1M — contexte long abordable
- ◆Sortie max 16K pour génération longue
- ◆Support de fine-tuning pour personnalisation
Avantages
- Performances bilingues solides
- Contexte 128K
- Sortie max 16K
- Rentable
Inconvénients
- Moins performant que GLM-4.6
- Pas de vision
- Écosystème de modèles plus restreint
Performance
Multimodal
Benchmarks
GLM-4-Plus
Mid-tierUsage général, intégration API
Quand l'utiliser: Intégration API polyvalente, chatbots et génération de contenu à un prix économique.
Points clés de la mise à niveau
- ◆Modèle intermédiaire polyvalent pour la plupart des cas d'utilisation
- ◆Contexte 128K à seulement 0,20 $/1M d'entrée
- ◆Appel de fonctions complet pour l'utilisation d'outils
- ◆Ajustement fin disponible
Avantages
- Bon polyvalent
- Contexte 128K
- Prix abordable
- Appel de fonctions
Inconvénients
- Sortie max 8K
- Pas de vision
- Plus faible en raisonnement complexe
Performance
Multimodal
Benchmarks
GLM-4-Flash
LiteTâches à haut débit et faible latence
Quand l'utiliser: Tâches à volume élevé comme la classification, la synthèse et les Q&A simples où la vitesse et le coût comptent.
Points clés de la mise à niveau
- ◆Modèle GLM le plus rapide — optimisé pour le débit
- ◆0,05 $/1M d’entrées — ultra économique
- ◆Contexte de 128K malgré le niveau léger
- ◆Niveau gratuit : 1M de tokens/jour pour le développement
Avantages
- Inférence extrêmement rapide
- Contexte de 128K
- Coût très bas
- Niveau gratuit disponible
Inconvénients
- Raisonnement basique uniquement
- Pas de fine-tuning
- Pas de vision
Performance
Multimodal
Benchmarks
GLM-4V-Plus
Mid-tierMultimodal chinois, IA documentaire
Quand l'utiliser: Analyse de documents chinois, traitement de reçus/factures et Q&A visuelle pour les marchés chinois.
Points clés de la mise à niveau
- ◆Multimodal natif avec OCR chinois performant
- ◆IA documentaire : reçus, factures, formulaires
- ◆Q&A visuelle optimisée pour le contenu chinois
- ◆Appel de fonctions pour workflows agents multimodaux
Avantages
- Vision-langage natif
- OCR chinois performant
- Compréhension de documents et graphiques
- Appel de fonctions
Inconvénients
- Contexte limité à 8K
- Sortie max 4K
- Pas de fine-tuning
Performance
Multimodal
Benchmarks
Comparaison côte à côte
| Modèle | Niveau | Entrée | Sortie | Contexte |
|---|---|---|---|---|
| GLM-5.1 | Flagship | $0.830 | $3.31 | 1M |
| GLM-4.6 | Flagship | $0.500 | $2.00 | 128K |
| GLM-4.5 | Mid-tier | $0.300 | $1.20 | 128K |
| GLM-4-Plus | Mid-tier | $0.200 | $0.800 | 128K |
| GLM-4-Flash | Lite | $0.050 | $0.200 | 128K |
| GLM-4V-Plus | Mid-tier | $0.300 | $1.20 | 8K |