개발자 영역으로 돌아가기공식 가격 공식 가격 공식 가격 공식 가격 공식 가격 공식 가격
Zhipu AI 모델
Zhipu AI의 모든 6개 모델을 자세한 가격, 장단점 및 개발자 추천과 함께 살펴보세요.
6
모델
$0.050
최저 입력
1M
최대 컨텍스트
3
품질 등급
빠른 추천
최고 가성비: GLM-4-Flash ($0.050/1M)
최고 품질: GLM-5.1
GLM-5.1
Flagship복잡한 코딩, 장기 에이전트 작업, 오픈소스 배포
사용 시기: 오픈소스 코딩 어시스턴트, 내부 개발자 도구, 에이전트 코딩 워크플로우, 자체 호스팅 프론티어급 모델이 필요한 팀.
업그레이드 하이라이트
- ◆754B MoE 오픈 가중치 — MIT 라이선스, 전체 상업적 사용
- ◆SWE-bench에서 GPT-5.4와 동등 — 프론티어 코딩 성능
- ◆단일 문제에 대해 8시간 자율 작업 실행
- ◆반추: 정확성을 위한 반복적 내부 추론
- ◆자체 GPU에서 호스팅 — 벤더 종속 없음
입력 가격
$0.830
per 1M tokens
출력 가격
$3.31
per 1M tokens
캐시된 입력
$0.170
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 1M
최대 출력: 16,384 tokens
지식 기준일: 2026-04
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 754B MoE 오픈 가중치 (MIT 라이선스)
- SWE-bench 코딩에서 GPT-5.4와 동등
- 8시간 지속 자율 작업 실행
- 전체 상업적 권리로 자체 호스팅 가능
- 심층 추론을 위한 반추 아키텍처
단점
- 754B 파라미터로 자체 호스팅에 상당한 GPU 인프라 필요
- 일반 작업에서 폐쇄형 프론티어 모델 대비 영어 능력 약함
- 기본 모델에 비전 없음
성능
출력 속도~40 tok/s
속도 제한3,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU (CN)
91.2%
C-Eval
93.5%
SWE-Verified
78.6%
CMMLU
92.1%
GLM-4.6
Flagship중국어 작업, 엔터프라이즈 AI
사용 시기: 중국어 엔터프라이즈 애플리케이션, 고객 서비스 봇, 중국 시장을 대상으로 한 콘텐츠 생성.
업그레이드 하이라이트
- ◆최고 수준의 중국어 NLU 및 생성 — 중국어 벤치마크에서 GPT-4 능가
- ◆128K 컨텍스트 및 16K 최대 출력 — 클래스 내 최장 출력
- ◆에이전트 워크플로우를 위한 완전한 함수 호출
- ◆도메인 적응을 위한 파인튜닝 가능
- ◆$0.50/$2.00 — GPT-4o 대비 절반 가격으로 경쟁력 있음
입력 가격
$0.500
per 1M tokens
출력 가격
$2.00
per 1M tokens
캐시된 입력
$0.100
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 128K
최대 출력: 16,000 tokens
지식 기준일: 2025-03
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 최고의 중국어 성능
- 128K 컨텍스트, 16K 출력
- 강력한 함수 호출
- 파인튜닝 지원
단점
- GPT-4 대비 약한 영어 성능
- 기본 모델에 비전 없음
- 작은 생태계
성능
출력 속도~60 tok/s
속도 제한5,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU (CN)
84.5%
C-Eval
89.2%
CMMLU
88.7%
GLM-4.5
Mid-tier중국어/영어 작업 균형
사용 시기: 중간 가격대에서 중국어와 영어를 모두 잘 처리해야 하는 이중 언어 애플리케이션.
업그레이드 하이라이트
- ◆강력한 이중 언어: 중국어와 영어 모두 경쟁력 있음
- ◆128K 컨텍스트, $0.30/1M — 저렴한 긴 컨텍스트
- ◆16K 최대 출력으로 긴 형식 생성 가능
- ◆미세 조정 지원으로 맞춤화 가능
입력 가격
$0.300
per 1M tokens
출력 가격
$1.20
per 1M tokens
캐시된 입력
$0.080
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 128K
최대 출력: 16,000 tokens
지식 기준일: 2025-03
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 강력한 이중 언어 성능
- 128K 컨텍스트
- 16K 최대 출력
- 비용 효율적
단점
- GLM-4.6보다 덜 강력함
- 비전 없음
- 더 작은 모델 생태계
성능
출력 속도~75 tok/s
속도 제한8,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU
76.8%
C-Eval
83.1%
GLM-4-Plus
Mid-tier일반 목적, API 통합
사용 시기: 예산 친화적인 가격으로 일반 목적 API 통합, 챗봇 및 콘텐츠 생성에 사용합니다.
업그레이드 하이라이트
- ◆대부분의 사용 사례에 적합한 다재다능한 중간 계층 모델
- ◆$0.20/1M 입력으로 128K 컨텍스트
- ◆도구 사용을 위한 전체 함수 호출
- ◆파인튜닝 가능
입력 가격
$0.200
per 1M tokens
출력 가격
$0.800
per 1M tokens
캐시된 입력
$0.050
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 128K
최대 출력: 8,192 tokens
지식 기준일: 2025-03
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 좋은 올라운더
- 128K 컨텍스트
- 합리적인 가격
- 함수 호출
단점
- 최대 8K 출력
- 비전 없음
- 복잡한 추론에 약함
성능
출력 속도~85 tok/s
속도 제한10,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU
73.5%
C-Eval
79.8%
GLM-4-Flash
Lite고처리량, 저지연 작업
사용 시기: 분류, 요약, 간단한 Q&A와 같이 속도와 비용이 중요한 대량 작업.
업그레이드 하이라이트
- ◆가장 빠른 GLM 모델 — 처리량 최적화
- ◆$0.05/1M 입력 — 초저예산 친화적
- ◆라이트 티어에도 128K 컨텍스트
- ◆무료 티어: 개발용 하루 100만 토큰
입력 가격
$0.050
per 1M tokens
출력 가격
$0.200
per 1M tokens
캐시된 입력
$0.010
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 128K
최대 출력: 8,192 tokens
지식 기준일: 2025-03
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 매우 빠른 추론
- 128K 컨텍스트
- 매우 낮은 비용
- 무료 티어 제공
단점
- 기본 추론만 가능
- 파인튜닝 불가
- 비전 기능 없음
성능
출력 속도~200 tok/s
속도 제한30,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU
65.2%
C-Eval
72.1%
GLM-4V-Plus
Mid-tier중국어 멀티모달, 문서 AI
사용 시기: 중국어 문서 분석, 영수증/인보이스 처리, 중국 시장용 시각적 Q&A.
업그레이드 하이라이트
- ◆강력한 중국어 OCR을 갖춘 네이티브 멀티모달
- ◆문서 AI: 영수증, 인보이스, 양식
- ◆중국어 콘텐츠에 최적화된 시각적 Q&A
- ◆멀티모달 에이전트 워크플로우를 위한 함수 호출
입력 가격
$0.300
per 1M tokens
출력 가격
$1.20
per 1M tokens
캐시된 입력
$0.080
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 8K
최대 출력: 4,096 tokens
지식 기준일: 2025-03
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 네이티브 비전-언어
- 강력한 중국어 OCR
- 문서 및 차트 이해
- 함수 호출
단점
- 8K 컨텍스트만 지원
- 최대 출력 4K
- 파인튜닝 불가
성능
출력 속도~50 tok/s
속도 제한3,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMMU (CN)
62.8%
DocVQA
85.3%
나란히 비교
| 모델 | 등급 | 입력 | 출력 | 컨텍스트 |
|---|---|---|---|---|
| GLM-5.1 | Flagship | $0.830 | $3.31 | 1M |
| GLM-4.6 | Flagship | $0.500 | $2.00 | 128K |
| GLM-4.5 | Mid-tier | $0.300 | $1.20 | 128K |
| GLM-4-Plus | Mid-tier | $0.200 | $0.800 | 128K |
| GLM-4-Flash | Lite | $0.050 | $0.200 | 128K |
| GLM-4V-Plus | Mid-tier | $0.300 | $1.20 | 8K |