개발자 영역으로 돌아가기

Zhipu AI 모델

Zhipu AI의 모든 6개 모델을 자세한 가격, 장단점 및 개발자 추천과 함께 살펴보세요.

6
모델
$0.050
최저 입력
1M
최대 컨텍스트
3
품질 등급

빠른 추천

최고 가성비: GLM-4-Flash ($0.050/1M)
최고 품질: GLM-5.1

GLM-5.1

Flagship

복잡한 코딩, 장기 에이전트 작업, 오픈소스 배포

공식 가격

사용 시기: 오픈소스 코딩 어시스턴트, 내부 개발자 도구, 에이전트 코딩 워크플로우, 자체 호스팅 프론티어급 모델이 필요한 팀.

업그레이드 하이라이트

  • 754B MoE 오픈 가중치 — MIT 라이선스, 전체 상업적 사용
  • SWE-bench에서 GPT-5.4와 동등 — 프론티어 코딩 성능
  • 단일 문제에 대해 8시간 자율 작업 실행
  • 반추: 정확성을 위한 반복적 내부 추론
  • 자체 GPU에서 호스팅 — 벤더 종속 없음
입력 가격
$0.830
per 1M tokens
출력 가격
$3.31
per 1M tokens
캐시된 입력
$0.170
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 1M
최대 출력: 16,384 tokens
지식 기준일: 2026-04
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 754B MoE 오픈 가중치 (MIT 라이선스)
  • SWE-bench 코딩에서 GPT-5.4와 동등
  • 8시간 지속 자율 작업 실행
  • 전체 상업적 권리로 자체 호스팅 가능
  • 심층 추론을 위한 반추 아키텍처

단점

  • 754B 파라미터로 자체 호스팅에 상당한 GPU 인프라 필요
  • 일반 작업에서 폐쇄형 프론티어 모델 대비 영어 능력 약함
  • 기본 모델에 비전 없음

성능

출력 속도~40 tok/s
속도 제한3,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU (CN)
91.2%
C-Eval
93.5%
SWE-Verified
78.6%
CMMLU
92.1%

GLM-4.6

Flagship

중국어 작업, 엔터프라이즈 AI

공식 가격

사용 시기: 중국어 엔터프라이즈 애플리케이션, 고객 서비스 봇, 중국 시장을 대상으로 한 콘텐츠 생성.

업그레이드 하이라이트

  • 최고 수준의 중국어 NLU 및 생성 — 중국어 벤치마크에서 GPT-4 능가
  • 128K 컨텍스트 및 16K 최대 출력 — 클래스 내 최장 출력
  • 에이전트 워크플로우를 위한 완전한 함수 호출
  • 도메인 적응을 위한 파인튜닝 가능
  • $0.50/$2.00 — GPT-4o 대비 절반 가격으로 경쟁력 있음
입력 가격
$0.500
per 1M tokens
출력 가격
$2.00
per 1M tokens
캐시된 입력
$0.100
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 128K
최대 출력: 16,000 tokens
지식 기준일: 2025-03
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 최고의 중국어 성능
  • 128K 컨텍스트, 16K 출력
  • 강력한 함수 호출
  • 파인튜닝 지원

단점

  • GPT-4 대비 약한 영어 성능
  • 기본 모델에 비전 없음
  • 작은 생태계

성능

출력 속도~60 tok/s
속도 제한5,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU (CN)
84.5%
C-Eval
89.2%
CMMLU
88.7%

GLM-4.5

Mid-tier

중국어/영어 작업 균형

공식 가격

사용 시기: 중간 가격대에서 중국어와 영어를 모두 잘 처리해야 하는 이중 언어 애플리케이션.

업그레이드 하이라이트

  • 강력한 이중 언어: 중국어와 영어 모두 경쟁력 있음
  • 128K 컨텍스트, $0.30/1M — 저렴한 긴 컨텍스트
  • 16K 최대 출력으로 긴 형식 생성 가능
  • 미세 조정 지원으로 맞춤화 가능
입력 가격
$0.300
per 1M tokens
출력 가격
$1.20
per 1M tokens
캐시된 입력
$0.080
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 128K
최대 출력: 16,000 tokens
지식 기준일: 2025-03
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 강력한 이중 언어 성능
  • 128K 컨텍스트
  • 16K 최대 출력
  • 비용 효율적

단점

  • GLM-4.6보다 덜 강력함
  • 비전 없음
  • 더 작은 모델 생태계

성능

출력 속도~75 tok/s
속도 제한8,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU
76.8%
C-Eval
83.1%

GLM-4-Plus

Mid-tier

일반 목적, API 통합

공식 가격

사용 시기: 예산 친화적인 가격으로 일반 목적 API 통합, 챗봇 및 콘텐츠 생성에 사용합니다.

업그레이드 하이라이트

  • 대부분의 사용 사례에 적합한 다재다능한 중간 계층 모델
  • $0.20/1M 입력으로 128K 컨텍스트
  • 도구 사용을 위한 전체 함수 호출
  • 파인튜닝 가능
입력 가격
$0.200
per 1M tokens
출력 가격
$0.800
per 1M tokens
캐시된 입력
$0.050
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 128K
최대 출력: 8,192 tokens
지식 기준일: 2025-03
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 좋은 올라운더
  • 128K 컨텍스트
  • 합리적인 가격
  • 함수 호출

단점

  • 최대 8K 출력
  • 비전 없음
  • 복잡한 추론에 약함

성능

출력 속도~85 tok/s
속도 제한10,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU
73.5%
C-Eval
79.8%

GLM-4-Flash

Lite

고처리량, 저지연 작업

공식 가격

사용 시기: 분류, 요약, 간단한 Q&A와 같이 속도와 비용이 중요한 대량 작업.

업그레이드 하이라이트

  • 가장 빠른 GLM 모델 — 처리량 최적화
  • $0.05/1M 입력 — 초저예산 친화적
  • 라이트 티어에도 128K 컨텍스트
  • 무료 티어: 개발용 하루 100만 토큰
입력 가격
$0.050
per 1M tokens
출력 가격
$0.200
per 1M tokens
캐시된 입력
$0.010
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 128K
최대 출력: 8,192 tokens
지식 기준일: 2025-03
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 매우 빠른 추론
  • 128K 컨텍스트
  • 매우 낮은 비용
  • 무료 티어 제공

단점

  • 기본 추론만 가능
  • 파인튜닝 불가
  • 비전 기능 없음

성능

출력 속도~200 tok/s
속도 제한30,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU
65.2%
C-Eval
72.1%

GLM-4V-Plus

Mid-tier

중국어 멀티모달, 문서 AI

공식 가격

사용 시기: 중국어 문서 분석, 영수증/인보이스 처리, 중국 시장용 시각적 Q&A.

업그레이드 하이라이트

  • 강력한 중국어 OCR을 갖춘 네이티브 멀티모달
  • 문서 AI: 영수증, 인보이스, 양식
  • 중국어 콘텐츠에 최적화된 시각적 Q&A
  • 멀티모달 에이전트 워크플로우를 위한 함수 호출
입력 가격
$0.300
per 1M tokens
출력 가격
$1.20
per 1M tokens
캐시된 입력
$0.080
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 8K
최대 출력: 4,096 tokens
지식 기준일: 2025-03
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 네이티브 비전-언어
  • 강력한 중국어 OCR
  • 문서 및 차트 이해
  • 함수 호출

단점

  • 8K 컨텍스트만 지원
  • 최대 출력 4K
  • 파인튜닝 불가

성능

출력 속도~50 tok/s
속도 제한3,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMMU (CN)
62.8%
DocVQA
85.3%

나란히 비교

모델등급입력출력컨텍스트
GLM-5.1Flagship$0.830$3.311M
GLM-4.6Flagship$0.500$2.00128K
GLM-4.5Mid-tier$0.300$1.20128K
GLM-4-PlusMid-tier$0.200$0.800128K
GLM-4-FlashLite$0.050$0.200128K
GLM-4V-PlusMid-tier$0.300$1.208K