Zhipu AI 모델

Zhipu AI의 모든 6개 모델을 자세한 가격, 장단점 및 개발자 추천과 함께 살펴보세요.

모델

$0.050

최저 입력

최대 컨텍스트

품질 등급

빠른 추천

최고 가성비: GLM-4-Flash ($0.050/1M)

최고 품질: GLM-5.1

GLM-5.1

Flagship

복잡한 코딩, 장기 에이전트 작업, 오픈소스 배포

공식 가격

사용 시기: 오픈소스 코딩 어시스턴트, 내부 개발자 도구, 에이전트 코딩 워크플로우, 자체 호스팅 프론티어급 모델이 필요한 팀.

업그레이드 하이라이트

◆754B MoE 오픈 가중치 — MIT 라이선스, 전체 상업적 사용
◆SWE-bench에서 GPT-5.4와 동등 — 프론티어 코딩 성능
◆단일 문제에 대해 8시간 자율 작업 실행
◆반추: 정확성을 위한 반복적 내부 추론
◆자체 GPU에서 호스팅 — 벤더 종속 없음

입력 가격

$0.830

per 1M tokens

출력 가격

$3.31

per 1M tokens

캐시된 입력

$0.170

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 1M

최대 출력: 16,384 tokens

지식 기준일: 2026-04

비전함수 호출파인튜닝JSON 모드무료 등급

장점

754B MoE 오픈 가중치 (MIT 라이선스)
SWE-bench 코딩에서 GPT-5.4와 동등
8시간 지속 자율 작업 실행
전체 상업적 권리로 자체 호스팅 가능
심층 추론을 위한 반추 아키텍처

단점

754B 파라미터로 자체 호스팅에 상당한 GPU 인프라 필요
일반 작업에서 폐쇄형 프론티어 모델 대비 영어 능력 약함
기본 모델에 비전 없음

성능

출력 속도~40 tok/s

속도 제한3,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU (CN)

91.2%

C-Eval

93.5%

SWE-Verified

78.6%

CMMLU

92.1%

GLM-4.6

Flagship

중국어 작업, 엔터프라이즈 AI

공식 가격

사용 시기: 중국어 엔터프라이즈 애플리케이션, 고객 서비스 봇, 중국 시장을 대상으로 한 콘텐츠 생성.

업그레이드 하이라이트

◆최고 수준의 중국어 NLU 및 생성 — 중국어 벤치마크에서 GPT-4 능가
◆128K 컨텍스트 및 16K 최대 출력 — 클래스 내 최장 출력
◆에이전트 워크플로우를 위한 완전한 함수 호출
◆도메인 적응을 위한 파인튜닝 가능
◆$0.50/$2.00 — GPT-4o 대비 절반 가격으로 경쟁력 있음

입력 가격

$0.500

per 1M tokens

출력 가격

$2.00

per 1M tokens

캐시된 입력

$0.100

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 128K

최대 출력: 16,000 tokens

지식 기준일: 2025-03

비전함수 호출파인튜닝JSON 모드무료 등급

장점

최고의 중국어 성능
128K 컨텍스트, 16K 출력
강력한 함수 호출
파인튜닝 지원

단점

GPT-4 대비 약한 영어 성능
기본 모델에 비전 없음
작은 생태계

성능

출력 속도~60 tok/s

속도 제한5,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU (CN)

84.5%

C-Eval

89.2%

CMMLU

88.7%

GLM-4.5

Mid-tier

중국어/영어 작업 균형

공식 가격

사용 시기: 중간 가격대에서 중국어와 영어를 모두 잘 처리해야 하는 이중 언어 애플리케이션.

업그레이드 하이라이트

◆강력한 이중 언어: 중국어와 영어 모두 경쟁력 있음
◆128K 컨텍스트, $0.30/1M — 저렴한 긴 컨텍스트
◆16K 최대 출력으로 긴 형식 생성 가능
◆미세 조정 지원으로 맞춤화 가능

입력 가격

$0.300

per 1M tokens

출력 가격

$1.20

per 1M tokens

캐시된 입력

$0.080

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 128K

최대 출력: 16,000 tokens

지식 기준일: 2025-03

비전함수 호출파인튜닝JSON 모드무료 등급

장점

강력한 이중 언어 성능
128K 컨텍스트
16K 최대 출력
비용 효율적

단점

GLM-4.6보다 덜 강력함
비전 없음
더 작은 모델 생태계

성능

출력 속도~75 tok/s

속도 제한8,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU

76.8%

C-Eval

83.1%

GLM-4-Plus

Mid-tier

일반 목적, API 통합

공식 가격

사용 시기: 예산 친화적인 가격으로 일반 목적 API 통합, 챗봇 및 콘텐츠 생성에 사용합니다.

업그레이드 하이라이트

◆대부분의 사용 사례에 적합한 다재다능한 중간 계층 모델
◆$0.20/1M 입력으로 128K 컨텍스트
◆도구 사용을 위한 전체 함수 호출
◆파인튜닝 가능

입력 가격

$0.200

per 1M tokens

출력 가격

$0.800

per 1M tokens

캐시된 입력

$0.050

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 128K

최대 출력: 8,192 tokens

지식 기준일: 2025-03

비전함수 호출파인튜닝JSON 모드무료 등급

장점

좋은 올라운더
128K 컨텍스트
합리적인 가격
함수 호출

단점

최대 8K 출력
비전 없음
복잡한 추론에 약함

성능

출력 속도~85 tok/s

속도 제한10,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU

73.5%

C-Eval

79.8%

GLM-4-Flash

Lite

고처리량, 저지연 작업

공식 가격

사용 시기: 분류, 요약, 간단한 Q&A와 같이 속도와 비용이 중요한 대량 작업.

업그레이드 하이라이트

◆가장 빠른 GLM 모델 — 처리량 최적화
◆$0.05/1M 입력 — 초저예산 친화적
◆라이트 티어에도 128K 컨텍스트
◆무료 티어: 개발용 하루 100만 토큰

입력 가격

$0.050

per 1M tokens

출력 가격

$0.200

per 1M tokens

캐시된 입력

$0.010

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 128K

최대 출력: 8,192 tokens

지식 기준일: 2025-03

비전함수 호출파인튜닝JSON 모드무료 등급

장점

매우 빠른 추론
128K 컨텍스트
매우 낮은 비용
무료 티어 제공

단점

기본 추론만 가능
파인튜닝 불가
비전 기능 없음

성능

출력 속도~200 tok/s

속도 제한30,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU

65.2%

C-Eval

72.1%

GLM-4V-Plus

Mid-tier

중국어 멀티모달, 문서 AI

공식 가격

사용 시기: 중국어 문서 분석, 영수증/인보이스 처리, 중국 시장용 시각적 Q&A.

업그레이드 하이라이트

◆강력한 중국어 OCR을 갖춘 네이티브 멀티모달
◆문서 AI: 영수증, 인보이스, 양식
◆중국어 콘텐츠에 최적화된 시각적 Q&A
◆멀티모달 에이전트 워크플로우를 위한 함수 호출

입력 가격

$0.300

per 1M tokens

출력 가격

$1.20

per 1M tokens

캐시된 입력

$0.080

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 8K

최대 출력: 4,096 tokens

지식 기준일: 2025-03

비전함수 호출파인튜닝JSON 모드무료 등급

장점

네이티브 비전-언어
강력한 중국어 OCR
문서 및 차트 이해
함수 호출

단점

8K 컨텍스트만 지원
최대 출력 4K
파인튜닝 불가

성능

출력 속도~50 tok/s

속도 제한3,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMMU (CN)

62.8%

DocVQA

85.3%

나란히 비교

모델	등급	입력	출력	캐시됨	컨텍스트	최대 출력
GLM-5.1	Flagship	$0.830	$3.31	$0.170	1M	16,384
GLM-4.6	Flagship	$0.500	$2.00	$0.100	128K	16,000
GLM-4.5	Mid-tier	$0.300	$1.20	$0.080	128K	16,000
GLM-4-Plus	Mid-tier	$0.200	$0.800	$0.050	128K	8,192
GLM-4-Flash	Lite	$0.050	$0.200	$0.010	128K	8,192
GLM-4V-Plus	Mid-tier	$0.300	$1.20	$0.080	8K	4,096