개발자 영역으로 돌아가기공식 가격 공식 가격 공식 가격 공식 가격 공식 가격 공식 가격 공식 가격 공식 가격 공식 가격 공식 가격
Alibaba Cloud 모델
Alibaba Cloud의 모든 11개 모델을 자세한 가격, 장단점 및 개발자 추천과 함께 살펴보세요.
11
모델
$0.0000
최저 입력
1M
최대 컨텍스트
3
품질 등급
빠른 추천
최고 가성비: Qwen-RobotWorld ($0.0000/1M)
최고 품질: Qwen3.7-Max
Qwen3.7-Max
Flagship장기 에이전트 워크플로우, 코딩 에이전트, 복잡한 추론
사용 시기: 긴 자율 실행이 필요한 최첨단 에이전트 작업, 복잡한 다단계 코딩 작업 및 심층 연구 분석.
업그레이드 하이라이트
- ◆100만 토큰 컨텍스트 — 문서 중심 에이전트 작업의 제한 제거
- ◆65K 최대 출력 — 대규모 단일 생성
- ◆35시간 지속 자율 커널 최적화 (1,158회 도구 호출)
- ◆SWE-Verified 80.4, LiveCodeBench 91.6 — Claude Opus 4.6과 경쟁
- ◆OpenAI + Anthropic API 호환 — 드롭인 교체
입력 가격
$2.50
per 1M tokens
출력 가격
$7.50
per 1M tokens
캐시된 입력
$0.250
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 1M
최대 출력: 65,536 tokens
지식 기준일: 2026-05
비전함수 호출파인튜닝JSON 모드
장점
- 문서 중심 에이전트 작업을 위한 100만 컨텍스트 창
- Qwen 제품군 중 가장 긴 65K 최대 출력
- 크로스 하네스 호환성 (Claude Code, OpenClaw, Qwen Code)
- 35시간 지속 자율 실행
- 코딩 벤치마크에서 Claude Opus 4.6과 경쟁
단점
- 독점 — 오픈 가중치 또는 자체 호스팅 불가
- Qwen 3.6 라인보다 높은 비용
- 비전 지원 없음
- API 전용 액세스
성능
출력 속도~55 tok/s
속도 제한2,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU-Pro
89.6%
LiveCodeBench
91.6%
SWE-Verified
80.4%
GPQA Diamond
92.4%
이 모델을 사용하는 에이전트
3Qwen3.7-Plus
Mid-tier멀티모달 작업, 비용 효율적인 에이전트 배포
사용 시기: 긴 컨텍스트 요구 사항과 함께 텍스트, 비디오, 이미지 이해가 필요한 비용 효율적인 멀티모달 배포에 적합합니다.
업그레이드 하이라이트
- ◆멀티모달 입력: 하나의 모델에서 텍스트 + 비디오 + 이미지
- ◆$0.40/100만 토큰의 100만 컨텍스트 — Qwen3.7-Max보다 6배 저렴
- ◆중간 가격대에서 강력한 에이전트 성능
- ◆OpenAI 호환 API
입력 가격
$0.400
per 1M tokens
출력 가격
$1.60
per 1M tokens
캐시된 입력
$0.100
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 1M
최대 출력: 16,384 tokens
지식 기준일: 2026-05
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 중간 가격대의 100만 컨텍스트
- 멀티모달: 텍스트, 비디오, 이미지 입력
- 강력한 속도-성능 균형
- 독점적이지만 매우 저렴함
단점
- 독점적 — 자체 호스팅 불가
- 복잡한 추론에서 Qwen3.7-Max보다 성능이 낮음
- 최대 출력 16K
성능
출력 속도~80 tok/s
속도 제한5,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU-Pro
84.2%
LiveCodeBench
78.5%
MMMU
72.1%
Qwen3-235B-A22B
Flagship복잡한 추론, 다국어 작업
사용 시기: 다국어 작업, 복잡한 추론 및 비용 민감한 프로덕션 배포에 가장 적합한 플래그십 모델입니다.
업그레이드 하이라이트
- ◆MoE 아키텍처: 235B 파라미터, 22B만 활성 — GPT-4급 성능을 1/10 가격으로
- ◆131K 컨텍스트 — 긴 문서와 코드베이스 처리
- ◆100개 이상 언어 지원 — 비영어 작업에 최고 수준
- ◆오픈소스: HuggingFace에서 전체 가중치 제공으로 자체 호스팅 가능
- ◆1M 토큰당 $0.40/$1.20 — GPT-4o보다 90% 저렴
입력 가격
$0.400
per 1M tokens
출력 가격
$1.20
per 1M tokens
캐시된 입력
$0.100
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- MoE 235B 총 / 22B 활성 — 저비용으로 플래그십 성능
- 131K 컨텍스트 윈도우
- 강력한 다국어 지원(100개 이상 언어)
- 오픈소스 가중치 제공
단점
- 비전 지원 없음
- 최대 출력 8K 토큰
- GPT-4보다 생태계 통합 부족
성능
출력 속도~70 tok/s
속도 제한5,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU
86.8%
LiveCodeBench
63.7%
IFEval
86.2%
이 모델을 사용하는 에이전트
2Qwen3-30B-A3B
Mid-tier효율적인 다국어 추론
사용 시기: 비용 효율성이 가장 중요한 고처리량 다국어 작업.
업그레이드 하이라이트
- ◆3B 활성 파라미터만 — 소비자 GPU에서 실행 가능
- ◆$0.15/1M 입력에 131K 컨텍스트 — 가장 저렴한 긴 컨텍스트 옵션
- ◆완전 맞춤형 오픈소스
- ◆에이전트 워크플로우를 위한 강력한 함수 호출
입력 가격
$0.150
per 1M tokens
출력 가격
$0.600
per 1M tokens
캐시된 입력
$0.040
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- MoE 30B 총 / 3B 활성 — 초고효율
- 131K 컨텍스트
- 뛰어난 비용 대비 성능
- 오픈소스
단점
- 작은 활성 파라미터로 복잡한 추론 제한
- 비전 없음
- 최대 8K 출력
성능
출력 속도~120 tok/s
속도 제한10,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU
78.5%
LiveCodeBench
48.2%
Qwen3-32B
Mid-tier균형 잡힌 성능과 비용
사용 시기: 코딩 및 일반 작업에 신뢰할 수 있는 고밀도 모델 성능이 필요할 때 사용하세요.
업그레이드 하이라이트
- ◆고밀도 32B 아키텍처 — MoE 라우팅 오버헤드 없음
- ◆장문 콘텐츠를 위한 131K 컨텍스트
- ◆강력한 코딩: LiveCodeBench 55.3%
- ◆HuggingFace 완전 지원 오픈소스
입력 가격
$0.200
per 1M tokens
출력 가격
$0.600
per 1M tokens
캐시된 입력
$0.050
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 고밀도 32B — 일관된 성능
- 131K 컨텍스트
- 강력한 코딩 능력
- 오픈소스
단점
- 비전 미지원
- 최대 8K 출력
- MoE 변형보다 높은 지연 시간
성능
출력 속도~65 tok/s
속도 제한5,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU
83.2%
LiveCodeBench
55.3%
Qwen3-14B
Lite가벼운 일반 작업
사용 시기: 요약, 번역 및 간단한 Q&A를 위한 예산 친화적 옵션입니다.
업그레이드 하이라이트
- ◆14B 밀집 — 단일 GPU에 적합
- ◆131K 컨텍스트, $0.10/1M 입력
- ◆대부분의 일상 작업에 충분히 좋음
- ◆미세 조정을 위한 오픈소스
입력 가격
$0.100
per 1M tokens
출력 가격
$0.300
per 1M tokens
캐시된 입력
$0.030
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 컴팩트한 14B 밀집 모델
- 131K 컨텍스트
- 매우 저렴한 비용
- 오픈소스
단점
- 제한된 복잡한 추론
- 비전 없음
- 최대 8K 출력
성능
출력 속도~90 tok/s
속도 제한10,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU
77.1%
LiveCodeBench
42.8%
Qwen3-8B
Lite엣지 배포, 간단한 작업
사용 시기: 엣지 디바이스, 로컬 배포 또는 초저가 배치 처리에 적합합니다.
업그레이드 하이라이트
- ◆8B 파라미터 — RTX 3060 또는 동급에서 실행 가능
- ◆$0.05/1M 입력 — 가장 저렴한 옵션 중 하나
- ◆작은 크기임에도 131K 컨텍스트
- ◆로컬/오프라인 배포에 이상적
입력 가격
$0.050
per 1M tokens
출력 가격
$0.150
per 1M tokens
캐시된 입력
$0.010
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 초소형 8B — 노트북 GPU에서 실행 가능
- 131K 컨텍스트
- 매우 저렴함
- 오픈소스
단점
- 기본적인 추론만 가능
- 비전 미지원
- 최대 8K 출력
성능
출력 속도~150 tok/s
속도 제한20,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMLU
71.5%
LiveCodeBench
33.1%
Qwen-VL-Plus
Mid-tier멀티모달 이해, 문서 분석
사용 시기: 문서 분석, 이미지 캡셔닝, 시각적 Q&A 및 멀티모달 RAG 파이프라인.
업그레이드 하이라이트
- ◆네이티브 멀티모달 — 이미지와 텍스트를 함께 처리
- ◆131K 컨텍스트로 여러 페이지 문서 처리
- ◆강력한 OCR: 차트, 표, 다이어그램 이해
- ◆100개 이상 언어 지원 다국어 VQA
입력 가격
$0.200
per 1M tokens
출력 가격
$0.800
per 1M tokens
캐시된 입력
$0.050
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 네이티브 비전-언어 모델
- 131K 컨텍스트 및 이미지 지원
- 강력한 문서 OCR 및 차트 이해
- 다국어 VQA
단점
- 파인튜닝 불가
- 최대 출력 8K
- 텍스트 전용 Qwen3보다 높은 비용
성능
출력 속도~55 tok/s
속도 제한3,000 RPM
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
벤치마크
MMMU
68.2%
MathVista
62.5%
Qwen-RobotManip
Flagship로봇 조작, 손재주 있는 손 제어
사용 시기: 로봇 조작 작업: 연구 및 산업 환경에서 잡기, 조립, 손재주 있는 손 제어.
업그레이드 하이라이트
- ◆최초의 Qwen-Robot VLA 조작 모델
- ◆38,100시간 이상의 오픈소스 훈련 데이터
- ◆로봇 유형 간 통합 상태-동작 공간
- ◆카메라 프레임 엔드 이펙터 증분 포즈 제어
- ◆완전한 Qwen-Robot Suite(조작 + 탐색 + 세계)의 일부
입력 가격
$0.0000
per 1M tokens
출력 가격
$0.0000
per 1M tokens
캐시된 입력
—
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 0
최대 출력: 0 tokens
지식 기준일: 2026-06
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 정밀 로봇 조작을 위한 VLA 모델
- 오픈소스 데이터로 38,100시간 이상 훈련
- 통합 동작 공간을 통한 다중 로봇 유형 지원
- Apache 2.0 라이선스로 오픈소스
단점
- 로봇 전용 — 일반 LLM 아님
- 배포를 위해 로봇 하드웨어 또는 시뮬레이터 필요
- 텍스트 생성 기능 없음
- 매우 신규 — 커뮤니티 채택 제한적
성능
출력 속도—
속도 제한—
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
Qwen-RobotWorld
Flagship물리적 세계 예측, 로봇 계획
사용 시기: 로봇 계획 및 세계 시뮬레이션: 조작, 주행 및 내비게이션 시나리오에서 행동 결과를 예측합니다.
업그레이드 하이라이트
- ◆세계 모델: 물리적으로 가능한 미래 예측
- ◆교차 장면: 조작, 주행, 내비게이션에서 작동
- ◆자연어 액션 인터페이스
- ◆오픈소스: 연구 및 배포를 위한 전체 가중치
- ◆완전한 Qwen-Robot Suite(Manip + Nav + World)의 일부
입력 가격
$0.0000
per 1M tokens
출력 가격
$0.0000
per 1M tokens
캐시된 입력
—
per 1M tokens
배치 입력
—
per 1M tokens
컨텍스트 창: 0
최대 출력: 0 tokens
지식 기준일: 2026-06
비전함수 호출파인튜닝JSON 모드무료 등급
장점
- 물리적으로 가능한 미래를 예측하는 세계 모델
- 교차 장면: 조작, 주행 및 내비게이션
- 직관적인 제어를 위한 자연어 액션 인터페이스
- Apache 2.0에 따른 오픈소스
단점
- 세계 시뮬레이션에만 특화됨
- 텍스트 생성 또는 로봇 제어 없음
- 전체 스택을 위해 Manip/Nav와 통합 필요
- 매우 신규 — 제한된 벤치마크만 사용 가능
성능
출력 속도—
속도 제한—
멀티모달
이미지 입력이미지 출력오디오 입력오디오 출력
나란히 비교
| 모델 | 등급 | 입력 | 출력 | 컨텍스트 |
|---|---|---|---|---|
| Qwen3.7-Max | Flagship | $2.50 | $7.50 | 1M |
| Qwen3.7-Plus | Mid-tier | $0.400 | $1.60 | 1M |
| Qwen3-235B-A22B | Flagship | $0.400 | $1.20 | 131K |
| Qwen3-30B-A3B | Mid-tier | $0.150 | $0.600 | 131K |
| Qwen3-32B | Mid-tier | $0.200 | $0.600 | 131K |
| Qwen3-14B | Lite | $0.100 | $0.300 | 131K |
| Qwen3-8B | Lite | $0.050 | $0.150 | 131K |
| Qwen-VL-Plus | Mid-tier | $0.200 | $0.800 | 131K |
| Qwen-RobotManip | Flagship | $0.0000 | $0.0000 | 0 |
| Qwen-RobotNav | Flagship | $0.0000 | $0.0000 | 0 |
| Qwen-RobotWorld | Flagship | $0.0000 | $0.0000 | 0 |