Alibaba Cloud 모델

Alibaba Cloud의 모든 11개 모델을 자세한 가격, 장단점 및 개발자 추천과 함께 살펴보세요.

모델

$0.0000

최저 입력

최대 컨텍스트

품질 등급

빠른 추천

최고 가성비: Qwen-RobotWorld ($0.0000/1M)

최고 품질: Qwen3.7-Max

Qwen3.7-Max

Flagship

장기 에이전트 워크플로우, 코딩 에이전트, 복잡한 추론

공식 가격

사용 시기: 긴 자율 실행이 필요한 최첨단 에이전트 작업, 복잡한 다단계 코딩 작업 및 심층 연구 분석.

업그레이드 하이라이트

◆100만 토큰 컨텍스트 — 문서 중심 에이전트 작업의 제한 제거
◆65K 최대 출력 — 대규모 단일 생성
◆35시간 지속 자율 커널 최적화 (1,158회 도구 호출)
◆SWE-Verified 80.4, LiveCodeBench 91.6 — Claude Opus 4.6과 경쟁
◆OpenAI + Anthropic API 호환 — 드롭인 교체

입력 가격

$2.50

per 1M tokens

출력 가격

$7.50

per 1M tokens

캐시된 입력

$0.250

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 1M

최대 출력: 65,536 tokens

지식 기준일: 2026-05

비전함수 호출파인튜닝JSON 모드

장점

문서 중심 에이전트 작업을 위한 100만 컨텍스트 창
Qwen 제품군 중 가장 긴 65K 최대 출력
크로스 하네스 호환성 (Claude Code, OpenClaw, Qwen Code)
35시간 지속 자율 실행
코딩 벤치마크에서 Claude Opus 4.6과 경쟁

단점

독점 — 오픈 가중치 또는 자체 호스팅 불가
Qwen 3.6 라인보다 높은 비용
비전 지원 없음
API 전용 액세스

성능

출력 속도~55 tok/s

속도 제한2,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU-Pro

89.6%

LiveCodeBench

91.6%

SWE-Verified

80.4%

GPQA Diamond

92.4%

이 모델을 사용하는 에이전트

QoderWork Qoder Cloud Agents JVS Agent Suite

Qwen3.7-Plus

Mid-tier

멀티모달 작업, 비용 효율적인 에이전트 배포

공식 가격

사용 시기: 긴 컨텍스트 요구 사항과 함께 텍스트, 비디오, 이미지 이해가 필요한 비용 효율적인 멀티모달 배포에 적합합니다.

업그레이드 하이라이트

◆멀티모달 입력: 하나의 모델에서 텍스트 + 비디오 + 이미지
◆$0.40/100만 토큰의 100만 컨텍스트 — Qwen3.7-Max보다 6배 저렴
◆중간 가격대에서 강력한 에이전트 성능
◆OpenAI 호환 API

입력 가격

$0.400

per 1M tokens

출력 가격

$1.60

per 1M tokens

캐시된 입력

$0.100

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 1M

최대 출력: 16,384 tokens

지식 기준일: 2026-05

비전함수 호출파인튜닝JSON 모드무료 등급

장점

중간 가격대의 100만 컨텍스트
멀티모달: 텍스트, 비디오, 이미지 입력
강력한 속도-성능 균형
독점적이지만 매우 저렴함

단점

독점적 — 자체 호스팅 불가
복잡한 추론에서 Qwen3.7-Max보다 성능이 낮음
최대 출력 16K

성능

출력 속도~80 tok/s

속도 제한5,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU-Pro

84.2%

LiveCodeBench

78.5%

MMMU

72.1%

Qwen3-235B-A22B

Flagship

복잡한 추론, 다국어 작업

공식 가격

사용 시기: 다국어 작업, 복잡한 추론 및 비용 민감한 프로덕션 배포에 가장 적합한 플래그십 모델입니다.

업그레이드 하이라이트

◆MoE 아키텍처: 235B 파라미터, 22B만 활성 — GPT-4급 성능을 1/10 가격으로
◆131K 컨텍스트 — 긴 문서와 코드베이스 처리
◆100개 이상 언어 지원 — 비영어 작업에 최고 수준
◆오픈소스: HuggingFace에서 전체 가중치 제공으로 자체 호스팅 가능
◆1M 토큰당 $0.40/$1.20 — GPT-4o보다 90% 저렴

입력 가격

$0.400

per 1M tokens

출력 가격

$1.20

per 1M tokens

캐시된 입력

$0.100

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 131K

최대 출력: 8,192 tokens

지식 기준일: 2025-04

비전함수 호출파인튜닝JSON 모드무료 등급

장점

MoE 235B 총 / 22B 활성 — 저비용으로 플래그십 성능
131K 컨텍스트 윈도우
강력한 다국어 지원(100개 이상 언어)
오픈소스 가중치 제공

단점

비전 지원 없음
최대 출력 8K 토큰
GPT-4보다 생태계 통합 부족

성능

출력 속도~70 tok/s

속도 제한5,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU

86.8%

LiveCodeBench

63.7%

IFEval

86.2%

이 모델을 사용하는 에이전트

Smolagents Dify

Qwen3-30B-A3B

Mid-tier

효율적인 다국어 추론

공식 가격

사용 시기: 비용 효율성이 가장 중요한 고처리량 다국어 작업.

업그레이드 하이라이트

◆3B 활성 파라미터만 — 소비자 GPU에서 실행 가능
◆$0.15/1M 입력에 131K 컨텍스트 — 가장 저렴한 긴 컨텍스트 옵션
◆완전 맞춤형 오픈소스
◆에이전트 워크플로우를 위한 강력한 함수 호출

입력 가격

$0.150

per 1M tokens

출력 가격

$0.600

per 1M tokens

캐시된 입력

$0.040

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 131K

최대 출력: 8,192 tokens

지식 기준일: 2025-04

비전함수 호출파인튜닝JSON 모드무료 등급

장점

MoE 30B 총 / 3B 활성 — 초고효율
131K 컨텍스트
뛰어난 비용 대비 성능
오픈소스

단점

작은 활성 파라미터로 복잡한 추론 제한
비전 없음
최대 8K 출력

성능

출력 속도~120 tok/s

속도 제한10,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU

78.5%

LiveCodeBench

48.2%

Qwen3-32B

Mid-tier

균형 잡힌 성능과 비용

공식 가격

사용 시기: 코딩 및 일반 작업에 신뢰할 수 있는 고밀도 모델 성능이 필요할 때 사용하세요.

업그레이드 하이라이트

◆고밀도 32B 아키텍처 — MoE 라우팅 오버헤드 없음
◆장문 콘텐츠를 위한 131K 컨텍스트
◆강력한 코딩: LiveCodeBench 55.3%
◆HuggingFace 완전 지원 오픈소스

입력 가격

$0.200

per 1M tokens

출력 가격

$0.600

per 1M tokens

캐시된 입력

$0.050

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 131K

최대 출력: 8,192 tokens

지식 기준일: 2025-04

비전함수 호출파인튜닝JSON 모드무료 등급

장점

고밀도 32B — 일관된 성능
131K 컨텍스트
강력한 코딩 능력
오픈소스

단점

비전 미지원
최대 8K 출력
MoE 변형보다 높은 지연 시간

성능

출력 속도~65 tok/s

속도 제한5,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU

83.2%

LiveCodeBench

55.3%

Qwen3-14B

Lite

가벼운 일반 작업

공식 가격

사용 시기: 요약, 번역 및 간단한 Q&A를 위한 예산 친화적 옵션입니다.

업그레이드 하이라이트

◆14B 밀집 — 단일 GPU에 적합
◆131K 컨텍스트, $0.10/1M 입력
◆대부분의 일상 작업에 충분히 좋음
◆미세 조정을 위한 오픈소스

입력 가격

$0.100

per 1M tokens

출력 가격

$0.300

per 1M tokens

캐시된 입력

$0.030

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 131K

최대 출력: 8,192 tokens

지식 기준일: 2025-04

비전함수 호출파인튜닝JSON 모드무료 등급

장점

컴팩트한 14B 밀집 모델
131K 컨텍스트
매우 저렴한 비용
오픈소스

단점

제한된 복잡한 추론
비전 없음
최대 8K 출력

성능

출력 속도~90 tok/s

속도 제한10,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU

77.1%

LiveCodeBench

42.8%

Qwen3-8B

Lite

엣지 배포, 간단한 작업

공식 가격

사용 시기: 엣지 디바이스, 로컬 배포 또는 초저가 배치 처리에 적합합니다.

업그레이드 하이라이트

◆8B 파라미터 — RTX 3060 또는 동급에서 실행 가능
◆$0.05/1M 입력 — 가장 저렴한 옵션 중 하나
◆작은 크기임에도 131K 컨텍스트
◆로컬/오프라인 배포에 이상적

입력 가격

$0.050

per 1M tokens

출력 가격

$0.150

per 1M tokens

캐시된 입력

$0.010

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 131K

최대 출력: 8,192 tokens

지식 기준일: 2025-04

비전함수 호출파인튜닝JSON 모드무료 등급

장점

초소형 8B — 노트북 GPU에서 실행 가능
131K 컨텍스트
매우 저렴함
오픈소스

단점

기본적인 추론만 가능
비전 미지원
최대 8K 출력

성능

출력 속도~150 tok/s

속도 제한20,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU

71.5%

LiveCodeBench

33.1%

Qwen-VL-Plus

Mid-tier

멀티모달 이해, 문서 분석

공식 가격

사용 시기: 문서 분석, 이미지 캡셔닝, 시각적 Q&A 및 멀티모달 RAG 파이프라인.

업그레이드 하이라이트

◆네이티브 멀티모달 — 이미지와 텍스트를 함께 처리
◆131K 컨텍스트로 여러 페이지 문서 처리
◆강력한 OCR: 차트, 표, 다이어그램 이해
◆100개 이상 언어 지원 다국어 VQA

입력 가격

$0.200

per 1M tokens

출력 가격

$0.800

per 1M tokens

캐시된 입력

$0.050

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 131K

최대 출력: 8,192 tokens

지식 기준일: 2025-04

비전함수 호출파인튜닝JSON 모드무료 등급

장점

네이티브 비전-언어 모델
131K 컨텍스트 및 이미지 지원
강력한 문서 OCR 및 차트 이해
다국어 VQA

단점

파인튜닝 불가
최대 출력 8K
텍스트 전용 Qwen3보다 높은 비용

성능

출력 속도~55 tok/s

속도 제한3,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMMU

68.2%

MathVista

62.5%

Qwen-RobotManip

Flagship

로봇 조작, 손재주 있는 손 제어

공식 가격

사용 시기: 로봇 조작 작업: 연구 및 산업 환경에서 잡기, 조립, 손재주 있는 손 제어.

업그레이드 하이라이트

◆최초의 Qwen-Robot VLA 조작 모델
◆38,100시간 이상의 오픈소스 훈련 데이터
◆로봇 유형 간 통합 상태-동작 공간
◆카메라 프레임 엔드 이펙터 증분 포즈 제어
◆완전한 Qwen-Robot Suite(조작 + 탐색 + 세계)의 일부

입력 가격

$0.0000

per 1M tokens

출력 가격

$0.0000

per 1M tokens

캐시된 입력

—

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 0

최대 출력: 0 tokens

지식 기준일: 2026-06

비전함수 호출파인튜닝JSON 모드무료 등급

장점

정밀 로봇 조작을 위한 VLA 모델
오픈소스 데이터로 38,100시간 이상 훈련
통합 동작 공간을 통한 다중 로봇 유형 지원
Apache 2.0 라이선스로 오픈소스

단점

로봇 전용 — 일반 LLM 아님
배포를 위해 로봇 하드웨어 또는 시뮬레이터 필요
텍스트 생성 기능 없음
매우 신규 — 커뮤니티 채택 제한적

성능

출력 속도—

속도 제한—

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

Qwen-RobotNav

Flagship

로봇 내비게이션, 경로 계획, 자율 주행

공식 가격

사용 시기: 모바일 로봇 내비게이션: 명령 따르기, 포인트 내비게이션, 객체 추적 및 자율 주행 작업에 사용합니다.

업그레이드 하이라이트

◆물리적 에이전트를 위한 VLN 모델: 비전-언어 내비게이션
◆4가지 작업 유형 통합: 명령, 포인트/목표, 추적, 주행
◆제어된 관찰 인코딩 + 도구 인터페이스
◆오픈소스: 맞춤 설정을 위한 전체 가중치 제공
◆완전한 Qwen-Robot Suite(조작 + 내비게이션 + 세계)의 일부

입력 가격

$0.0000

per 1M tokens

출력 가격

$0.0000

per 1M tokens

캐시된 입력

—

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 0

최대 출력: 0 tokens

지식 기준일: 2026-06

비전함수 호출파인튜닝JSON 모드무료 등급

장점

4가지 내비게이션 작업 유형을 통합한 VLN 모델
3D 공간 인식을 위한 제어된 관찰 인코딩
명령 따르기, 포인트/목표 내비게이션, 추적, 주행 지원
Apache 2.0 라이선스로 오픈소스

단점

로봇 내비게이션에만 특화됨
로봇 하드웨어 또는 시뮬레이터 필요
텍스트 생성 불가
매우 신규 — 실제 검증 제한적

성능

출력 속도—

속도 제한—

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

Qwen-RobotWorld

Flagship

물리적 세계 예측, 로봇 계획

공식 가격

사용 시기: 로봇 계획 및 세계 시뮬레이션: 조작, 주행 및 내비게이션 시나리오에서 행동 결과를 예측합니다.

업그레이드 하이라이트

◆세계 모델: 물리적으로 가능한 미래 예측
◆교차 장면: 조작, 주행, 내비게이션에서 작동
◆자연어 액션 인터페이스
◆오픈소스: 연구 및 배포를 위한 전체 가중치
◆완전한 Qwen-Robot Suite(Manip + Nav + World)의 일부

입력 가격

$0.0000

per 1M tokens

출력 가격

$0.0000

per 1M tokens

캐시된 입력

—

per 1M tokens

배치 입력

—

per 1M tokens

컨텍스트 창: 0

최대 출력: 0 tokens

지식 기준일: 2026-06

비전함수 호출파인튜닝JSON 모드무료 등급

장점

물리적으로 가능한 미래를 예측하는 세계 모델
교차 장면: 조작, 주행 및 내비게이션
직관적인 제어를 위한 자연어 액션 인터페이스
Apache 2.0에 따른 오픈소스

단점

세계 시뮬레이션에만 특화됨
텍스트 생성 또는 로봇 제어 없음
전체 스택을 위해 Manip/Nav와 통합 필요
매우 신규 — 제한된 벤치마크만 사용 가능

성능

출력 속도—

속도 제한—

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

나란히 비교

모델	등급	입력	출력	캐시됨	컨텍스트	최대 출력
Qwen3.7-Max	Flagship	$2.50	$7.50	$0.250	1M	65,536
Qwen3.7-Plus	Mid-tier	$0.400	$1.60	$0.100	1M	16,384
Qwen3-235B-A22B	Flagship	$0.400	$1.20	$0.100	131K	8,192
Qwen3-30B-A3B	Mid-tier	$0.150	$0.600	$0.040	131K	8,192
Qwen3-32B	Mid-tier	$0.200	$0.600	$0.050	131K	8,192
Qwen3-14B	Lite	$0.100	$0.300	$0.030	131K	8,192
Qwen3-8B	Lite	$0.050	$0.150	$0.010	131K	8,192
Qwen-VL-Plus	Mid-tier	$0.200	$0.800	$0.050	131K	8,192
Qwen-RobotManip	Flagship	$0.0000	$0.0000	—	0	0
Qwen-RobotNav	Flagship	$0.0000	$0.0000	—	0	0
Qwen-RobotWorld	Flagship	$0.0000	$0.0000	—	0	0