개발자 영역으로 돌아가기

Alibaba Cloud 모델

Alibaba Cloud의 모든 11개 모델을 자세한 가격, 장단점 및 개발자 추천과 함께 살펴보세요.

11
모델
$0.0000
최저 입력
1M
최대 컨텍스트
3
품질 등급

빠른 추천

최고 가성비: Qwen-RobotWorld ($0.0000/1M)
최고 품질: Qwen3.7-Max

Qwen3.7-Max

Flagship

장기 에이전트 워크플로우, 코딩 에이전트, 복잡한 추론

공식 가격

사용 시기: 긴 자율 실행이 필요한 최첨단 에이전트 작업, 복잡한 다단계 코딩 작업 및 심층 연구 분석.

업그레이드 하이라이트

  • 100만 토큰 컨텍스트 — 문서 중심 에이전트 작업의 제한 제거
  • 65K 최대 출력 — 대규모 단일 생성
  • 35시간 지속 자율 커널 최적화 (1,158회 도구 호출)
  • SWE-Verified 80.4, LiveCodeBench 91.6 — Claude Opus 4.6과 경쟁
  • OpenAI + Anthropic API 호환 — 드롭인 교체
입력 가격
$2.50
per 1M tokens
출력 가격
$7.50
per 1M tokens
캐시된 입력
$0.250
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 1M
최대 출력: 65,536 tokens
지식 기준일: 2026-05
비전함수 호출파인튜닝JSON 모드

장점

  • 문서 중심 에이전트 작업을 위한 100만 컨텍스트 창
  • Qwen 제품군 중 가장 긴 65K 최대 출력
  • 크로스 하네스 호환성 (Claude Code, OpenClaw, Qwen Code)
  • 35시간 지속 자율 실행
  • 코딩 벤치마크에서 Claude Opus 4.6과 경쟁

단점

  • 독점 — 오픈 가중치 또는 자체 호스팅 불가
  • Qwen 3.6 라인보다 높은 비용
  • 비전 지원 없음
  • API 전용 액세스

성능

출력 속도~55 tok/s
속도 제한2,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU-Pro
89.6%
LiveCodeBench
91.6%
SWE-Verified
80.4%
GPQA Diamond
92.4%

이 모델을 사용하는 에이전트

3

Qwen3.7-Plus

Mid-tier

멀티모달 작업, 비용 효율적인 에이전트 배포

공식 가격

사용 시기: 긴 컨텍스트 요구 사항과 함께 텍스트, 비디오, 이미지 이해가 필요한 비용 효율적인 멀티모달 배포에 적합합니다.

업그레이드 하이라이트

  • 멀티모달 입력: 하나의 모델에서 텍스트 + 비디오 + 이미지
  • $0.40/100만 토큰의 100만 컨텍스트 — Qwen3.7-Max보다 6배 저렴
  • 중간 가격대에서 강력한 에이전트 성능
  • OpenAI 호환 API
입력 가격
$0.400
per 1M tokens
출력 가격
$1.60
per 1M tokens
캐시된 입력
$0.100
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 1M
최대 출력: 16,384 tokens
지식 기준일: 2026-05
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 중간 가격대의 100만 컨텍스트
  • 멀티모달: 텍스트, 비디오, 이미지 입력
  • 강력한 속도-성능 균형
  • 독점적이지만 매우 저렴함

단점

  • 독점적 — 자체 호스팅 불가
  • 복잡한 추론에서 Qwen3.7-Max보다 성능이 낮음
  • 최대 출력 16K

성능

출력 속도~80 tok/s
속도 제한5,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU-Pro
84.2%
LiveCodeBench
78.5%
MMMU
72.1%

Qwen3-235B-A22B

Flagship

복잡한 추론, 다국어 작업

공식 가격

사용 시기: 다국어 작업, 복잡한 추론 및 비용 민감한 프로덕션 배포에 가장 적합한 플래그십 모델입니다.

업그레이드 하이라이트

  • MoE 아키텍처: 235B 파라미터, 22B만 활성 — GPT-4급 성능을 1/10 가격으로
  • 131K 컨텍스트 — 긴 문서와 코드베이스 처리
  • 100개 이상 언어 지원 — 비영어 작업에 최고 수준
  • 오픈소스: HuggingFace에서 전체 가중치 제공으로 자체 호스팅 가능
  • 1M 토큰당 $0.40/$1.20 — GPT-4o보다 90% 저렴
입력 가격
$0.400
per 1M tokens
출력 가격
$1.20
per 1M tokens
캐시된 입력
$0.100
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • MoE 235B 총 / 22B 활성 — 저비용으로 플래그십 성능
  • 131K 컨텍스트 윈도우
  • 강력한 다국어 지원(100개 이상 언어)
  • 오픈소스 가중치 제공

단점

  • 비전 지원 없음
  • 최대 출력 8K 토큰
  • GPT-4보다 생태계 통합 부족

성능

출력 속도~70 tok/s
속도 제한5,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU
86.8%
LiveCodeBench
63.7%
IFEval
86.2%

이 모델을 사용하는 에이전트

2

Qwen3-30B-A3B

Mid-tier

효율적인 다국어 추론

공식 가격

사용 시기: 비용 효율성이 가장 중요한 고처리량 다국어 작업.

업그레이드 하이라이트

  • 3B 활성 파라미터만 — 소비자 GPU에서 실행 가능
  • $0.15/1M 입력에 131K 컨텍스트 — 가장 저렴한 긴 컨텍스트 옵션
  • 완전 맞춤형 오픈소스
  • 에이전트 워크플로우를 위한 강력한 함수 호출
입력 가격
$0.150
per 1M tokens
출력 가격
$0.600
per 1M tokens
캐시된 입력
$0.040
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • MoE 30B 총 / 3B 활성 — 초고효율
  • 131K 컨텍스트
  • 뛰어난 비용 대비 성능
  • 오픈소스

단점

  • 작은 활성 파라미터로 복잡한 추론 제한
  • 비전 없음
  • 최대 8K 출력

성능

출력 속도~120 tok/s
속도 제한10,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU
78.5%
LiveCodeBench
48.2%

Qwen3-32B

Mid-tier

균형 잡힌 성능과 비용

공식 가격

사용 시기: 코딩 및 일반 작업에 신뢰할 수 있는 고밀도 모델 성능이 필요할 때 사용하세요.

업그레이드 하이라이트

  • 고밀도 32B 아키텍처 — MoE 라우팅 오버헤드 없음
  • 장문 콘텐츠를 위한 131K 컨텍스트
  • 강력한 코딩: LiveCodeBench 55.3%
  • HuggingFace 완전 지원 오픈소스
입력 가격
$0.200
per 1M tokens
출력 가격
$0.600
per 1M tokens
캐시된 입력
$0.050
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 고밀도 32B — 일관된 성능
  • 131K 컨텍스트
  • 강력한 코딩 능력
  • 오픈소스

단점

  • 비전 미지원
  • 최대 8K 출력
  • MoE 변형보다 높은 지연 시간

성능

출력 속도~65 tok/s
속도 제한5,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU
83.2%
LiveCodeBench
55.3%

Qwen3-14B

Lite

가벼운 일반 작업

공식 가격

사용 시기: 요약, 번역 및 간단한 Q&A를 위한 예산 친화적 옵션입니다.

업그레이드 하이라이트

  • 14B 밀집 — 단일 GPU에 적합
  • 131K 컨텍스트, $0.10/1M 입력
  • 대부분의 일상 작업에 충분히 좋음
  • 미세 조정을 위한 오픈소스
입력 가격
$0.100
per 1M tokens
출력 가격
$0.300
per 1M tokens
캐시된 입력
$0.030
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 컴팩트한 14B 밀집 모델
  • 131K 컨텍스트
  • 매우 저렴한 비용
  • 오픈소스

단점

  • 제한된 복잡한 추론
  • 비전 없음
  • 최대 8K 출력

성능

출력 속도~90 tok/s
속도 제한10,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU
77.1%
LiveCodeBench
42.8%

Qwen3-8B

Lite

엣지 배포, 간단한 작업

공식 가격

사용 시기: 엣지 디바이스, 로컬 배포 또는 초저가 배치 처리에 적합합니다.

업그레이드 하이라이트

  • 8B 파라미터 — RTX 3060 또는 동급에서 실행 가능
  • $0.05/1M 입력 — 가장 저렴한 옵션 중 하나
  • 작은 크기임에도 131K 컨텍스트
  • 로컬/오프라인 배포에 이상적
입력 가격
$0.050
per 1M tokens
출력 가격
$0.150
per 1M tokens
캐시된 입력
$0.010
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 초소형 8B — 노트북 GPU에서 실행 가능
  • 131K 컨텍스트
  • 매우 저렴함
  • 오픈소스

단점

  • 기본적인 추론만 가능
  • 비전 미지원
  • 최대 8K 출력

성능

출력 속도~150 tok/s
속도 제한20,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMLU
71.5%
LiveCodeBench
33.1%

Qwen-VL-Plus

Mid-tier

멀티모달 이해, 문서 분석

공식 가격

사용 시기: 문서 분석, 이미지 캡셔닝, 시각적 Q&A 및 멀티모달 RAG 파이프라인.

업그레이드 하이라이트

  • 네이티브 멀티모달 — 이미지와 텍스트를 함께 처리
  • 131K 컨텍스트로 여러 페이지 문서 처리
  • 강력한 OCR: 차트, 표, 다이어그램 이해
  • 100개 이상 언어 지원 다국어 VQA
입력 가격
$0.200
per 1M tokens
출력 가격
$0.800
per 1M tokens
캐시된 입력
$0.050
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 131K
최대 출력: 8,192 tokens
지식 기준일: 2025-04
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 네이티브 비전-언어 모델
  • 131K 컨텍스트 및 이미지 지원
  • 강력한 문서 OCR 및 차트 이해
  • 다국어 VQA

단점

  • 파인튜닝 불가
  • 최대 출력 8K
  • 텍스트 전용 Qwen3보다 높은 비용

성능

출력 속도~55 tok/s
속도 제한3,000 RPM

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

벤치마크

MMMU
68.2%
MathVista
62.5%

Qwen-RobotManip

Flagship

로봇 조작, 손재주 있는 손 제어

공식 가격

사용 시기: 로봇 조작 작업: 연구 및 산업 환경에서 잡기, 조립, 손재주 있는 손 제어.

업그레이드 하이라이트

  • 최초의 Qwen-Robot VLA 조작 모델
  • 38,100시간 이상의 오픈소스 훈련 데이터
  • 로봇 유형 간 통합 상태-동작 공간
  • 카메라 프레임 엔드 이펙터 증분 포즈 제어
  • 완전한 Qwen-Robot Suite(조작 + 탐색 + 세계)의 일부
입력 가격
$0.0000
per 1M tokens
출력 가격
$0.0000
per 1M tokens
캐시된 입력
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 0
최대 출력: 0 tokens
지식 기준일: 2026-06
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 정밀 로봇 조작을 위한 VLA 모델
  • 오픈소스 데이터로 38,100시간 이상 훈련
  • 통합 동작 공간을 통한 다중 로봇 유형 지원
  • Apache 2.0 라이선스로 오픈소스

단점

  • 로봇 전용 — 일반 LLM 아님
  • 배포를 위해 로봇 하드웨어 또는 시뮬레이터 필요
  • 텍스트 생성 기능 없음
  • 매우 신규 — 커뮤니티 채택 제한적

성능

출력 속도
속도 제한

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

Qwen-RobotNav

Flagship

로봇 내비게이션, 경로 계획, 자율 주행

공식 가격

사용 시기: 모바일 로봇 내비게이션: 명령 따르기, 포인트 내비게이션, 객체 추적 및 자율 주행 작업에 사용합니다.

업그레이드 하이라이트

  • 물리적 에이전트를 위한 VLN 모델: 비전-언어 내비게이션
  • 4가지 작업 유형 통합: 명령, 포인트/목표, 추적, 주행
  • 제어된 관찰 인코딩 + 도구 인터페이스
  • 오픈소스: 맞춤 설정을 위한 전체 가중치 제공
  • 완전한 Qwen-Robot Suite(조작 + 내비게이션 + 세계)의 일부
입력 가격
$0.0000
per 1M tokens
출력 가격
$0.0000
per 1M tokens
캐시된 입력
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 0
최대 출력: 0 tokens
지식 기준일: 2026-06
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 4가지 내비게이션 작업 유형을 통합한 VLN 모델
  • 3D 공간 인식을 위한 제어된 관찰 인코딩
  • 명령 따르기, 포인트/목표 내비게이션, 추적, 주행 지원
  • Apache 2.0 라이선스로 오픈소스

단점

  • 로봇 내비게이션에만 특화됨
  • 로봇 하드웨어 또는 시뮬레이터 필요
  • 텍스트 생성 불가
  • 매우 신규 — 실제 검증 제한적

성능

출력 속도
속도 제한

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

Qwen-RobotWorld

Flagship

물리적 세계 예측, 로봇 계획

공식 가격

사용 시기: 로봇 계획 및 세계 시뮬레이션: 조작, 주행 및 내비게이션 시나리오에서 행동 결과를 예측합니다.

업그레이드 하이라이트

  • 세계 모델: 물리적으로 가능한 미래 예측
  • 교차 장면: 조작, 주행, 내비게이션에서 작동
  • 자연어 액션 인터페이스
  • 오픈소스: 연구 및 배포를 위한 전체 가중치
  • 완전한 Qwen-Robot Suite(Manip + Nav + World)의 일부
입력 가격
$0.0000
per 1M tokens
출력 가격
$0.0000
per 1M tokens
캐시된 입력
per 1M tokens
배치 입력
per 1M tokens
컨텍스트 창: 0
최대 출력: 0 tokens
지식 기준일: 2026-06
비전함수 호출파인튜닝JSON 모드무료 등급

장점

  • 물리적으로 가능한 미래를 예측하는 세계 모델
  • 교차 장면: 조작, 주행 및 내비게이션
  • 직관적인 제어를 위한 자연어 액션 인터페이스
  • Apache 2.0에 따른 오픈소스

단점

  • 세계 시뮬레이션에만 특화됨
  • 텍스트 생성 또는 로봇 제어 없음
  • 전체 스택을 위해 Manip/Nav와 통합 필요
  • 매우 신규 — 제한된 벤치마크만 사용 가능

성능

출력 속도
속도 제한

멀티모달

이미지 입력이미지 출력오디오 입력오디오 출력

나란히 비교

모델등급입력출력컨텍스트
Qwen3.7-MaxFlagship$2.50$7.501M
Qwen3.7-PlusMid-tier$0.400$1.601M
Qwen3-235B-A22BFlagship$0.400$1.20131K
Qwen3-30B-A3BMid-tier$0.150$0.600131K
Qwen3-32BMid-tier$0.200$0.600131K
Qwen3-14BLite$0.100$0.300131K
Qwen3-8BLite$0.050$0.150131K
Qwen-VL-PlusMid-tier$0.200$0.800131K
Qwen-RobotManipFlagship$0.0000$0.00000
Qwen-RobotNavFlagship$0.0000$0.00000
Qwen-RobotWorldFlagship$0.0000$0.00000