Claude 모델 완전 정리 — Opus·Sonnet·Haiku 4.7/4.6/4.5 특징·가격·선택 가이드
Anthropic의 Claude 모델은 음악 형식을 따라 이름이 붙어 있다. Opus(오푸스, 대작) 가 가장 강력하고, Sonnet(소네트) 이 균형형, Haiku(하이쿠) 가 가장 빠르고 가벼운 모델이다. 2026년 4월 기준 권장 모델은 Opus 4.7·Sonnet 4.6·Haiku 4.5 세 가지이며, 같은 패밀리 안에서도 버전에 따라 성능과 가격이 다시 갈라진다.
이 글은 Claude 모델 3종의 정체성, 가격·컨텍스트·속도 비교, 모델 선택 의사결정 트리, 그리고 코드·분석·고객 지원 같은 작업별 추천 모델까지 한 번에 정리한다. API를 직접 다루는 개발자뿐 아니라 Claude Code·Cursor·Continue 등 도구를 통해 간접적으로 모델을 고르는 경우에도 유용하다.

이 글의 구성
01 Claude 모델 패밀리 트리 — Opus·Sonnet·Haiku
Claude는 세 가지 등급(tier)으로 나뉘고, 각 등급 안에서 버전 번호가 올라간다. 음악 용어에서 따온 이름은 모델의 "복잡도·길이·표현력"을 은유한다.
Anthropic Claude
3-tier model family
Opus
OPUS · 대작
최고 지능·복잡 추론
4.7 (latest)
Sonnet
SONNET · 14행시
균형형·일상 작업
4.6 (daily driver)
Haiku
HAIKU · 5-7-5
최속·최저가
4.5 (fast/cheap)
💡 명명 규칙 — 음악 형식
Opus는 작곡가의 대작, Sonnet은 14행시, Haiku는 5-7-5의 짧은 시. 모델 크기와 표현력의 은유다. 같은 등급 안에서는 버전 번호(4.5 → 4.6 → 4.7)로 세대를 구분한다.
02 3종 모델 핵심 스펙 매트릭스
2026년 4월 기준 세 모델의 핵심 스펙을 한 표로 정리하면 다음과 같다. 가격·속도·컨텍스트·출력 한도 4가지 축에서 차이가 갈린다.
| 항목 | Opus 4.7 | Sonnet 4.6 | Haiku 4.5 |
|---|---|---|---|
| 정체성 | 최고 지능 (Flagship) | 균형형 (Daily Driver) | 최속·최저가 (Fast) |
| 입력 단가 | $5 / 1M 토큰 | $3 / 1M 토큰 | $1 / 1M 토큰 |
| 출력 단가 | $25 / 1M 토큰 | $15 / 1M 토큰 | $5 / 1M 토큰 |
| 컨텍스트 | 1M 토큰 | 1M 토큰 | 200K 토큰 |
| 최대 출력 | 128K | 64K | 64K |
| 첫 토큰 응답 | 1~2초 | 600~900ms | 300~500ms |
| 전체 응답 | 6~12초 | 3~5초 | 1~2초 |
📌 가격·속도의 5배 법칙
단가는 Haiku → Sonnet → Opus로 갈수록 약 3~5배씩 비싸진다. 속도는 정반대로 약 3~5배씩 느려진다. 단순 작업에 Opus를 쓰면 응답 시간과 비용 모두 손해, 복잡한 추론에 Haiku를 쓰면 결과 품질에서 손해다.
03 가격·속도 비교 — SVG 차트
세 모델의 입력 단가와 전체 응답 시간(추정 평균)을 막대 차트로 시각화하면 차이가 한눈에 보인다.
입력 단가 (USD per 1M tokens)
Opus 4.7 Sonnet 4.6 Haiku 4.5 $5 $3 $1출력 단가도 비례 : Opus $25, Sonnet $15, Haiku $5 per 1M tokens. 가격이 비쌀수록 추론 깊이가 늘어난다.
전체 응답 시간 (초, 평균)
Opus 4.7 Sonnet 4.6 Haiku 4.5 6~12초 3~5초 1~2초첫 토큰 응답(TTFT)도 비슷한 비율 : Opus 1~2초, Sonnet 600~900ms, Haiku 300~500ms.
04 모델별 강점·약점 카드
가격·속도만으로는 잘 안 보이는 "어떤 작업에 어떤 모델이 빛나는가" 차이를 카드 형태로 정리한다.
Opus 4.7 — Flagship
에이전트형 코딩(agentic coding)·복잡한 다단계 추론·대규모 리팩토링·연구급 분석에서 최고 성능. 128K 출력 한도가 다른 모델의 2배라 긴 코드 생성·문서 작성에 유리하다.
○ 강점 : 복잡 추론·긴 출력·정확도 / ○ 약점 : 응답 속도·비용
Sonnet 4.6 — Daily Driver
개발자 70%가 Sonnet 4.5보다, 59%가 Opus 4.5(2025년 11월)보다 선호한다고 답한 균형형 모델. 90% 이상의 코딩 작업을 Opus와 비슷한 품질로 처리하면서 단가는 1/3 수준.
○ 강점 : 가격·품질·속도 균형 / ○ 약점 : 매우 복잡한 추론에서 Opus 대비 미세한 차이
Haiku 4.5 — Fast / Cheap
단순 작업·분류·요약·실시간 챗봇·대량 배치 처리에 최적. 입력 $1·출력 $5 per 1M으로 Opus 대비 1/5 가격. 천 건 단위 요청도 부담 없이 처리.
○ 강점 : 속도·저비용·대량 처리 / ○ 약점 : 복잡 추론·긴 컨텍스트(200K 제한)
05 작업별 선택 의사결정 트리
본인 작업 성격에 맞는 모델을 한 번에 결정할 수 있는 플로우 차트.
Q1. 복잡한 다단계 추론·에이전트 작업인가?
예 → Opus 4.7
복잡 코드·리팩토링·연구
아니오 → 다음 질문
↓
Q2. 일반 코딩·분석·문서 작성인가?
예 → Sonnet 4.6
데일리 드라이버 (90%+ 작업)
아니오 → 다음 질문
↓
Q3. 단순 분류·요약·챗봇·대량 처리인가?
예 → Haiku 4.5
속도·비용 우선, 천 건 단위 배치도 가능
| 작업 유형 | 추천 모델 |
|---|---|
| 대규모 리팩토링·아키텍처 설계·복잡 디버깅 | Opus 4.7 |
| 연구급 분석·논문 작성·법률 문서 검토 | Opus 4.7 |
| 일반 코딩·기능 구현·디버깅 | Sonnet 4.6 |
| 블로그·기획서·이메일·일반 글 작성 | Sonnet 4.6 |
| 고객 지원 챗봇·FAQ 자동 답변 | Haiku 4.5 |
| 대량 분류·라벨링·태깅 | Haiku 4.5 |
| 실시간 응답·대화형 UI | Haiku 4.5 |
06 추가로 알면 좋은 기능과 옵션
Claude 모델은 기본 API 외에도 몇 가지 활용도를 크게 높여 주는 부가 기능이 있다.
Prompt Caching
반복되는 시스템 프롬프트·문서를 캐싱해 입력 토큰 비용을 최대 90%까지 절감. 5분 TTL.
Extended Thinking
Opus·Sonnet에 적용되는 추론 강화 모드. 응답 전에 모델이 내부적으로 더 깊이 생각하도록 허용.
Tool Use (Function Calling)
JSON 스키마 기반으로 외부 도구·API를 호출. 에이전트형 워크플로우의 핵심 기능.
Vision (이미지 입력)
모든 모델이 이미지·차트·문서 스캔 입력 지원. 멀티모달 작업 가능.
Batch API
대량 요청을 비동기로 묶어 처리. 24시간 내 완료 기준 단가 50% 할인.
Files / Citations
PDF·문서를 직접 업로드하고 응답에 인용 출처 자동 부착. 사실 추적 가능.
90% 이상의 작업은 Sonnet으로 충분하다.
비용·속도·품질의 균형점.
Opus는 정말 복잡한 작업에만, Haiku는 대량·실시간 작업에만. 모든 작업을 한 모델로 처리하려는 시도보다 작업 유형별 모델 분리가 비용·품질 모두 최적이다.
07 Q&A 자주 묻는 질문 5가지
QOpus를 쓰면 항상 더 좋은 결과가 나오나요?
A단순 작업에서는 Sonnet·Haiku와 차이가 거의 없다. Opus의 진가는 다단계 추론·에이전트 워크플로우·복잡한 코드 리팩토링에서 드러난다. 단순 분류·번역·요약에 Opus를 쓰면 비용·속도 모두 손해다.
Q1M 컨텍스트면 한 권의 책도 한 번에 처리되나요?
A1M 토큰 ≈ 약 75만 단어. 일반 도서 5~7권 분량이 한 번에 들어간다. 다만 컨텍스트가 길어질수록 응답 시간·토큰 비용이 비례 증가하므로 필요한 만큼만 넣는 편이 효율적. Prompt Caching을 활용하면 반복 입력 비용을 크게 줄일 수 있다.
Q버전(4.7 vs 4.6)이 다르면 얼마나 차이가 나나요?
A같은 등급 안에서 버전이 올라가면 보통 추론 정확도·코딩 능력·지시 따르기에서 점진적 개선이 있다. Opus 4.7은 4.6 대비 에이전트형 코딩에서 단계적 향상(step-change improvement)을 보였다고 공식 발표됨. 가격은 4.6과 동일하게 유지.
QClaude Code·Cursor 같은 도구는 어떤 모델을 쓰나요?
A도구마다 다르고 사용자가 직접 선택할 수 있는 경우가 많다. Claude Code의 기본값은 보통 Sonnet 4.6, /model 명령으로 Opus로 전환 가능. Cursor·Continue 등도 모델 선택 메뉴에서 Opus·Sonnet·Haiku 골라 쓸 수 있다.
QAnthropic 외에 AWS Bedrock·GCP Vertex에서도 Claude를 쓸 수 있나요?
A그렇다. AWS Bedrock·GCP Vertex AI 두 클라우드에서 Claude 모델을 공식 호스팅한다. 데이터 거버넌스·VPC 격리 요건이 있는 기업이라면 두 클라우드 채널이 유리할 수 있다. 단 가격·지원 모델 버전이 Anthropic 직접 API와 약간 다를 수 있어 확인 필요.
결론 — 모델 선택 한 줄
세 가지 모델은 가격·속도·지능의 트레이드오프에서 각자 다른 균형점을 잡고 있다.
Opus 4.7 은 복잡한 다단계 추론·에이전트형 코딩·연구급 분석에. 응답 시간이 길고 비용이 비싸지만 최고 품질을 보장한다.
Sonnet 4.6 은 일상 코딩·문서 작성·일반 분석의 데일리 드라이버. 90% 이상의 작업을 Opus 비슷한 품질로 처리하면서 단가는 1/3 수준.
Haiku 4.5 는 단순 분류·요약·챗봇·대량 처리에. 단가가 Opus의 1/5이고 응답이 1~2초로 빨라 실시간 UI·배치 처리에 최적이다.
작업을 단일 모델로 처리하려는 욕심보다 작업 유형별로 모델을 분리하는 편이 비용·품질·속도 모두에서 효율적이다. 메인 워크플로우는 Sonnet, 복잡 단계는 Opus, 단순 단계는 Haiku 식으로 라우팅하면 운영 비용이 크게 줄어든다.
✅ Claude 모델 선택 체크리스트
본 글은 정보 정리·교육 목적이며 특정 모델·서비스 사용 권유가 아니다. Claude 모델 사양·가격·기능은 Anthropic의 공식 발표에 따라 수시로 변경되므로, 적용 직전 platform.claude.com 공식 문서를 확인해야 한다.
#Claude #Anthropic #ClaudeOpus #ClaudeSonnet #ClaudeHaiku #LLM #AImodel #ClaudeCode #AnthropicAPI #PromptCaching #ExtendedThinking #ToolUse #AWSBedrock #VertexAI #AI모델선택
댓글