📑 이 챕터에서 다룰 내용
새 22·23장에서 디버깅·Agent Teams 흐름을 봤습니다. Agent Teams는 여러 모델 (Opus·Sonnet·Haiku) 을 결합합니다. 그러면 "어떤 작업에 어떤 모델"의 결정 흐름이 핵심입니다. 이 장은 Sonnet 4.6·Opus 4.7·Haiku 4.5 세 모델의 가격·속도·품질을 비교하고, 각 작업 종류에 무엇을 권장하는지 분리합니다.
사전 지식: 새 17장 비용 가설 / 새 23장 Agent Teams 흐름 / Anthropic API 기본
이 장의 목적: Sonnet vs Opus vs Haiku 가격·속도·품질 비교 + 작업별 권장 + 80~90% Sonnet 권장 근거 + Junho 본인 흐름
완료 후 결과물: 4 프로젝트 모델 선택 결정 + 1년 비용 절감 30~50%
"항상 Opus"가 정답이 아닙니다. "항상 Sonnet"도 아닙니다. 작업 종류에 무엇이 "꼭 필요한가" 결정하세요. 일반 코딩에 Opus를 쓰면 비용 5배 + 시간 2배 → 페이스 파괴로 이어집니다.
단가 표 (2026년 기준)
| 모델 | 입력 | 출력 | 캐시 (90% 할인) | 상대 단가 |
|---|---|---|---|---|
| Opus 4.7 | $15/MTok | $75/MTok | $1.5/MTok | 5x (실제 6.7x*) |
| Sonnet 4.6 | $3/MTok | $15/MTok | $0.3/MTok | 1x (기준) |
| Haiku 4.5 | $1/MTok | $5/MTok | $0.1/MTok | 0.33x |
*Opus 한국어 토크나이저가 Sonnet보다 약 35% 더 많은 토큰 사용 → 실제 6.7배.
한 달 비용 시뮬레이션 (15M 입력 + 1.5M 출력)
[A. Opus 100%] - 입력: 15M × $15 = $225 (실제 약 $300, 토큰 35% 더) - 출력: 1.5M × $75 = $112.5 - 합계: 약 $337.5 (캐시 적용 시 약 $130) [B. Sonnet 100%] - 입력: 15M × $3 = $45 - 출력: 1.5M × $15 = $22.5 - 합계: $67.5 (캐시 적용 시 약 $25) [C. Haiku 100%] - 입력: 15M × $1 = $15 - 출력: 1.5M × $5 = $7.5 - 합계: $22.5 (캐시 적용 시 약 $10) [D. 결합 권장 — Sonnet 80% + Opus 15% + Haiku 5%] - 입력: (12M × $3) + (2.25M × $15 × 1.35) + (0.75M × $1) = $36 + $45.6 + $0.75 = $82.4 - 출력: (1.2M × $15) + (0.225M × $75) + (0.075M × $5) = $18 + $16.9 + $0.4 = $35.3 - 합계: 약 $117.7 (캐시 적용 시 약 $50)
합계 약 $50/월 (캐시 적용). 80~90% Sonnet 흐름이 균형점입니다.
응답 시간 (한 호출 평균)
| 모델 | 짧은 응답 (1K 출력) | 긴 응답 (10K 출력) |
|---|---|---|
| Opus 4.7 | 약 8~15초 | 약 30~60초 |
| Sonnet 4.6 | 약 3~5초 | 약 10~20초 |
| Haiku 4.5 | 약 1~2초 | 약 5~8초 |
속도가 결정에 미치는 영향
[Claude Code 매일 작업] - 100 호출/일 가설 - Opus: 100 × 평균 12초 = 20분/일 대기 - Sonnet: 100 × 평균 4초 = 6.7분/일 대기 - Haiku: 100 × 평균 1.5초 = 2.5분/일 대기 [1년 누적 대기 시간] - Opus: 약 120시간 - Sonnet: 약 40시간 - Haiku: 약 15시간 [★ 페이스 영향] - Opus 100% = 1년 +80시간 대기 (Sonnet 비) - 대기 시간 = "흐름 끊김"의 가장 큰 원인 - E2 1인 페이스 보호 의식 — Sonnet 권장
벤치마크 점수 (2026년 기준)
| 모델 | SWE-bench | MMLU | 한국어 GSM8K | 작업 종류별 |
|---|---|---|---|---|
| Opus 4.7 | 87.6% | 92% | 89% | 어려운 결정·복잡한 코딩·긴 컨텍스트 |
| Sonnet 4.6 | 85.7% | 90% | 87% | 일반 코딩·문서 작성·검토 |
| Haiku 4.5 | 79.1% | 84% | 81% | 단순 분류·요약·짧은 응답 |
작업 종류별 품질 차이 인지
[일반 코딩 작업] - Opus: 98% 정확도 - Sonnet: 96% 정확도 - 차이 2%포인트 → ★ 비용 5배·속도 2배 무가치 [어려운 결정 (5파일 SPEC 작성·Agent Teams 분배)] - Opus: 95% 정확도 - Sonnet: 88% 정확도 - 차이 7%포인트 → ★ 비용 5배 가치 있음 [단순 분류 (LLM 분류·SSOT 입력)] - Opus: 99% 정확도 - Sonnet: 98% 정확도 - Haiku: 95% 정확도 - 차이 3~4%포인트 → ★ Haiku 가성비
8 작업 종류 권장
| 작업 | 권장 모델 | 근거 |
|---|---|---|
| 일반 코딩 | Sonnet | 98% 품질·5배 저렴 |
| SPEC v1 작성 | Opus | 어려운 결정 의식 |
| Gemini 검토 응답 | Sonnet | 검토 응답은 일반 |
| LLM 분류 (SSOT 입력) | Haiku | 단순·가성비 |
| 페르소나 출력 | Sonnet | 톤·일관성 핵심 |
| Agent Teams 분배 | Opus | 분배 결정 |
| 단순 요약 | Haiku | 가성비 |
| 자동 일관성 테스트 | Sonnet | 사실 일치 검증 |
작업별 비용 가설 (1 프로젝트 1개월)
[줍줍 가설] - 일반 코딩 (Sonnet): $20 - SPEC v1 작성 (Opus, 1회): $5 - LLM 분류 (Haiku, 매일): $10 - 페르소나 출력 (Sonnet, 매일): $15 - 합계 약 $50/월 (캐시 적용 후 약 $25) [TSV 가설] - 일반 코딩 (Sonnet): $25 - SPEC v1·v2 (Opus, 2회): $10 - 페르소나 출력 (Sonnet): $30 - 자동 일관성 (Sonnet): $5 - 합계 약 $70/월 (캐시 적용 후 약 $30)
권장 근거 4
[근거 1] 비용 균형 - Sonnet $3/$15 (입/출) - 1년 비용 가설: Sonnet 100% = 약 $810 / Opus 100% = 약 $4050 - ★ 5배 차이 = 휴가·외주 비용 [근거 2] 속도 균형 - Sonnet 평균 4초 / Opus 12초 - 1년 누적 대기 +80시간 - ★ Sonnet 흐름 페이스 보호 [근거 3] 품질 충분 - 일반 코딩 96% (Opus 98% 비) - 차이 2%포인트 = "코드 검토 시 발견 가능 영역" - 외부 검토 (Gemini) 결합 시 차이 X 의식 [근거 4] Agent Teams 결합 - Opus는 "분배·결정"만 - Sonnet은 "실행" 다수 - ★ Opus 20% + Sonnet 80% 결합 흐름
Sonnet 권장이 아닌 영역 (10~20%)
[Opus 권장 영역 약 10~15%] - SPEC v1 작성 (1회/Phase) - 5파일+ 사이클 단계 ⑤ (두 검토자) 의식 - Agent Teams 분배 결정 - 어려운 디버깅 (5파일 펼침 후도 막힘) [Haiku 권장 영역 약 5~10%] - LLM 분류 (SSOT 입력) - 짧은 요약 (블로그·SNS 1줄) - 자동 발행 흐름 - 단순 응답
Opus 토크나이저가 한국어를 35% 더 많은 토큰으로 처리합니다. 이 차이가 비용 가설을 "5배"에서 "6.7배"로 만듭니다.
한국어 시뮬레이션
[입력 한국어 100K 토큰 (UTF-8)] - Sonnet: 100K 토큰 → $0.30 - Opus: 약 135K 토큰 → $2.025 (★ 6.7배) [출력 한국어 10K 토큰] - Sonnet: 10K 토큰 → $0.15 - Opus: 약 13.5K 토큰 → $1.013 (★ 6.7배)
영문 시뮬레이션 (비교)
[입력 영문 100K 토큰] - Sonnet: 100K 토큰 → $0.30 - Opus: 약 105K 토큰 → $1.575 (★ 5.3배)
한국어 작업에 Opus를 쓰면 "5배" 가설보다 33% 더 비싸집니다. 한국어 위주 프로젝트는 Sonnet 권장 의식을 강화하세요.
prompt caching은 Sonnet·Opus·Haiku 모두 적용 가능합니다. 90% 할인 효과입니다.
캐싱 적용 영역
[1] 시스템 프롬프트 (페르소나·CLAUDE.md) - 매 호출마다 동일 - 캐시 1회 + 24시간 유지 - 90% 할인 [2] 5파일 (SPEC·PLAN·REVIEW·BUILD·CLAUDE) - 매 세션 자동 입력 - 캐시 1회 + 24시간 유지 - 90% 할인 [3] 외부 자료 (긴 문서·API 응답 누적) - 5분 캐시 (ephemeral) - 짧은 흐름에 적용
캐싱 적용 후 비용
[캐싱 X — Sonnet 100%] - 한 달: 약 $67.5 [캐싱 적용 — Sonnet 100%] - 한 달: 약 $25 (-63%) [캐싱 적용 — D 결합] - 한 달: 약 $50 (-58%) [1년 누적 절감] - 약 $300~$500 / 1 프로젝트 - 4 프로젝트 약 $1200~$2000
Junho 본인의 4 프로젝트 모델 결합입니다.
4 프로젝트 모델 결합 표
| 작업 | TSV | 줍줍 | AlbaFlow | viewLab |
|---|---|---|---|---|
| SPEC v1·v2 | Opus | Opus | Opus | Opus |
| 일반 코딩 | Sonnet | Sonnet | Sonnet | Sonnet |
| LLM 분류 | (X) | Haiku | (X) | (X) |
| 페르소나 출력 | Sonnet | Sonnet | (X) | Sonnet |
| Agent Teams 분배 | Opus | Opus | Opus | Opus |
| 자동 일관성 | Sonnet | Sonnet | (X) | Sonnet |
| 단순 요약 | Haiku | Haiku | Haiku | Haiku |
4 프로젝트 합계 — Sonnet 비중
[총 호출 비중] - Sonnet: 약 80% - Opus: 약 12% - Haiku: 약 8% [월 비용 가설] - Phase 1 (4 프로젝트): 약 $80~$120/월 (캐싱 적용) - Phase 2 (4 프로젝트): 약 $200~$300/월 [★ Junho 권장] - 결정·검토 = Opus - 실행·코딩 = Sonnet - 분류·요약 = Haiku - 비중 80~90% Sonnet 의식
📌 새 24장 정리
핵심 한 줄: 80~90% Sonnet 기본 권장. 결정·검토만 Opus. 분류·요약만 Haiku. 비용 5배·속도 2배 차이 인지.
- 단가: Opus $15/$75 (실제 한국어 6.7배 Sonnet 비) / Sonnet $3/$15 (기준) / Haiku $1/$5 (1/3 Sonnet)
- 속도: Opus 8~15초 / Sonnet 3~5초 / Haiku 1~2초. 1년 누적 대기 차이 +80시간 (Opus 100% vs Sonnet 100%)
- 품질 (벤치마크): Opus 87.6% SWE-bench / Sonnet 85.7% / Haiku 79.1%. 일반 코딩 차이 2%포인트만 (Sonnet 96% / Opus 98%)
- 작업 종류별 권장 8개: 일반 코딩 (Sonnet) / SPEC v1 (Opus) / Gemini 검토 응답 (Sonnet) / LLM 분류 (Haiku) / 페르소나 출력 (Sonnet) / Agent Teams 분배 (Opus) / 단순 요약 (Haiku) / 자동 일관성 (Sonnet)
- 80~90% Sonnet 권장 4 근거: ① 비용 5배 차이 ② 속도 2배 차이 ③ 품질 차이 2%포인트만 ④ Agent Teams 결합 흐름
- prompt caching 90% 할인: 1년 절감 약 $300~$500/프로젝트
- Junho 4 프로젝트 모델 결합: Sonnet 80% + Opus 12% + Haiku 8%
3 모델 (Sonnet·Opus·Haiku) 의 가격·속도·품질 차이가 손에 들렸습니다. 80~90% Sonnet 권장 흐름·작업별 결합·캐싱 적용·Junho 흐름까지. 한 달 약 $50~$120/프로젝트의 흐름이 "두려움"이 사라졌습니다.
다음 장에서 한국어 의식을 다룹니다. AI는 영어 자료가 본문이지만 사용자는 한국어 — 의식 흐름입니다.