24장 — AI 모델 선택
CHAPTER 24
AI 모델 선택
Opus · Sonnet · Haiku 작업별 배분
📑 이 챕터에서 다룰 내용

새 22·23장에서 디버깅·Agent Teams 흐름을 봤습니다. Agent Teams는 여러 모델 (Opus·Sonnet·Haiku) 을 결합합니다. 그러면 "어떤 작업에 어떤 모델"의 결정 흐름이 핵심입니다. 이 장은 Sonnet 4.6·Opus 4.7·Haiku 4.5 세 모델의 가격·속도·품질을 비교하고, 각 작업 종류에 무엇을 권장하는지 분리합니다.

📘 사전 지식 체크 + 이 장의 목적

사전 지식: 새 17장 비용 가설 / 새 23장 Agent Teams 흐름 / Anthropic API 기본

이 장의 목적: Sonnet vs Opus vs Haiku 가격·속도·품질 비교 + 작업별 권장 + 80~90% Sonnet 권장 근거 + Junho 본인 흐름

완료 후 결과물: 4 프로젝트 모델 선택 결정 + 1년 비용 절감 30~50%

💡 모델 선택 = 비용·속도·품질의 균형

"항상 Opus"가 정답이 아닙니다. "항상 Sonnet"도 아닙니다. 작업 종류에 무엇이 "꼭 필요한가" 결정하세요. 일반 코딩에 Opus를 쓰면 비용 5배 + 시간 2배 → 페이스 파괴로 이어집니다.

24-1 가격 비교 🔗

단가 표 (2026년 기준)

모델입력출력캐시 (90% 할인)상대 단가
Opus 4.7$15/MTok$75/MTok$1.5/MTok5x (실제 6.7x*)
Sonnet 4.6$3/MTok$15/MTok$0.3/MTok1x (기준)
Haiku 4.5$1/MTok$5/MTok$0.1/MTok0.33x

*Opus 한국어 토크나이저가 Sonnet보다 약 35% 더 많은 토큰 사용 → 실제 6.7배.

한 달 비용 시뮬레이션 (15M 입력 + 1.5M 출력)

💻 비용 시뮬레이션
[A. Opus 100%]
- 입력: 15M × $15 = $225 (실제 약 $300, 토큰 35% 더)
- 출력: 1.5M × $75 = $112.5
- 합계: 약 $337.5 (캐시 적용 시 약 $130)

[B. Sonnet 100%]
- 입력: 15M × $3 = $45
- 출력: 1.5M × $15 = $22.5
- 합계: $67.5 (캐시 적용 시 약 $25)

[C. Haiku 100%]
- 입력: 15M × $1 = $15
- 출력: 1.5M × $5 = $7.5
- 합계: $22.5 (캐시 적용 시 약 $10)

[D. 결합 권장 — Sonnet 80% + Opus 15% + Haiku 5%]
- 입력: (12M × $3) + (2.25M × $15 × 1.35) + (0.75M × $1) = $36 + $45.6 + $0.75 = $82.4
- 출력: (1.2M × $15) + (0.225M × $75) + (0.075M × $5) = $18 + $16.9 + $0.4 = $35.3
- 합계: 약 $117.7 (캐시 적용 시 약 $50)
🎉 추천 결합 D

합계 약 $50/월 (캐시 적용). 80~90% Sonnet 흐름이 균형점입니다.

24-2 속도 비교 🔗

응답 시간 (한 호출 평균)

모델짧은 응답 (1K 출력)긴 응답 (10K 출력)
Opus 4.7약 8~15초약 30~60초
Sonnet 4.6약 3~5초약 10~20초
Haiku 4.5약 1~2초약 5~8초

속도가 결정에 미치는 영향

💻 속도 영향 시뮬레이션
[Claude Code 매일 작업]
- 100 호출/일 가설
- Opus: 100 × 평균 12초 = 20분/일 대기
- Sonnet: 100 × 평균 4초 = 6.7분/일 대기
- Haiku: 100 × 평균 1.5초 = 2.5분/일 대기

[1년 누적 대기 시간]
- Opus: 약 120시간
- Sonnet: 약 40시간
- Haiku: 약 15시간

[★ 페이스 영향]
- Opus 100% = 1년 +80시간 대기 (Sonnet 비)
- 대기 시간 = "흐름 끊김"의 가장 큰 원인
- E2 1인 페이스 보호 의식 — Sonnet 권장
24-3 품질 비교 🔗

벤치마크 점수 (2026년 기준)

모델SWE-benchMMLU한국어 GSM8K작업 종류별
Opus 4.787.6%92%89%어려운 결정·복잡한 코딩·긴 컨텍스트
Sonnet 4.685.7%90%87%일반 코딩·문서 작성·검토
Haiku 4.579.1%84%81%단순 분류·요약·짧은 응답

작업 종류별 품질 차이 인지

💻 품질 비교 시뮬레이션
[일반 코딩 작업]
- Opus: 98% 정확도
- Sonnet: 96% 정확도
- 차이 2%포인트 → ★ 비용 5배·속도 2배 무가치

[어려운 결정 (5파일 SPEC 작성·Agent Teams 분배)]
- Opus: 95% 정확도
- Sonnet: 88% 정확도
- 차이 7%포인트 → ★ 비용 5배 가치 있음

[단순 분류 (LLM 분류·SSOT 입력)]
- Opus: 99% 정확도
- Sonnet: 98% 정확도
- Haiku: 95% 정확도
- 차이 3~4%포인트 → ★ Haiku 가성비
24-4 어디에 무엇을 쓸지 — 작업 종류 표 🔗

8 작업 종류 권장

작업권장 모델근거
일반 코딩Sonnet98% 품질·5배 저렴
SPEC v1 작성Opus어려운 결정 의식
Gemini 검토 응답Sonnet검토 응답은 일반
LLM 분류 (SSOT 입력)Haiku단순·가성비
페르소나 출력Sonnet톤·일관성 핵심
Agent Teams 분배Opus분배 결정
단순 요약Haiku가성비
자동 일관성 테스트Sonnet사실 일치 검증

작업별 비용 가설 (1 프로젝트 1개월)

💻 프로젝트별 비용 가설
[줍줍 가설]
- 일반 코딩 (Sonnet): $20
- SPEC v1 작성 (Opus, 1회): $5
- LLM 분류 (Haiku, 매일): $10
- 페르소나 출력 (Sonnet, 매일): $15
- 합계 약 $50/월 (캐시 적용 후 약 $25)

[TSV 가설]
- 일반 코딩 (Sonnet): $25
- SPEC v1·v2 (Opus, 2회): $10
- 페르소나 출력 (Sonnet): $30
- 자동 일관성 (Sonnet): $5
- 합계 약 $70/월 (캐시 적용 후 약 $30)
24-5 80~90% Sonnet 기본 권장 🔗

권장 근거 4

💻 80~90% Sonnet 권장 근거
[근거 1] 비용 균형
- Sonnet $3/$15 (입/출)
- 1년 비용 가설: Sonnet 100% = 약 $810 / Opus 100% = 약 $4050
- ★ 5배 차이 = 휴가·외주 비용

[근거 2] 속도 균형
- Sonnet 평균 4초 / Opus 12초
- 1년 누적 대기 +80시간
- ★ Sonnet 흐름 페이스 보호

[근거 3] 품질 충분
- 일반 코딩 96% (Opus 98% 비)
- 차이 2%포인트 = "코드 검토 시 발견 가능 영역"
- 외부 검토 (Gemini) 결합 시 차이 X 의식

[근거 4] Agent Teams 결합
- Opus는 "분배·결정"만
- Sonnet은 "실행" 다수
- ★ Opus 20% + Sonnet 80% 결합 흐름

Sonnet 권장이 아닌 영역 (10~20%)

💻 Opus·Haiku 권장 영역
[Opus 권장 영역 약 10~15%]
- SPEC v1 작성 (1회/Phase)
- 5파일+ 사이클 단계 ⑤ (두 검토자) 의식
- Agent Teams 분배 결정
- 어려운 디버깅 (5파일 펼침 후도 막힘)

[Haiku 권장 영역 약 5~10%]
- LLM 분류 (SSOT 입력)
- 짧은 요약 (블로그·SNS 1줄)
- 자동 발행 흐름
- 단순 응답
24-6 토크나이저 의식 — Opus 35% 더 많은 토큰 🔗

Opus 토크나이저가 한국어를 35% 더 많은 토큰으로 처리합니다. 이 차이가 비용 가설을 "5배"에서 "6.7배"로 만듭니다.

한국어 시뮬레이션

💻 한국어 토큰 비교
[입력 한국어 100K 토큰 (UTF-8)]
- Sonnet: 100K 토큰 → $0.30
- Opus: 약 135K 토큰 → $2.025 (★ 6.7배)

[출력 한국어 10K 토큰]
- Sonnet: 10K 토큰 → $0.15
- Opus: 약 13.5K 토큰 → $1.013 (★ 6.7배)

영문 시뮬레이션 (비교)

💻 영문 토큰 비교
[입력 영문 100K 토큰]
- Sonnet: 100K 토큰 → $0.30
- Opus: 약 105K 토큰 → $1.575 (★ 5.3배)

한국어 작업에 Opus를 쓰면 "5배" 가설보다 33% 더 비싸집니다. 한국어 위주 프로젝트는 Sonnet 권장 의식을 강화하세요.

24-7 prompt caching 적용 — 90% 절약 🔗

prompt caching은 Sonnet·Opus·Haiku 모두 적용 가능합니다. 90% 할인 효과입니다.

캐싱 적용 영역

💻 캐싱 적용 영역
[1] 시스템 프롬프트 (페르소나·CLAUDE.md)
- 매 호출마다 동일
- 캐시 1회 + 24시간 유지
- 90% 할인

[2] 5파일 (SPEC·PLAN·REVIEW·BUILD·CLAUDE)
- 매 세션 자동 입력
- 캐시 1회 + 24시간 유지
- 90% 할인

[3] 외부 자료 (긴 문서·API 응답 누적)
- 5분 캐시 (ephemeral)
- 짧은 흐름에 적용

캐싱 적용 후 비용

💻 캐싱 비용 절감 시뮬레이션
[캐싱 X — Sonnet 100%]
- 한 달: 약 $67.5

[캐싱 적용 — Sonnet 100%]
- 한 달: 약 $25 (-63%)

[캐싱 적용 — D 결합]
- 한 달: 약 $50 (-58%)

[1년 누적 절감]
- 약 $300~$500 / 1 프로젝트
- 4 프로젝트 약 $1200~$2000
24-8 Junho 본인 흐름 — 결정·검토 Opus, 실행·코딩 Sonnet 🔗

Junho 본인의 4 프로젝트 모델 결합입니다.

4 프로젝트 모델 결합 표

작업TSV줍줍AlbaFlowviewLab
SPEC v1·v2OpusOpusOpusOpus
일반 코딩SonnetSonnetSonnetSonnet
LLM 분류(X)Haiku(X)(X)
페르소나 출력SonnetSonnet(X)Sonnet
Agent Teams 분배OpusOpusOpusOpus
자동 일관성SonnetSonnet(X)Sonnet
단순 요약HaikuHaikuHaikuHaiku

4 프로젝트 합계 — Sonnet 비중

💻 4 프로젝트 모델 비중
[총 호출 비중]
- Sonnet: 약 80%
- Opus: 약 12%
- Haiku: 약 8%

[월 비용 가설]
- Phase 1 (4 프로젝트): 약 $80~$120/월 (캐싱 적용)
- Phase 2 (4 프로젝트): 약 $200~$300/월

[★ Junho 권장]
- 결정·검토 = Opus
- 실행·코딩 = Sonnet
- 분류·요약 = Haiku
- 비중 80~90% Sonnet 의식

📌 새 24장 정리

핵심 한 줄: 80~90% Sonnet 기본 권장. 결정·검토만 Opus. 분류·요약만 Haiku. 비용 5배·속도 2배 차이 인지.

  • 단가: Opus $15/$75 (실제 한국어 6.7배 Sonnet 비) / Sonnet $3/$15 (기준) / Haiku $1/$5 (1/3 Sonnet)
  • 속도: Opus 8~15초 / Sonnet 3~5초 / Haiku 1~2초. 1년 누적 대기 차이 +80시간 (Opus 100% vs Sonnet 100%)
  • 품질 (벤치마크): Opus 87.6% SWE-bench / Sonnet 85.7% / Haiku 79.1%. 일반 코딩 차이 2%포인트만 (Sonnet 96% / Opus 98%)
  • 작업 종류별 권장 8개: 일반 코딩 (Sonnet) / SPEC v1 (Opus) / Gemini 검토 응답 (Sonnet) / LLM 분류 (Haiku) / 페르소나 출력 (Sonnet) / Agent Teams 분배 (Opus) / 단순 요약 (Haiku) / 자동 일관성 (Sonnet)
  • 80~90% Sonnet 권장 4 근거: ① 비용 5배 차이 ② 속도 2배 차이 ③ 품질 차이 2%포인트만 ④ Agent Teams 결합 흐름
  • prompt caching 90% 할인: 1년 절감 약 $300~$500/프로젝트
  • Junho 4 프로젝트 모델 결합: Sonnet 80% + Opus 12% + Haiku 8%

3 모델 (Sonnet·Opus·Haiku) 의 가격·속도·품질 차이가 손에 들렸습니다. 80~90% Sonnet 권장 흐름·작업별 결합·캐싱 적용·Junho 흐름까지. 한 달 약 $50~$120/프로젝트의 흐름이 "두려움"이 사라졌습니다.

다음 장에서 한국어 의식을 다룹니다. AI는 영어 자료가 본문이지만 사용자는 한국어 — 의식 흐름입니다.

💬
🤖 Vibe Coding 도우미
안녕하세요! Vibe Coding 시리즈에 대해 무엇이든 물어보세요 😊