24장 — AI 모델 선택 — Vibe Coding 1탄

1탄 · 24장

AI 모델 선택

Opus · Sonnet · Haiku 작업별 배분

📑 이 챕터에서 다룰 내용

들어가며 — "무엇을 어디에"의 결정
24-1. 가격 비교
24-2. 속도 비교
24-3. 품질 비교
24-4. 어디에 무엇을 쓸지 — 작업 종류 표
24-5. 80~90% Sonnet 기본 권장
24-6. 토크나이저 의식 — Opus 35% 더 많은 토큰
24-7. prompt caching 적용 — 90% 절약
24-8. Junho 본인 흐름 — 결정·검토 Opus, 실행·코딩 Sonnet
📌 챕터 정리

새 22·23장에서 디버깅·Agent Teams 흐름을 봤습니다. Agent Teams는 여러 모델 (Opus·Sonnet·Haiku) 을 결합합니다. 그러면 "어떤 작업에 어떤 모델"의 결정 흐름이 핵심입니다. 이 장은 Sonnet 4.6·Opus 4.7·Haiku 4.5 세 모델의 가격·속도·품질을 비교하고, 각 작업 종류에 무엇을 권장하는지 분리합니다.

📘 사전 지식 체크 + 이 장의 목적

사전 지식: 새 17장 비용 가설 / 새 23장 Agent Teams 흐름 / Anthropic API 기본

이 장의 목적: Sonnet vs Opus vs Haiku 가격·속도·품질 비교 + 작업별 권장 + 80~90% Sonnet 권장 근거 + Junho 본인 흐름

완료 후 결과물: 4 프로젝트 모델 선택 결정 + 1년 비용 절감 30~50%

💡 모델 선택 = 비용·속도·품질의 균형

"항상 Opus"가 정답이 아닙니다. "항상 Sonnet"도 아닙니다. 작업 종류에 무엇이 "꼭 필요한가" 결정하세요. 일반 코딩에 Opus를 쓰면 비용 약 1.7배 + 속도 2~3배 느림 → 페이스 파괴로 이어집니다.

24-1 가격 비교 🔗

단가 표 (2026년 기준)

모델	입력	출력	캐시 (90% 할인)	상대 단가
Opus 4.7	$5/MTok	$25/MTok	$0.5/MTok	약 1.7x
Sonnet 4.6	$3/MTok	$15/MTok	$0.3/MTok	1x (기준)
Haiku 4.5	$1/MTok	$5/MTok	$0.1/MTok	0.33x

※ 한국어 토크나이저가 영문 대비 약 35% 더 많은 토큰을 사용하므로, 실제 한국어 작업 시 비용은 표의 약 1.35배로 계산하세요.

한 달 비용 시뮬레이션 (15M 입력 + 1.5M 출력)

💻 비용 시뮬레이션

[A. Opus 100%]
- 입력: 15M × $5 = $75 (한국어 토큰 35% 더 → 실제 약 $100)
- 출력: 1.5M × $25 = $37.5
- 합계: 약 $112.5 (캐시 적용 시 약 $50)

[B. Sonnet 100%]
- 입력: 15M × $3 = $45
- 출력: 1.5M × $15 = $22.5
- 합계: $67.5 (캐시 적용 시 약 $25)

[C. Haiku 100%]
- 입력: 15M × $1 = $15
- 출력: 1.5M × $5 = $7.5
- 합계: $22.5 (캐시 적용 시 약 $10)

[D. 결합 권장 — Sonnet 80% + Opus 15% + Haiku 5%]
- 입력: (12M × $3) + (2.25M × $5 × 1.35) + (0.75M × $1) = $36 + $15.2 + $0.75 = $52
- 출력: (1.2M × $15) + (0.225M × $25) + (0.075M × $5) = $18 + $5.6 + $0.4 = $24
- 합계: 약 $76 (캐시 적용 시 약 $35)

🎉 추천 결합 D

합계 약 $35/월 (캐시 적용). 80~90% Sonnet 흐름이 균형점입니다.

24-2 속도 비교 🔗

응답 시간 (한 호출 평균)

모델	짧은 응답 (1K 출력)	긴 응답 (10K 출력)
Opus 4.7	약 8~15초	약 30~60초
Sonnet 4.6	약 3~5초	약 10~20초
Haiku 4.5	약 1~2초	약 5~8초

속도가 결정에 미치는 영향

💻 속도 영향 시뮬레이션

[Claude Code 매일 작업]
- 100 호출/일 가설
- Opus: 100 × 평균 12초 = 20분/일 대기
- Sonnet: 100 × 평균 4초 = 6.7분/일 대기
- Haiku: 100 × 평균 1.5초 = 2.5분/일 대기

[1년 누적 대기 시간]
- Opus: 약 120시간
- Sonnet: 약 40시간
- Haiku: 약 15시간

[★ 페이스 영향]
- Opus 100% = 1년 +80시간 대기 (Sonnet 비)
- 대기 시간 = "흐름 끊김"의 가장 큰 원인
- E2 1인 페이스 보호 의식 — Sonnet 권장

24-3 품질 비교 🔗

벤치마크 점수 (2026년 기준)

모델	SWE-bench	MMLU	한국어 GSM8K	작업 종류별
Opus 4.7	87.6%	92%	89%	어려운 결정·복잡한 코딩·긴 컨텍스트
Sonnet 4.6	85.7%	90%	87%	일반 코딩·문서 작성·검토
Haiku 4.5	79.1%	84%	81%	단순 분류·요약·짧은 응답

작업 종류별 품질 차이 인지

💻 품질 비교 시뮬레이션

[일반 코딩 작업]
- Opus: 98% 정확도
- Sonnet: 96% 정확도
- 차이 2%포인트 → ★ 비용 1.7배·속도 2배 낭비

[어려운 결정 (5파일 SPEC 작성·Agent Teams 분배)]
- Opus: 95% 정확도
- Sonnet: 88% 정확도
- 차이 7%포인트 → ★ 비용 1.7배 가치 있음

[단순 분류 (LLM 분류·SSOT 입력)]
- Opus: 99% 정확도
- Sonnet: 98% 정확도
- Haiku: 95% 정확도
- 차이 3~4%포인트 → ★ Haiku 가성비

24-4 어디에 무엇을 쓸지 — 작업 종류 표 🔗

8 작업 종류 권장

작업	권장 모델	근거
일반 코딩	Sonnet	96% 품질·1.7배 저렴·2배 빠름
SPEC v1 작성	Opus	어려운 결정 의식
Gemini 검토 응답	Sonnet	검토 응답은 일반
LLM 분류 (SSOT 입력)	Haiku	단순·가성비
페르소나 출력	Sonnet	톤·일관성 핵심
Agent Teams 분배	Opus	분배 결정
단순 요약	Haiku	가성비
자동 일관성 테스트	Sonnet	사실 일치 검증

작업별 비용 가설 (1 프로젝트 1개월)

💻 프로젝트별 비용 가설

[줍줍 가설]
- 일반 코딩 (Sonnet): $20
- SPEC v1 작성 (Opus, 1회): $5
- LLM 분류 (Haiku, 매일): $10
- 페르소나 출력 (Sonnet, 매일): $15
- 합계 약 $50/월 (캐시 적용 후 약 $25)

[TSV 가설]
- 일반 코딩 (Sonnet): $25
- SPEC v1·v2 (Opus, 2회): $10
- 페르소나 출력 (Sonnet): $30
- 자동 일관성 (Sonnet): $5
- 합계 약 $70/월 (캐시 적용 후 약 $30)

24-5 80~90% Sonnet 기본 권장 🔗

권장 근거 4

💻 80~90% Sonnet 권장 근거

[근거 1] 비용 균형
- Sonnet $3/$15 / Opus $5/$25 (입/출)
- 1년 비용 가설: Sonnet 100% = 약 $810 / Opus 100% = 약 $1350
- ★ 약 1.7배 차이 → 장기 운영 시 수십만 원 절감

[근거 2] 속도 균형
- Sonnet 평균 4초 / Opus 12초
- 1년 누적 대기 +80시간
- ★ Sonnet 흐름 페이스 보호

[근거 3] 품질 충분
- 일반 코딩 96% (Opus 98% 비)
- 차이 2%포인트 = "코드 검토 시 발견 가능 영역"
- 외부 검토 (Gemini) 결합 시 차이 X 의식

[근거 4] Agent Teams 결합
- Opus는 "분배·결정"만
- Sonnet은 "실행" 다수
- ★ Opus 20% + Sonnet 80% 결합 흐름

Sonnet 권장이 아닌 영역 (10~20%)

💻 Opus·Haiku 권장 영역

[Opus 권장 영역 약 10~15%]
- SPEC v1 작성 (1회/Phase)
- 5파일+ 사이클 단계 ⑤ (두 검토자) 의식
- Agent Teams 분배 결정
- 어려운 디버깅 (5파일 펼침 후도 막힘)

[Haiku 권장 영역 약 5~10%]
- LLM 분류 (SSOT 입력)
- 짧은 요약 (블로그·SNS 1줄)
- 자동 발행 흐름
- 단순 응답

24-6 토크나이저 의식 — Opus 35% 더 많은 토큰 🔗

Opus 토크나이저가 한국어를 Sonnet보다 약 35% 더 많은 토큰으로 처리합니다. Opus 기본 단가가 Sonnet의 약 1.67배인데 토큰까지 더 쓰면, 한국어 작업 시 실제 비용 차이는 약 2.3배까지 벌어집니다.

한국어 시뮬레이션

💻 한국어 토큰 비교

[입력 한국어 100K 토큰 (UTF-8)]
- Sonnet: 100K 토큰 → $0.30
- Opus: 약 135K 토큰 → $0.675 (★ 2.3배)

[출력 한국어 10K 토큰]
- Sonnet: 10K 토큰 → $0.15
- Opus: 약 13.5K 토큰 → $0.338 (★ 2.3배)

영문 시뮬레이션 (비교)

💻 영문 토큰 비교

[입력 영문 100K 토큰]
- Sonnet: 100K 토큰 → $0.30
- Opus: 약 105K 토큰 → $0.525 (★ 1.75배)

한국어 작업에 Opus를 쓰면 단가 차이에 토큰 차이까지 더해져 실제로 약 2.3배 비싸집니다. 한국어 위주 프로젝트는 Sonnet 권장 의식을 강화하세요.

24-7 prompt caching 적용 — 90% 절약 🔗

prompt caching은 Sonnet·Opus·Haiku 모두 적용 가능합니다. 90% 할인 효과입니다.

캐싱 적용 영역

💻 캐싱 적용 영역

[1] 시스템 프롬프트 (페르소나·CLAUDE.md)
- 매 호출마다 동일
- 캐시 1회 + 24시간 유지
- 90% 할인

[2] 5파일 (SPEC·PLAN·REVIEW·BUILD·CLAUDE)
- 매 세션 자동 입력
- 캐시 1회 + 24시간 유지
- 90% 할인

[3] 외부 자료 (긴 문서·API 응답 누적)
- 5분 캐시 (ephemeral)
- 짧은 흐름에 적용

캐싱 적용 후 비용

💻 캐싱 비용 절감 시뮬레이션

[캐싱 X — Sonnet 100%]
- 한 달: 약 $67.5

[캐싱 적용 — Sonnet 100%]
- 한 달: 약 $25 (-63%)

[캐싱 적용 — D 결합]
- 한 달: 약 $50 (-58%)

[1년 누적 절감]
- 약 $300~$500 / 1 프로젝트
- 4 프로젝트 약 $1200~$2000

24-8 Junho 본인 흐름 — 결정·검토 Opus, 실행·코딩 Sonnet 🔗

Junho 본인의 4 프로젝트 모델 결합입니다.

4 프로젝트 모델 결합 표

작업	TSV	줍줍	AlbaFlow	viewLab
SPEC v1·v2	Opus	Opus	Opus	Opus
일반 코딩	Sonnet	Sonnet	Sonnet	Sonnet
LLM 분류	(X)	Haiku	(X)	(X)
페르소나 출력	Sonnet	Sonnet	(X)	Sonnet
Agent Teams 분배	Opus	Opus	Opus	Opus
자동 일관성	Sonnet	Sonnet	(X)	Sonnet
단순 요약	Haiku	Haiku	Haiku	Haiku

4 프로젝트 합계 — Sonnet 비중

💻 4 프로젝트 모델 비중

[총 호출 비중]
- Sonnet: 약 80%
- Opus: 약 12%
- Haiku: 약 8%

[월 비용 가설]
- Phase 1 (4 프로젝트): 약 $80~$120/월 (캐싱 적용)
- Phase 2 (4 프로젝트): 약 $200~$300/월

[★ Junho 권장]
- 결정·검토 = Opus
- 실행·코딩 = Sonnet
- 분류·요약 = Haiku
- 비중 80~90% Sonnet 의식

📌 새 24장 정리

핵심 한 줄: 80~90% Sonnet 기본 권장. 결정·검토만 Opus. 분류·요약만 Haiku. 속도 2~3배·한국어 비용 약 2.3배 차이 인지.

단가: Opus $5/$25 (한국어 실제 약 2.3배 Sonnet 비) / Sonnet $3/$15 (기준) / Haiku $1/$5 (1/3 Sonnet)
속도: Opus 8~15초 / Sonnet 3~5초 / Haiku 1~2초. 1년 누적 대기 차이 +80시간 (Opus 100% vs Sonnet 100%)
품질 (벤치마크): Opus 87.6% SWE-bench / Sonnet 85.7% / Haiku 79.1%. 일반 코딩 차이 2%포인트만 (Sonnet 96% / Opus 98%)
작업 종류별 권장 8개: 일반 코딩 (Sonnet) / SPEC v1 (Opus) / Gemini 검토 응답 (Sonnet) / LLM 분류 (Haiku) / 페르소나 출력 (Sonnet) / Agent Teams 분배 (Opus) / 단순 요약 (Haiku) / 자동 일관성 (Sonnet)
80~90% Sonnet 권장 4 근거: ① 한국어 비용 약 2.3배 차이 ② 속도 2~3배 차이 ③ 품질 차이 2%포인트만 ④ Agent Teams 결합 흐름
prompt caching 90% 할인: 1년 절감 약 $300~$500/프로젝트
Junho 4 프로젝트 모델 결합: Sonnet 80% + Opus 12% + Haiku 8%

3 모델 (Sonnet·Opus·Haiku) 의 가격·속도·품질 차이가 손에 들렸습니다. 80~90% Sonnet 권장 흐름·작업별 결합·캐싱 적용·Junho 흐름까지. 한 달 약 $50~$120/프로젝트의 흐름이 "두려움"이 사라졌습니다.

다음 장에서 한국어 의식을 다룹니다. AI는 영어 자료가 본문이지만 사용자는 한국어 — 의식 흐름입니다.

← 23장 — Agent Teams 25장 — 한국어 의식 →