💡 핵심 한 줄 요약: 비싼 모델(Opus)을 항상 쓰는 대신, 저렴한 모델(Sonnet/Haiku)이 전체 작업을 이끌고 판단이 어려운 순간에만 Opus에게 자문을 구합니다.
기존의 멀티모델 시스템은 보통 이런 구조였습니다.
비싼 대형 모델(오케스트레이터) → 작업 분해 → 저렴한 소형 모델(워커)에게 위임
이 방식은 두 가지 문제가 있습니다.
Anthropic은 이 구조를 완전히 뒤집었습니다.
flowchart TD
A["Executor: Sonnet 4.6 또는 Haiku 4.5"] -->|"파일 읽기, 코드 작성, 테스트 실행..."| B{"판단이 어려운 결정?"}
B -->|"아니오"| C["계속 실행"]
B -->|"예"| D["Advisor: Opus 4.6에게 자문 요청"]
D -->|"400~700 토큰의 전략적 조언 반환<br>(도구 없이 순수 추론만)"| A
C --> E["작업 완료"]| 역할 | 모델 | 하는 일 |
|---|---|---|
| Executor (실행자) | Sonnet 4.6 / Haiku 4.5 | 파일 읽기, 코드 작성, 테스트 실행 등 전체 작업 수행 |
| Advisor (자문역) | Opus 4.6 | 도구 없이 순수 추론만. 막힌 지점에 전략적 조언 제공 |
⚠️ 중요: Opus(Advisor)는 도구를 직접 실행하지 않습니다. 오직 판단과 추론만 담당합니다. 모든 실제 작업은 Executor가 처리합니다.
Anthropic이 공개한 벤치마크 결과입니다.
| 구성 | 점수 | 비용 변화 |
|---|---|---|
| Sonnet 4.6 단독 | 72.1% | 기준 |
| Sonnet 4.6 + Opus Advisor | 74.8% ↑ +2.7%p | -11.9% 절감 |
성능이 오르면서 비용이 줄었습니다. 반직관적이지만, Opus 호출을 꼭 필요한 순간에만 제한하기 때문입니다.
| 구성 | 점수 | Sonnet 단독 대비 비용 |
|---|---|---|
| Haiku 4.5 단독 | 19.7% | 매우 저렴 |
| Haiku 4.5 + Opus Advisor | 41.2% ↑ 2배↑ | -85% 저렴 |
| Sonnet 4.6 단독 | ~58% (추정) | 기준 |
💡 왜 BrowseComp에서 이렇게 극적인 향상이 나타날까요?
웹 탐색 작업은 대부분 반복적인 클릭과 읽기입니다. 이 반복 작업은 Haiku로 충분합니다. 하지만 "다음엔 어느 링크를 따라가야 하는가"라는 전략적 판단 순간에 Opus가 개입하면 결과가 극적으로 달라집니다.
Claude Code에서는 명령어 하나로 바로 활성화할 수 있습니다.
/advisor
# → Opus 4.6 선택
# → 추가 설정 없이 바로 사용API로 직접 통합할 경우 beta 헤더와 tool 선언이 필요합니다.
response = client.messages.create(
model="claude-sonnet-4-6",
tools=[
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
"max_uses": 3, # Advisor 호출 횟수 상한
},
],
messages=[...]
)anthropic-beta: advisor-tool-2026-03-01💡
max_uses파라미터: Advisor(Opus) 호출 횟수를 제한해 비용을 예측 가능하게 제어합니다. Advisor 토큰은 Opus 요금, Executor 토큰은 해당 모델 요금으로 각각 청구됩니다.
Advisor 전략은 단순한 호출-응답이 아닙니다. 세션 전반에 걸쳐 조언이 누적됩니다.
💬 "Advisor 전략은 시니어 개발자가 팀을 이끄는 방식과 동일합니다. 주니어가 실무 전반을 담당하고, 막히는 순간에만 시니어에게 질문합니다. 시니어는 직접 코드를 짜지 않고 방향을 제시합니다."
이 비유가 중요한 이유: Opus가 모든 단계를 통제하면 병목이 생기지만, 판단이 필요한 순간에만 호출하면 팀 전체의 효율이 극대화됩니다.
| 구성 | 품질 | 비용 | 속도 |
|---|---|---|---|
| Opus 단독 | 최고 | 매우 높음 | 느림 |
| Sonnet + Opus Advisor | 높음 | 중간 (Sonnet보다 낮음) | 빠름 |
| Sonnet 단독 | 중간 | 중간 | 빠름 |
| Haiku + Opus Advisor | 중간 | 매우 낮음 (-85%) | 매우 빠름 |
✅ 결론: Advisor 전략은 "비용 대비 품질"의 최적점을 찾는 설계입니다. 루틴한 작업은 저렴하게, 고도의 판단이 필요한 순간만 강력하게. 이것이 Anthropic이 제안하는 차세대 agentic AI 아키텍처입니다.