Claude Code의 Advisor 전략

Toma

2026년 4월 13일

🤖 Claude Code의 Advisor 전략 — 비용은 낮추고 품질은 높이는 모델 페어링

💡 핵심 한 줄 요약: 비싼 모델(Opus)을 항상 쓰는 대신, 저렴한 모델(Sonnet/Haiku)이 전체 작업을 이끌고 판단이 어려운 순간에만 Opus에게 자문을 구합니다.

🧠 왜 Advisor 전략이 탄생했나

기존의 멀티모델 시스템은 보통 이런 구조였습니다.

비싼 대형 모델(오케스트레이터) → 작업 분해 → 저렴한 소형 모델(워커)에게 위임

이 방식은 두 가지 문제가 있습니다.

비용 병목: 모든 판단이 비싼 모델을 통과해야 합니다.
속도 저하: 오케스트레이터가 매 단계를 지시하므로 레이턴시가 쌓입니다.

Anthropic은 이 구조를 완전히 뒤집었습니다.

🔄 Advisor 전략의 핵심 구조

mermaid

flowchart TD
    A["Executor: Sonnet 4.6 또는 Haiku 4.5"] -->|"파일 읽기, 코드 작성, 테스트 실행..."| B{"판단이 어려운 결정?"}
    B -->|"아니오"| C["계속 실행"]
    B -->|"예"| D["Advisor: Opus 4.6에게 자문 요청"]
    D -->|"400~700 토큰의 전략적 조언 반환<br>(도구 없이 순수 추론만)"| A
    C --> E["작업 완료"]

역할 분리

역할	모델	하는 일
Executor (실행자)	Sonnet 4.6 / Haiku 4.5	파일 읽기, 코드 작성, 테스트 실행 등 전체 작업 수행
Advisor (자문역)	Opus 4.6	도구 없이 순수 추론만. 막힌 지점에 전략적 조언 제공

⚠️ 중요: Opus(Advisor)는 도구를 직접 실행하지 않습니다. 오직 판단과 추론만 담당합니다. 모든 실제 작업은 Executor가 처리합니다.

📊 실제 성능 데이터

Anthropic이 공개한 벤치마크 결과입니다.

SWE-bench Multilingual (코드 작업 능력)

구성	점수	비용 변화
Sonnet 4.6 단독	72.1%	기준
Sonnet 4.6 + Opus Advisor	74.8% ↑ +2.7%p	-11.9% 절감

성능이 오르면서 비용이 줄었습니다. 반직관적이지만, Opus 호출을 꼭 필요한 순간에만 제한하기 때문입니다.

BrowseComp (웹 탐색 추론 능력)

구성	점수	Sonnet 단독 대비 비용
Haiku 4.5 단독	19.7%	매우 저렴
Haiku 4.5 + Opus Advisor	41.2% ↑ 2배↑	-85% 저렴
Sonnet 4.6 단독	~58% (추정)	기준

💡 왜 BrowseComp에서 이렇게 극적인 향상이 나타날까요?
웹 탐색 작업은 대부분 반복적인 클릭과 읽기입니다. 이 반복 작업은 Haiku로 충분합니다. 하지만 "다음엔 어느 링크를 따라가야 하는가"라는 전략적 판단 순간에 Opus가 개입하면 결과가 극적으로 달라집니다.

🛠️ 어떻게 사용하나

Claude Code CLI

Claude Code에서는 명령어 하나로 바로 활성화할 수 있습니다.

bash

/advisor
# → Opus 4.6 선택
# → 추가 설정 없이 바로 사용

Anthropic API (개발자용)

API로 직접 통합할 경우 beta 헤더와 tool 선언이 필요합니다.

python

response = client.messages.create(
    model="claude-sonnet-4-6",
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",
            "max_uses": 3,  # Advisor 호출 횟수 상한
        },
    ],
    messages=[...]
)

javascript

anthropic-beta: advisor-tool-2026-03-01

💡 max_uses 파라미터: Advisor(Opus) 호출 횟수를 제한해 비용을 예측 가능하게 제어합니다. Advisor 토큰은 Opus 요금, Executor 토큰은 해당 모델 요금으로 각각 청구됩니다.

💡 컨텍스트 관리 방식

Advisor 전략은 단순한 호출-응답이 아닙니다. 세션 전반에 걸쳐 조언이 누적됩니다.

조언 누적: 세션 내 Opus의 조언은 지속적으로 쌓이며 유지됩니다.
이탈 감지: 실행이 조언에서 크게 벗어나면 재자문을 유도합니다.
압축 후에도 유지: 컨텍스트 압축이 발생해도 이전 조언에 접근 가능합니다.

🏗️ 실제 팀 구조와의 유사성

💬 "Advisor 전략은 시니어 개발자가 팀을 이끄는 방식과 동일합니다. 주니어가 실무 전반을 담당하고, 막히는 순간에만 시니어에게 질문합니다. 시니어는 직접 코드를 짜지 않고 방향을 제시합니다."

이 비유가 중요한 이유: Opus가 모든 단계를 통제하면 병목이 생기지만, 판단이 필요한 순간에만 호출하면 팀 전체의 효율이 극대화됩니다.

📐 어떤 작업에 가장 효과적인가

✅ 효과적인 경우

긴 agentic 작업 (파일 탐색 → 코드 수정 → 테스트)
웹 탐색 + 정보 종합이 필요한 리서치
아키텍처 결정이 중간에 필요한 구현
비용 예산이 있는 프로덕션 에이전트

⚠️ 효과가 제한적인 경우

단순 Q&A (Advisor 호출이 발생하지 않음)
매우 짧은 단일 응답 작업
Haiku만으로 충분한 반복 루틴 작업

🔑 핵심 정리

구성	품질	비용	속도
Opus 단독	최고	매우 높음	느림
Sonnet + Opus Advisor	높음	중간 (Sonnet보다 낮음)	빠름
Sonnet 단독	중간	중간	빠름
Haiku + Opus Advisor	중간	매우 낮음 (-85%)	매우 빠름

✅ 결론: Advisor 전략은 "비용 대비 품질"의 최적점을 찾는 설계입니다. 루틴한 작업은 저렴하게, 고도의 판단이 필요한 순간만 강력하게. 이것이 Anthropic이 제안하는 차세대 agentic AI 아키텍처입니다.