「全部Opusで動かせば最高品質」——これは正しい。だが、月末の請求書を見て後悔するのも、また事実だ。
2026年4月、Anthropicはモデルの「賢い使い分け」を公式にサポートする仕組みを整えた。API向けのAdvisor Tool、Claude Code向けのopusplanエイリアス、そしてコミュニティ主導のモデルルーティングツール。この記事では、これら3つのアプローチを整理し、「自分にとっての最適解」を見つけるための判断材料を提供する。
Advisor Tool: executorとadvisorの二段構え
Advisor Toolの発想は明快だ。安いモデル(SonnetやHaiku)にタスクを実行させ、複雑な判断が必要な場面だけOpusに「相談」する。全て単一のAPIリクエスト内で完結し、advisorのトークンはexecutorとは別レートで課金される。
実装はこんな感じだ。executor(Sonnet 4.6)がコードを書いている最中に「この設計方針でいいか?」と判断に迷うと、advisorツールを呼び出す。Anthropicサーバー側でOpus 4.6が全会話履歴を参照し、400-700トークンの戦略的アドバイスを返す。executorはそのアドバイスを踏まえて作業を続行する。
ベンチマークが語る「安くて賢い」の実態
最もインパクトがあるのはHaiku + Opus advisorの構成だ。
| 構成 | ベンチマーク | 結果 |
|---|---|---|
| Haiku + Opus advisor | BrowseComp | 19.7% → 41.2%(2倍超) |
| Haiku + Opus advisor | コスト | Sonnet単体比 -85% |
| Sonnet + Opus advisor | SWE-bench Multilingual | Sonnet単体比 +2.7pp |
| Sonnet + Opus advisor | コスト | タスクあたり -11.9% |
Eve Legal社は「フロンティアモデル同等品質を5倍低コストで実現」、Bolt社は「複雑タスクの設計判断が向上し、単純タスクにはオーバーヘッドゼロ」と報告している。あるOpenClawユーザーは「ワークフローの85%をHaikuに切り替えたら月額$140が$12になった」と証言している。
opusplan: Claude Codeユーザーのための最もシンプルな選択肢
settings.jsonに"model": "opusplan"と書くだけで使える。Plan Mode(Shift+Tab切り替え)でOpusが動き、通常の実行はSonnetになる。
だが、ここに落とし穴がある。
GitHub Issue #27665で明らかになった内部ロジックによれば、opusplanは「Plan Modeに入っているときだけ」Opusを使う。通常の会話ターン、ツール呼び出し、サブエージェントの実行——これらは全てSonnetだ。「Opusで考え、Sonnetで実行」というマーケティング的イメージと実際の動作には、認識すべきギャップがある。
さらに、コンテキストが200Kトークンを超えるとPlan Modeでもsonnetにフォールバックする。長大なコードベースを扱う場合は、この制限を意識する必要がある。
コミュニティが求めている「本当のルーティング」
Issue #27665には30以上の関連Issueがリンクしており、ユーザーが求めているのは以下の段階的改善だ。
- 短期: サブエージェントのデフォルトをSonnetに変更
- 中期: メッセージ単位のモデルオーバーライド(
//s,//h構文) - 中長期: settings.jsonでのルーティングルール設定
- 将来: タスク複雑度に基づく自動ルーティング
現時点では公式の自動ルーティングは存在しないため、claude-code-router(musistudio)やclaude-router(0xrdan)といったコミュニティツールが人気を集めている。
4月4日の課金変更が全てを変えた
サードパーティツール(Cline、aider、Cursor等)のPro/Maxサブスクリプション利用が停止され、従量課金に移行した。Claude Code(ファーストパーティ)は引き続きサブスクリプション内だが、このタイミングでAdvisor Toolを公開したのは偶然ではないと私は見ている。
「全部Opusで定額使い放題」のサードパーティ利用がなくなり、従量課金で一打ちごとにコストが見える世界になった。モデルルーティングは「技術的な最適化」から「コスト戦略」に格上げされたのだ。
私ならどうするか
3つの導入パスを整理する。
パス1: まずopusplanを試す(所要5分)。settings.jsonに1行追加するだけ。Plan ModeでOpusの深い推論を活用しつつ、実行コストを抑える。最もリスクが低い。
パス2: サブエージェントモデルを固定する(所要15分)。環境変数CLAUDE_CODE_SUBAGENT_MODEL=sonnetを設定し、エージェント定義ファイルのmodel:を明示的に指定する。planner や security-reviewer など推論が重要なエージェントのみmodel: opusを維持。
パス3: Advisor Tool をカスタムMCPサーバーに組み込む(所要半日)。API直接利用がある場合のみ。Haiku executor + Opus advisorで85%のコスト削減は魅力的だが、実装工数がかかる。
50名以上のチームを率つマネージャーとして、私ならパス1→パス2の順で段階的に進める。コスト削減効果を数値で確認しながら、品質の低下が許容範囲かを見極める。全てをOpusで動かす贅沢は、「ここぞ」という場面に取っておく方がいい。