Sakana Fugu 実践ガイド 2026 — 複数AIを1エンドポイントで束ねるオーケストレーションモデルの使いどころ
Sakana AIが2026年6月に公開したマルチエージェント・オーケストレーションモデル「Sakana Fugu」を、エンジニア目線で整理。仕組み、FuguとFugu Ultraの違い、OpenAI互換APIでの組み込み方、既存モデル直叩きとの使い分け、ベンダーロックイン回避の観点まで。
エンジニアのゆとです。
2026年6月22日、Sakana AIが「Sakana Fugu」を正式公開した。ひとことで言うと、複数のAIモデルを内部で束ねて、1つのAPIエンドポイントから1つのモデルのように使えるオーケストレーションモデルだ。
「最強のモデルを1つ選ぶ」という発想とは別軸の製品なので、何ができて、どこで使うべきかをエンジニア目線で整理しておく。
Sakana Fugu とは何か
Fuguは、リクエストを受け取ると内部でこう判断する。
- そのまま自分で答えれば十分なら、直接答える
- 難しいタスクなら、複数の専門モデル(および自分自身の複数インスタンス)にタスクを振り、結果を検証・統合して1つの答えにする
ポイントは、Fugu自身が「いつ委譲し、どう統合するか」を訓練された言語モデルだということ。利用者から見ると、モデル選定・分担・検証・統合がすべて1エンドポイントの裏側に隠蔽される。
従来「タスクごとにどのモデルが得意か」を人間(やルーター実装)が判断していた部分を、モデル側に肩代わりさせるイメージだ。
Fugu と Fugu Ultra の違い
公開時点で2つのモデルがある。
- Fugu: 性能と低レイテンシのバランス型。コードレビュー、チャットボット、対話型サービスなど日常的なワークロード向け
- Fugu Ultra: 回答品質を最大化したフルオーケストレーション版。AI研究、論文再現、サイバーセキュリティ分析、特許調査など、難しい多段タスク向け
公式は、Fugu UltraがAnthropicのFable 5やMythos Previewと「肩を並べる」性能だとしている。アーリーユーザーからはGemini 3.1 Pro・Opus 4.8・GPT 5.5を上回ったという報告も出ている(いずれもSakana公式発表ベース。第三者検証ではない点は割り引いて読む)。
使い方:OpenAI互換APIなので差し込みは速い
実装面で一番うれしいのは、OpenAI形式と互換のAPIで提供される点。
つまり、既存のOpenAI SDKを使っているコードなら、エンドポイント(base URL)とAPIキーを差し替えるだけでドロップイン的に試せる可能性が高い。新しいSDKの学習コストを払わずに、オーケストレーションの恩恵だけ受け取れる設計になっている。提供はAPI経由(console.sakana.ai)で、日常利用向けのサブスクリプションと、重い用途向けの従量課金プランが用意されているとされる。
上位版 Fugu Ultra は入力 $5 / 出力 $30(100万トークンあたり)、272Kトークン超のコンテキストで倍額、という報道がある。サブスクは月 $20 / $100 / $200 の段階制とされる。正式な料金は公式を必ず確認すること。
エンジニアとしての使いどころ
「最強モデルを直接叩く」のと比べて、Fuguが効く場面は明確だ。
1. モデル選定を自動化したいとき
タスクの難易度がバラつくプロダクト(チャット+たまに重い分析、など)では、毎回どのモデルを呼ぶか実装で分岐するのは面倒だ。Fuguは「簡単なら自分で・難しければ束ねる」を内部でやるので、ルーティング層を自前で持たなくて済む。
2. ベンダーロックインと可用性のリスクを下げたいとき
ここがFuguの一番の主張でもある。Sakanaは公開ページで、AnthropicのFable 5・Mythosに課された輸出規制を引き合いに出し、「アクセスは一夜で消えうる」と指摘している。Fuguはどこかのプロバイダがアクセスを制限しても動的に経路を迂回する設計で、これを同社は「AI主権(AI sovereignty)に必要な設計図」と呼ぶ。
実際、Fable 5は公開からわずか3日で米政府の輸出規制命令により全世界で停止した。単一モデルにベタ付けした実装は、技術と無関係な理由で突然止まりうる——という教訓が、奇しくも同じ週に実演された形だ。
3. 1つの窓口で品質を底上げしたいとき
複数モデルの検証・統合を内部でやるため、単体モデルより誤りが減る場面がある(自己検証つきのアンサンブル的な効果)。ただしその分、内部で複数回の推論が走るのでコストとレイテンシは読みにくい。バランス型のFuguと品質型のUltraを用途で使い分けるのが現実解になる。
既存モデル直叩きとの使い分け
- 直叩きが向く: レイテンシ・コストを厳密に予測したい、特定モデルの挙動に依存した最適化をしている、すでに特定プロバイダで運用が固まっている
- Fuguが向く: タスク難易度がばらつく、モデル選定を抽象化したい、可用性リスク(規制・障害・値上げ)に対する迂回路がほしい
要は「性能の最大化」だけでなく「運用の安定性とロックイン回避」を重視するなら、オーケストレーション層を1枚噛ませる価値がある、という選択肢が増えた。
まとめ
Sakana Fuguは、「最強モデルを1つ選ぶ」競争に、「最強たちを束ねて1エンドポイントにする」という別解を持ち込んだ。
- 複数モデルを内部で委譲・検証・統合する、指揮者型のオーケストレーションモデル
- OpenAI互換APIで差し込みやすい
- ベンダーロックイン・可用性リスクへの迂回路を売りにする(Fable 5の輸出規制停止が、その主張を裏付ける形になった)
性能の主張はまだ自社・アーリーユーザー段階なので、本番投入はベンチを自分のタスクで取ってから。ただ「どのモデルが最強か」だけでなく「複数をどう束ね、どう逃げ道を持つか」が設計テーマになってきたのは間違いない。