Claude Sonnet 5 完全解説 | Opus 4.8級エージェント性能をSonnet価格で手に入れる
2026年6月30日リリースのClaude Sonnet 5を徹底解説。全ベンチマーク数値・価格の実態(30%トークン増の意味)・API移行3つの破壊的変更(temperature廃止・Adaptive Thinking強制・Priority Tier削除)をエンジニア目線でまとめた。
エンジニアのゆとです。
2026年6月30日(米国時間)、AnthropicがClaude Sonnet 5をリリースした。
一言で言うと「Sonnetの価格でOpus 4.8に近い性能が出る」モデルだ。エージェント系タスクのベンチマークを見ると確かに伸びている。知識労働の指標では、上位モデルであるOpus 4.8を実際に上回っている項目もある。
ただ「スペックがすごい」だけの話なら他にいくらでも記事がある。
この記事でしっかり書きたいのは、既存コードに何が起きるかだ。今回のSonnet 5は、性能向上と引き換えにAPIレベルで3つの破壊的変更が入っている。移行で詰まるのはほぼこの3点で、そこを他の記事はあまり丁寧に書いていない。
価格についても「$3/$15で据え置き」という書かれ方をよく見るが、新しいトークナイザーを込みで計算すると9月以降は実質値上げになる。その試算もやる。
Claude Sonnet 5 — 30秒でわかるポイント
まず基本スペックを押さえる。
| 項目 | Claude Sonnet 5 |
|---|---|
| API ID | claude-sonnet-5 |
| リリース日 | 2026年6月30日 |
| コンテキストウィンドウ | 100万トークン |
| 最大出力 | 128,000トークン |
| 知識カットオフ | 2026年1月 |
| Adaptive Thinking | デフォルトON |
| 導入価格(〜8/31) | 入力$2・出力$10 / 1Mトークン |
| 標準価格(9/1〜) | 入力$3・出力$15 / 1Mトークン |
| 提供プラン | Free / Pro / Max / Team / Enterprise(全プラン対応) |
FreeとProプランのデフォルトモデルとして設定されているので、今日からclaude.aiにアクセスすれば既にSonnet 5が動いている状態だ。
プラットフォーム対応はClaude API・AWS Bedrock(Messages API)・Google Cloud・Microsoft Foundry(プレビュー)。なお、AWS Bedrock LegacyのInvokeModelおよびConverse APIはSonnet 5に対応していないため、これを使っている場合は別途確認が必要だ。
ベンチマーク全数値 — Sonnet 4.6・Opus 4.8との比較
公開されているベンチマークをまとめる。
| ベンチマーク | Sonnet 4.6 | Sonnet 5 | Opus 4.8 |
|---|---|---|---|
| SWE-bench Pro(コーディング) | 58.1% | 63.2% | 69.2% |
| Terminal-Bench 2.1(ターミナル操作) | 67.0% | 80.4% | — |
| GDPval-AA v2(知識労働) | 1,395 | 1,618 | 1,615 |
| Computer Use / OSWorld(PC操作) | 78.5% | 81.2% | 83.4% |
注目したいのはGDPval-AA v2だ。知識労働系のベンチマークで、Sonnet 5のスコアは1,618と、Opus 4.8の1,615をわずかに上回っている。コーディング(SWE-bench)ではOpus 4.8に6pt差があるが、知識作業の領域では逆転している。
Terminal-Bench 2.1の伸び幅も大きい。Sonnet 4.6比で+13pt以上。エージェントがターミナルを操作して自律的にタスクを進めるシナリオでの精度向上が顕著だ。
コーディングの頂点はまだOpus 4.8(69.2%)だが、Sonnet 5(63.2%)は3世代前のOpus系モデルと同等以上の水準にある。実務の大半はSonnet 5で十分まかなえる、という感触はある。
API移行で詰まる3つの破壊的変更(最重要)
ここが今回の記事の核心だ。
Sonnet 5はSonnet 4.6の「drop-in replacement」として設計されているが、3点の動作変更が入っている。どれもAPIレベルの変更なので、既存コードをそのままSonnet 5に向けるとランタイムエラーが出る可能性がある。
1. temperature / top_p / top_k をデフォルト以外に設定すると400エラー
これが一番詰まりやすい。
Claude APIでtemperatureやtop_pを設定しているコードは、Sonnet 5では400エラーを返す。
import anthropic
client = anthropic.Anthropic()
# Sonnet 5では400エラー
response = client.messages.create(
model="claude-sonnet-5",
max_tokens=1024,
temperature=0.7, # ← これでエラー
messages=[{"role": "user", "content": "Hello"}]
)
# 正しい書き方(パラメータを削除する)
response = client.messages.create(
model="claude-sonnet-5",
max_tokens=1024,
# temperature は指定しない
messages=[{"role": "user", "content": "Hello"}]
)
デフォルト値(temperature=1.0など)を明示的に渡しても問題ないが、非デフォルト値はすべてNGだ。
移行前に、自分のコードベースを以下でグレップしておくと良い。
grep -r "temperature\|top_p\|top_k" . --include="*.py" --include="*.ts"
ヒットした箇所のすべてが問題になるわけではないが、デフォルト以外の値を使っていれば修正が必要だ。
なお、これと同じ制約は以前にClaude Opus 4.7で導入されていた。Sonnet クラスでは今回が初めての導入になる。モデルの動作を誘導するにはtemperatureではなくシステムプロンプトで指示する設計に切り替える必要がある。
2. Adaptive Thinking がデフォルトON — max_tokens の設計が変わる
Sonnet 4.6ではthinkingフィールドを指定しない限り、思考なしで動作した。
Sonnet 5ではデフォルトでAdaptive Thinkingが有効になる。つまり、特に指定しなくてもモデルが思考する。
何が問題かというと、max_tokensが思考トークンを含む「総出力の上限」として機能するようになる点だ。
# Sonnet 4.6: max_tokens=1024 → レスポンステキストが最大1024トークン
# Sonnet 5: max_tokens=1024 → 思考 + レスポンステキストの合計が1024トークン
# 思考を無効にしたい場合
response = client.messages.create(
model="claude-sonnet-5",
max_tokens=1024,
thinking={"type": "disabled"}, # ← 明示的に無効化
messages=[{"role": "user", "content": "Hello"}]
)
Sonnet 4.6向けにmax_tokensを「だいたいこれくらいの出力が欲しい」という感覚で設定していた場合、Sonnet 5では思考分が先に消費されてレスポンスが意図より短くなることがある。移行時にはmax_tokensを余裕を持った値に見直すか、思考を明示的に無効化する設計を検討したい。
3. 手動の拡張思考(budget_tokens)が廃止
Sonnet 4.6では非推奨になっていた手動の拡張思考が、Sonnet 5で完全に廃止された。
# Sonnet 5では400エラーを返す
thinking = {"type": "enabled", "budget_tokens": 32000}
# 代わりに Adaptive Thinking の effort で制御する
thinking = {"type": "adaptive"} # ← これが正しい形式
effortパラメータによる制御に移行する。effort: "high"がデフォルトで、"low" "medium" "high"から選択できる。effortの詳細については以下の記事を参照してほしい。

「価格据え置き」の正体 — 新トークナイザーで実コストを試算する
多くの記事が「Sonnet 4.6と同じ$3/$15で性能が上がった」と書いている。これは正確ではない。
Sonnet 5は新しいトークナイザーを採用している。Opus 4.7から使われているものと同じで、同じテキストに対して従来より約30%多くのトークンを生成する。
トークンあたりの単価は据え置きでも、同じリクエストを送ると消費トークン数が増えるため、実効コストは変わる。
計算してみる。
導入期間中(〜2026年8月31日): 入力$2/MTok- 旧トークナイザー(Sonnet 4.6)で1,000トークンのテキスト
- 新トークナイザー(Sonnet 5)では同じテキストが約1,300トークン
- コスト: 1,300 × $0.000002 = $0.0026(Sonnet 4.6の$0.003より安い)
- 同じテキストが1,300トークン
- コスト: 1,300 × $0.000003 = $0.0039(Sonnet 4.6の$0.003より30%高い)
つまり、9月以降は「価格据え置き」でも実質30%の値上げになる。
導入価格の$2/$10は確かにお得だが、それは9月までの話だ。9月以降のコスト設計は新トークナイザーを前提に組み直す必要がある。
特に影響が大きいのは、max_tokensを厳密に管理しているシステムと、トークン消費量を予算計算に使っているケースだ。Sonnet 4.6で測定したカウントをそのまま流用しないこと。Sonnet 5上で再測定する必要がある。
トークンコスト最適化の一般的な手法については、こちらでまとめている。

エージェント実務での変化 — Claude Code × Sonnet 5
Sonnet 5のリリースノートに書かれていて、Claude Codeユーザーには特に重要な変更がある。
Claude APIとClaude Codeでのeffortデフォルト値がhighに設定された。
Opus 4.8では以前からこの設定だったが、Sonnet 5でも同様になった。つまり、Claude Codeを使って複雑なコーディングタスクを依頼した際、モデルは積極的に思考を使いながら処理を進める。
実用上は「より丁寧に考えてから書いてくれる」ことが多くなる一方、処理時間とトークン消費が増える側面もある。単純なファイル操作や定型タスクを大量に回したい場合は、effort: "low"を明示的に設定した方がコスト効率が良い場合がある。
コードのレビューにClaude Code Reviewを使っている場合、Sonnet 5への移行でSWE-bench精度向上(58.1%→63.2%)の恩恵を受けてレビュー品質も上がることが期待できる。
ベンチマークで見たTerminal-Bench 2.1の+13ptは、このエージェント設計の変化が直接影響しているはずだ。ツールを使いながら計画→実行→検証のサイクルを自律的に回せるようになったのが、今世代のSonnetの実質的な変化だと感じる。
Python APIでエージェントシステムを組んでいる方にはこちらも参照してほしい。

移行チェックリスト — Sonnet 4.6 → Sonnet 5
まとめると、移行時に確認すべきポイントは以下の3点だ。
チェックリスト
[ ] temperature / top_p / top_k の非デフォルト指定を削除した
[ ] max_tokens を思考分込みで見直した(または thinking: {type: "disabled"} を明示)
[ ] budget_tokens を使った手動拡張思考を effort パラメータに置き換えた
モデルID変更のみで移行できるケース
以下の条件をすべて満たす場合、モデルIDの変更だけで動く。
temperature/top_p/top_kを設定していない(またはデフォルト値のみ)- 手動の拡張思考(
budget_tokens)を使っていない max_tokensに余裕がある(または思考を使わないシステム)- アシスタントメッセージのプリフィルを使っていない(これはSonnet 4.6から既に非対応)
# 最小限の移行
model = "claude-sonnet-4-6" # Before
model = "claude-sonnet-5" # After
Priority Tier について
一点、地味に重要な変更がある。Claude Sonnet 5はPriority Tierに対応していない。
Priority Tierは高負荷時でも優先的にAPIキャパシティを確保できる機能だ。Sonnet 4.6では利用できたが、Sonnet 5では現時点で非対応になっている。SLAが厳しいプロダクション環境でPriority Tierを使っていた場合は、移行前に確認が必要だ。
FAQ
Q: FreeプランのClaudeがSonnet 5になったが、以前のSonnet 4.6を指定できるか?A: API経由であればモデルIDでclaude-sonnet-4-6を指定することで引き続き使える。Claude.aiのUI上では新モデルへの移行が進むが、ロールバック機能は現状提供されていない。
A: 常に発生するわけではなく、モデルが判断した場合にのみ思考が走る。単純なタスクでは思考なしで応答することも多い。thinking: {type: "disabled"}を指定すれば完全に無効化できる。
A: Anthropicの現行ラインナップを整理すると、Haiku 4.5(高速・低コスト)→ Sonnet 5(バランス)→ Opus 4.8(高精度エージェント)→ Fable 5(最高性能、一般提供中)となっている。Sonnet 5は中価格帯でOpus級の性能に近づいたモデルと位置付けられている。
Q: Claudeのサブスクリプション変更との関係は?A: 2026年6月に入った対話/自動化の課金分離と、Sonnet 5のリリースは独立した変更だ。詳細は以下の記事を参照してほしい。

A: 価格面では、Sonnet 5の導入価格$2/$10はGPT-5.5より安い水準にある。ベンチマーク上の直接比較は現時点で公式に出ていないが、エージェント・コーディング系はAnthropicの得意領域で、OSWorldのような実機操作ベンチマークでSonnet 5(81.2%)は高い水準にある。
まとめ
Claude Sonnet 5のポイントを整理する。
性能面の変化- SWE-bench Pro: 58.1%(Sonnet 4.6)→ 63.2%(Sonnet 5)
- 知識労働GDPval-AA v2でOpus 4.8を超える(1,618 vs 1,615)
- Terminal-Bench 2.1でSonnet 4.6比+13pt超の大幅向上
temperature/top_p/top_k非デフォルト値 → 400エラー- Adaptive Thinkingデフォル化 →
max_tokensの見直し必要 - 手動拡張思考(
budget_tokens)廃止 →effortパラメータに移行
- 導入期間(〜8/31)は$2/$10: 新トークナイザー込みでも実質的に安い
- 標準価格(9/1〜)は$3/$15: 30%トークン増で実効コストは$3.9/$19.5相当
エージェント用途でSonnet 4.6を使っていたなら、移行する価値はある。ただし破壊的変更3点の確認なしにモデルIDだけ変えると詰まる可能性があるので、本番適用前にステージング環境で動作確認することを勧める。
参考リンク