Anthropicが「性能高すぎて公開できない」ってしてた Claude Mythos の正体 — Opus 4.8 を超える性能と Project Glasswing 150組織の運用実態
Anthropic が一般公開を見送ったフロンティアモデル Claude Mythos Preview の全容を、Opus 4.7/4.8 とのベンチマーク差、Project Glasswing 12 Launch Partners、2026年6月3日の日本政府アクセス権取得、メガバンク3行と富士通の動き、ホワイトハウスとの対立構造まで、技術者視点で出典付きで整理。SWE-bench Verified 93.9% / USAMO 97.6% / Terminal-Bench 82.0% / CyberGym 83.1% の意味、料金体系($25/$125 per MTok)、Anthropic Customer Zero 戦略(日立 29万人 / Deloitte 47万人)、Project YATA-Shield と官民タスクフォース 36 機関、6月後半〜7月末の公開タイムラインまで網羅した深掘り記事。
エンジニアのゆとです。
Anthropic が 2026 年 4 月 7 日に発表した「Claude Mythos Preview」。一般公開されないフロンティアモデルとして登場し、Project Glasswing 経由で世界の重要インフラ運営者だけが触れる、という変則的な配り方になっている。
そして 2026 年 6 月 3 日、松本デジタル大臣の臨時閣議後記者会見で 日本政府が正式に Mythos のアクセス権を取得した ことが発表された。これは Trump 政権ホワイトハウスが利用拡大に反対する中で日本が握った合意であり、 Anthropic の 「非EU・非米政府への初の正式 bilateral safety commitment」 という重い意味を持つ。
この記事では以下を技術者視点で整理する。
- Claude Mythos のベンチマーク数値とその意味
- Project Glasswing 12 Launch Partners と 150 組織拡張
- 日本政府 / メガバンク3行 / 富士通 / 日立 / NEC の動き
- Anthropic vs Trump 政権の対立構造
- Opus 4.7 → 4.8 → Mythos のリリーススパン
- 一般公開タイムラインとフリーランスエンジニアへの示唆
引用元はカード化してあるので、それぞれの一次ソースに直接飛んで確認できる。
ドラマ寄り・一般向けの整理は note にも書いた。両方読むと立体的に見える構成。
Claude Mythos Preview — モデル概要
Anthropic は 2026 年 4 月 7 日、Claude Mythos Preview を発表した。
公式アナウンスでの位置付けは 「Opus 4.7 の上、capability tier が一段上のフロンティアモデル」。Pro / Max / Team / Enterprise いずれのプランからもアクセス不可、claude.ai での選択肢にも出ない、公開 API エンドポイントもなし。
唯一の入手経路が後述する Project Glasswing。この時点で従来の「モデルリリース → API 公開 → SDK 公開 → 順次拡大」というパスとは違うことがわかる。
料金は 入力 $25 / 100万トークン、出力 $125 / 100万トークン。Opus 4.7(入力 $5 / 出力 $25)の 5 倍 設定で、それでも申し込み待ちが生じている、というのが 4-5 月時点の状況だった。
ベンチマーク — Opus 4.7/4.8 との差分
Mythos Preview の公開ベンチマークスコアを並べる。
Mythos Preview
- SWE-bench Verified: 93.9%
- SWE-bench Pro: 77.8%
- Terminal-Bench 2.0: 82.0%
- USAMO 2026: 97.6%
- CyberGym(サイバーセキュリティ評価): 83.1%
Opus 4.8(2026/5/28 リリース、現行ベストの市販モデル)
- SWE-bench Verified: 88.6%
- SWE-bench Pro: 69.2%
- GDPval-AA: 1890(GPT-5.5 比 +121 Elo)
- Online-Mind2Web: 84%
- Sierra Legal Agent Benchmark: 全パス標準で初の 10% 超え
- Hebbia Super-Agent: 全ケース完走
解釈
SWE-bench Verified で +5.3 ポイント(88.6 → 93.9)の差は、コード生成系ベンチではほぼ実装能力の天井に近い領域。Opus 4.8 の段階で「人間のシニアエンジニアと互角」くらいなので、Mythos は「シニアエンジニアより速くて正確」のレンジに入ってくる。
USAMO 2026 で 97.6% は、人間の数学オリンピック金メダル候補が解けない問題まで解ける、という意味。一般的な推論ベンチが飽和したため、Anthropic は USAMO のような超高難度ベンチを引いてきている。
Terminal-Bench 2.0 の 82.0% は CLI 環境で自律的にタスクを完遂する能力。Claude Code の運用品質に直結するベンチで、Opus 4.7 / 4.8 から目に見える進化が出ている。
CyberGym 83.1% は脆弱性発見・悪用評価ベンチで、Project Glasswing 配下での実績(2 ヶ月で 10,000 件以上の高〜致命的脆弱性を自律発見)と整合する数値。
なぜ「一般公開しなかった」のか — 防御セキュリティの文脈
Mythos が一般公開を見送られた最大の理由は、サイバー兵器化リスク。
Anthropic が Mythos を限定的にセキュリティ研究者と防御運用組織に渡したところ、2 ヶ月で 10,000 件以上の高〜致命的深刻度の脆弱性が自律発見 された。発見された脆弱性の中には、以下のような長期未解決バグが含まれている。
- 27 年前から潜在していた OpenBSD の TCP SACK リモートコード実行バグ
- 17 年前から放置されていた FreeBSD NFS RCE → CVE-2026-4747
これは防御側で使えば「世界の OSS インフラを底上げできる」だが、攻撃側に渡れば「ゼロデイ大量量産マシン」になる。Anthropic はこのモデルを「制御付き配布」とすることで、悪用リスクを下げつつ防御側に先行投入する判断をした。
JBPress は Mythos の現状を 「核兵器並みの存在感を帯び始めた先端AIモデル」 と表現している。
Project Glasswing 12 Launch Partners
Mythos を最初に渡された 12 社のラインナップ。Anthropic 公式の発表ベースで列挙する。
| カテゴリ | 企業 |
|---|---|
| クラウド | Amazon Web Services, Google, Microsoft |
| デバイス | Apple |
| 半導体 | Broadcom, NVIDIA |
| ネットワーク | Cisco |
| セキュリティベンダー | CrowdStrike, Palo Alto Networks |
| 金融 | JPMorgan Chase |
| OSS 基盤 | Linux Foundation |
| AI ラボ | Anthropic |
「これが落ちたら現代社会が止まる」レイヤーの企業群が集められている。世界の重要ソフトウェアサプライチェーンを構成する各レイヤから最有力プレイヤーを 1 〜 2 社ずつ揃えた構成 になっている。
これらの企業は受け取った Mythos Preview を主に 自社製品 / 自社運用システムの脆弱性検出 に使い、検出結果をオープンソース脆弱性として責任ある開示プロセスに乗せる、という運用フローを採っている。
Project Glasswing 拡張(2026/6/2)— 150 組織 / 15+ ヶ国
2026 年 6 月 2 日、Anthropic は Project Glasswing を 約 150 組織 / 15 ヶ国以上 に拡張した。対象国に 日本 も含まれる。
新規組み入れの優先セクター:
- 電力
- 水道
- 医療
- 通信
- ハードウェアメーカー
初回 12 社で手薄だった重要インフラ領域を埋めにいった形。Anthropic は支援として以下を表明している。
- 1 億ドル分の Mythos 利用クレジット
- 400 万ドルのオープンソースセキュリティ団体への寄付
開始から 2 ヶ月で 10,000 件超の高〜致命的脆弱性発見 という実績がベースになっている。
Anthropic vs Trump 政権の対立構造
Mythos を巡る話で重要なのが、 Anthropic と 米国政府(特に Trump 政権)が公式に冷戦状態にあること。
時系列で整理する。
- 2 月:米国防総省が Anthropic を「サプライチェーンリスク」に指定。理由は Anthropic が自律型兵器・国内監視への AI 利用ガードレールの廃止を拒否したから
- Trump 大統領「Anthropic の極左連中は国防総省を恫喝しようとして致命的な間違いを犯した」と公式発言、連邦機関に Anthropic 技術停止を指令
- 4 月 17 日:仲直り会合。スコット・ベッセント財務長官参加、金融機関への脅威に関心を示す(財務省は Anthropic に協力的、国防総省は反対、という Trump 政権内の意見対立)
- 4 月 30 日:ホワイトハウスが正式に Mythos 利用拡大計画に反対表明(WSJ 報道)
この「米政府の反対」が背景にある中で、日本政府は交渉を進めていた。
4 月 28〜30 日の世界ドラマ
世界が連動して動いた 3 日間。
- 4 月 28 日:インド政府が Mythos アクセス権を正式要求。電子情報技術省が米当局と協議開始
- 4 月 29 日:Anthropic が Mythos の生命情報学領域での評価結果を公開
- 4 月 30 日:ホワイトハウスが Mythos 拡大計画に反対表明(WSJ)
この 3 日間で「Mythos は世界的に取り合いになる」という構図が明確化した。
日本政府の動き — 4 月から 6 月までの時系列
日本側の動きを月次で整理する。
4 月 20 日:自民党合同会議
自民党のサイバーセキュリティ関係部会が合同会議を開き、政府に対して 緊急の防衛強化提言 をまとめた。Mythos 発表からわずか 13 日後の動き。
4 月 24 日:片山金融相 + 日銀総裁 + メガバンク3行頭取緊急会合
片山さつき金融相が、日本銀行の植田和男総裁、そして 三菱UFJ・三井住友・みずほの3メガバンク頭取 を金融庁に集めた。
この会合で 官民タスクフォース が正式に発足。後の調査で、このタスクフォースには次の組織が入っていることが分かっている。
- 日本銀行
- 東京証券取引所
- 三菱UFJ銀行、三井住友銀行、みずほ銀行
- 楽天銀行
- Anthropic 日本法人
- その他、計 36機関
主な取り組み:
- AI の安全な活用に向けたガイドライン策定
- G7 財務相・中央銀行総裁会議での国際的対策枠組みづくり
- 多要素認証の展開や脆弱性管理の迅速化
5 月 12 日:高市首相がサイバー対策指示
高市早苗首相が閣僚懇談会で、松本尚サイバー安全保障担当相に対し Mythos を念頭に置いたサイバー攻撃対策の検討を指示。同時に、政府は重要インフラ事業者に対する Mythos 対策を 15 分野 に拡大すると発表。
5 月 13 日:日経新聞「メガバンク3行、2 週間で取得見通し」
日経が報道、スコット・ベッセント米財務長官が「2 週間以内に政府と金融機関にアクセス権を付与」と日本側に示唆していたことが明らかに。
5 月 19 日:日立 × Anthropic 戦略提携
日立製作所が Anthropic と戦略パートナーシップを締結。
- グループ29万人にClaude導入
- 10万人をAI専門人材として育成
- Cyber CoE と Anthropic が共同でサイバー防御強化
- 「Frontier AI Deployment Center」共同設立(100名 → 300名スケール)
日立は自社を「Customer Zero(最初のお客)」と位置付ける戦略。
6 月 4 日:日立、Anthropic と Mythos アクセス契約締結
戦略提携の延長で、日立は 6 月 4 日に Anthropic と Mythos アクセスに関する正式契約を締結。
6 月 5 日:日立、Mythos アクセス権を公式発表(国内製造業初)
日立製作所が 6 月 5 日、Anthropic の Claude Mythos Preview の アクセス権取得を公式発表。国内製造業として初 の Mythos アクセス権公表となった。
主なポイント:
- 日立エナジーなど関連会社含めて 短期間のみアクセス権付与
- 社会インフラ向けソフトウェア(エネルギー、送配電など)の脆弱性検証に利用
- 検出した脆弱性は Anthropic にフィードバック → 責任ある開示プロセスへ
- 日立は Project Glasswing の枠組みで参加していると見られる
同日、トレンドマイクロ も Mythos アクセス権取得を発表。日本のセキュリティベンダーとしての参画も確定した。
5 月 22 日:片山金融相「日本政府が Mythos 取得」と表明
片山さつき金融相が公式に「日本政府は Anthropic の Claude Mythos へのアクセス権を取得する」と表明。同時にメガバンク3行のアクセス権取得も再確認。
5 月 27 日:富士通 × Anthropic 戦略提携
富士通が Anthropic と戦略的提携を発表。発表文には 「Anthropic の最新AIモデルに早期にアクセスし、それを活用したソリューションの開発・提供を進める」 と明記。
「最新AIモデル」が Mythos クラスを含むかどうか、富士通も Anthropic も明言を避けているが、民間企業として、現時点でメガバンク以外で Mythos に最も近い位置にいる日本企業 が富士通。
6 月 3 日:日本政府、ついに Mythos アクセス権取得
松本デジタル大臣が臨時閣議後記者会見で「日本政府は Claude Mythos Preview のアクセス権を取得した」と発表。同時に、政府主導のサイバー防衛パッケージ「Project YATA-Shield」も発表。
これにより、日本は 「非EU・非米政府として初めて Anthropic と正式な bilateral safety commitment を締結した国」 になった。Anthropic の Head of Global Affairs Michael Sellitto が自民党と直接協定を結んだ形。
日本側で名前が出ている組織まとめ
ここまでの動きで、日本で Mythos に何らかの形で関与する組織を整理する。
アクセス権取得が公式確定(7 組織)
- 日本政府(デジタル庁・サイバー防衛、6/3 取得)
- 三菱UFJ銀行(5 月中)
- 三井住友銀行(5 月中)
- みずほ銀行(5 月中)
- 富士通(5/27 戦略提携、「最新AIモデル早期アクセス」明言)
- 日立製作所(6/5 公式発表、国内製造業初、社会インフラ向けソフトウェア脆弱性検証)
- トレンドマイクロ(6/5 公式発表、セキュリティベンダー)
強い疑いがあるが公式未確定
- NEC(4/24 協業、Claude Code 3 万人展開、Mythos 利用は「回答差し控える」とコメント)
- NTTセキュリティ・ジャパン(Mythos 解説を公式発信)
Mythos 対策の防衛強化対象(利用側ではない)
- 経産省指導の重要インフラ 15 分野(電力・ガス・水道・医療・通信・交通 等)
- 経産省が大手電力会社に IT 基盤・資産報告要請(4 月)
Anthropic は各国の具体組織リストを非公開にしているけど、公式情報で見える範囲だと 日本は 7 組織 + 政府 が中心。日経 xTECH によると「日立・トレンドマイクロ以外の企業は明言を避けている」状態で、まだ追加発表が出てくる可能性がある。
メガバンクが Mythos を手に入れた本当の意味
ここからは @zephel01 さんの分析が深く、エンジニア視点でも重要なので引用しておく。
メガバンクが Mythos を取得したのは、攻撃用の武器を持つためじゃない。 自分の隠れた脆弱性を映す鏡を持つため だ、という指摘。
メガバンクの基幹システムには 30 年以上前の COBOL コードや仕様書が失われたモジュール が大量に残っている。Mythos が回せば、知らなかった脆弱性が大量に発見される。それは「すごい」と同時に「自社のレガシー負債が可視化される」ということでもある。
つまり、ここからメガバンク3行は アーキテクチャ全体の刷新の必要に迫られる 可能性がある。これは数百億規模の投資イシュー。
地方銀行への構造的脅威:
- 金融庁調査で 7 割超 の地方銀行がセキュリティ人材の深刻な不足を認識
- 委託・再委託・三次委託の連鎖でサプライチェーン攻撃の懸念
- 共同センター依存 = 単一障害点。2025 年 4 月、共同インフラ障害で 9 行が同時機能停止した事例あり
メガバンクが Mythos で防御を底上げする一方で、地方銀行は人材も予算もない。攻撃者は強い壁を避けて弱い壁を狙うので、今後のサイバー攻撃は地方銀行に集中する 構造になる。
Opus 4.8 リリース(2026/5/28)— Mythos 前夜の市販トップ
Mythos が一般公開されない一方で、市販モデルは Opus 4.8 が 5 月 28 日にリリースされた。Opus 4.7 から わずか 41 日 のリリーススパン。
主要メトリクスとブレークスルー:
- コード品質改善: 自己コード欠陥率が Opus 4.7 の 4 分の 1
- Sierra Legal Agent Benchmark: 全パス標準で初の 10% 超え
- Hebbia Super-Agent: 全ケース完走(コスト指標で GPT-5.5 と同等)
- GDPval-AA: 1890(GPT-5.5 比 +121 Elo)
- Online-Mind2Web: 84%(Opus 4.7 と GPT-5.5 を有意に上回る)
- Dynamic Workflow ツール: 新規追加
- 価格は据え置き($5 / $25 per MTok)、Fast モードはさらに高速・安価に
Opus 4.8 の段階で、コーディング × 法務エージェント × 大規模文書解析 × ブラウザ操作のすべてで現行ベスト級。そして Mythos はこの上の階層にいる。
グローバル企業導入トレンド
Anthropic の企業向け事業の数字をまとめる(2026 年 5-6 月時点)。
- 企業 AI 採用率:Anthropic 34.4% / OpenAI 32.3%(5 月、初めて Anthropic が逆転)
- Fortune 10 のうち 8 社が Claude 顧客
- 年間 100 万ドル以上 Claude に支払う顧客が 500 社超え(2 年前は 12 社)
- Deloitte が 47 万人に Claude 導入(過去最大のエンタープライズデプロイ)
- Claude Code 単体ランレート売上 25 億ドル(2026 年初から 2 倍超)
- Anthropic の評価額:3,800 億ドル → 9,650 億ドル(Series G、2026 年 5 月発表)
ここ半年で「OpenAI の対抗馬」から「企業 AI の本命」に立ち位置が変わっているのが見える。Claude Code の伸びが特に強く、CLI / コーディング領域での競合優位が決定的になりつつある。
公開タイムライン — 「Coming Weeks」の射程
2026 年 5 月 29 日の Fortune 取材で Anthropic 経営陣は 「Mythos クラスのモデルをすべての顧客向けに数週間以内に提供する」 と発言。
現実的な公開ウィンドウは 6 月後半 〜 7 月末。これが実現すると以下が起きる:
- Pro / Max / Team / Enterprise 契約者が、Opus 4.8 の上の階層を直接利用可能に
- Claude Code 経由で Mythos クラス相当の推論能力が CLI に降りてくる
- 企業の AI 化検討プロジェクトで「Mythos が来てから決める」というウェイト待ちが解消
- OSS / セキュリティリサーチャーの脆弱性発見ワークフローが地殻変動を起こす
ただし、ホワイトハウスとの綱引きが残るため、 米国内では制限付き、日本含む同盟国では正式運用、というねじれ展開 になる可能性もある。Anthropic が日米両政府との bilateral commitment を将来どう交通整理するかが、世界の AI ガバナンス枠組みの試金石になる。
エンジニアにとっての示唆
Mythos の登場が示唆するのは、シンプルに 「コーディングタスクの自動化可能ラインがもう一段押し下がる」 ということ。Opus 4.7 → 4.8 → Mythos の 3 段で、以下が現実視野に入る。
- 大規模リファクタの全工程自動化(複数モジュール横断、テストまで)
- 未知のコードベースに対する深い静的解析(27 年もののバグを掘り出すレベル)
- 長期エージェントによる自律研究(数学・物理・セキュリティ)
- CI / CD 全体の自律設計と改善ループ
フリーランスエンジニアとしては、以下の判断を半年スパンで考え直すタイミングかもしれない。
- 小規模な実装請負を主軸にする戦略の見直し(コモディティ化が一段進む)
- AI を前提とした設計レビュー / アーキテクチャ提案 にポジションを寄せる
- AI 運用の安全策(プロンプト管理 / 権限境界 / Hooks / Skills) に強い人材が一段足りなくなる
- 金融機関のレガシーシステム監査・刷新案件 が向こう 1-2 年で大量に出てくる(メガバンクの「鏡を持った副作用」起点)
「AI 時代の AI を使えるエンジニア」が次の希少リソースになる、というのは Anthropic の数字を見ているとかなり現実的な未来予測になる。
FAQ
Mythos は一般公開されないと言われたが、どこで触れる? 2026 年 6 月時点では Project Glasswing 経由(約 150 組織)のみ。Anthropic は「数週間以内」での一般公開を 5 月 29 日に表明しているため、6 月後半 〜 7 月末で Pro / Max / Team / Enterprise 契約者向けに開放される可能性が高い。
Claude Code から Mythos を呼べる?
2026 年 6 月時点では Claude Code から Mythos は呼べない。Opus 4.8 が現行の最上位モデル。一般公開後は --model mythos 系のフラグまたはモデル選択 UI からアクセス可能になると見られる。
Project Glasswing の組織になるには? Anthropic 主導の招待制プログラム。重要インフラ運営者 / セキュリティリサーチ組織 / OSS ファウンデーションが対象。一般企業から申請するパスは公開されていない。
Opus 4.8 と Mythos のコストパフォーマンスの差は? Opus 4.8 が入力 $5 / 出力 $25、Mythos Preview が入力 $25 / 出力 $125。Mythos は 5 倍高い が、SWE-bench Verified で +5.3 ポイント、USAMO 97.6% など、コーディングと推論で目に見える差がある。タスクによっては Mythos の方が結果あたりのコスト効率が良くなるシナリオは十分ある。
日本政府が Mythos を取得したというのは本当か? 2026 年 6 月 3 日、松本デジタル大臣が臨時閣議後記者会見で正式発表した事実。「Project YATA-Shield」と呼ばれる政府主導のサイバー防衛パッケージに統合される。Anthropic にとっても「非EU・非米政府への初の正式 bilateral safety commitment」という重大な意味を持つ合意。
日立は Mythos を使える? 日立 × Anthropic は 5 月 19 日に戦略パートナーシップを締結したが、Mythos 利用については公式アナウンスは出ていない。ただし提携の柱に「Cyber CoE と Anthropic 共同でサイバー防御強化」が含まれることから、Project Glasswing の枠組みで関与している可能性は高い。
Mythos の脆弱性発見能力は具体的にどう運用されている? Project Glasswing 参加 12 社が自社製品 / 自社運用システムに対して Mythos を回し、検出された脆弱性を責任ある開示プロセスに乗せる。Anthropic 公式によると 2 ヶ月で 10,000 件超の発見、うち 27 年もの OpenBSD バグや CVE-2026-4747(FreeBSD NFS RCE)など長期未解決バグが含まれる。
Mythos の名称の由来は? Anthropic 公式は明示していないが、Mythos = 神話 / 伝説。Anthropic は内部コードネーム的なネーミングを継続的に使っており(Opus / Sonnet / Haiku も詩形式)、Mythos も同じ系統と見られる。
まとめ
- Claude Mythos Preview は Opus 4.7 の上、capability tier が一段上のフロンティアモデル(2026/4/7 発表)
- 一般公開を見送り、Project Glasswing 経由で世界の重要インフラ運営者約 150 組織にのみ提供(2026/6/2 拡張時点)
- 2 ヶ月で 10,000 件超の脆弱性自律発見、27 年もの OpenBSD バグや CVE-2026-4747 など含む
- 2026 年 6 月 3 日、日本政府が Mythos アクセス権を正式取得。「Project YATA-Shield」サイバー防衛パッケージに統合
- 三菱UFJ・三井住友・みずほの 3 メガバンクは 5 月中に利用開始、富士通も 5/27 戦略提携で早期アクセス
- 日立は 5/19 Anthropic と戦略提携、グループ 29 万人に Claude 導入+10 万人 AI 人材育成
- Deloitte 47 万人、Fortune 10 の 8 社が Claude 顧客、企業 AI 採用率で OpenAI を逆転
- Trump 政権ホワイトハウスは Mythos 拡大に反対表明、Anthropic と冷戦継続
- Opus 4.8 が 5/28 リリース(市販現行ベスト)、Mythos クラスの一般公開は 6 月後半〜 7 月末予定
「で、結局これって何のドラマだったの?」を一般読者向けに解きほぐした note 版もある。日米攻防の時系列ドラマを丁寧に追っているので、技術詳細でこの記事を読んだあとの「全体像確認」にちょうどいい。
エンジニアのゆとです。引き続き Claude Code 周りのファクト系記事を書いていきます。