Mythos神話の崩壊、オープンソースで同等のバグ発見

Anthropicが「危険すぎる」と公開を絞ったバグ発見AI「Mythos」と同等の能力が、組み合わせ次第でオープンソースモデルでも実現できる。OpenAI初のセキュリティ研究員が、シンガポールの基調講演で語った。

情報の灯台

2026年4月26日

Mythos神話の前提が崩れている

Anthropicが「Mythos」を世に出してから、セキュリティ業界の語り口がにわかに変わっている。Firefox 150では271件の脆弱性が一度に修正され、Mozilla CTOのBobby Holley氏がブログで「Defenders finally have a chance to win, decisively」（防御側がついに、決定的に勝つ機会を得た）と書いた。

1件でも2025年なら赤色警報級だった脆弱性が、これだけまとめて出てくると、追いつけるのかどうか、立ち止まって考えてしまう。

これはMozillaのCTO自身の述懐だ。あまりに発見数が多くて開発チームが「めまい」を覚えた、という告白までついている。

その熱が冷めないうちに、別の角度から冷や水が浴びせられた。シンガポールのBlack Hat Asia 2026で、AIネイティブなセキュリティスタートアップRunSybilのCEO、Ari Herbert-Voss氏が語った。要点は身も蓋もない。オープンソースで同等にできる、ということだ。

Herbert-Voss氏は2019年にOpenAIに入った 同社初のセキュリティ採用者 で、GPT-3とCodexのレッドチーム業務を率いた人物だ。Anthropicの内情を詳しく語れる立場ではないが、攻防両面のAI性能を最も近い距離で見てきた数少ない当事者でもある。その彼が「Mythosでなければならない」という前提に疑問を投げた意味は、軽くない。

超線形スケーリングという「燃料」

Herbert-Voss氏が講演で軸にしたのは、超線形スケーリング（supralinear scaling）という現象だ。データ量・計算量・学習時間を2倍にすると、モデルの能力は4倍になるという観察で、研究者たちが当初想定していた線形の伸びを上回る。要するに、ここ数か月のバグ発見能力の跳ね上がりは、特殊な秘伝のレシピではなく、業界全体を底上げする潮流の話だということだ。

Anthropicによれば、Mythos Previewはゼロデイを実際に見つけた。FreeBSDのNFS実装に17年間眠っていたリモートコード実行の欠陥（CVE-2026-4747）を、自律的に発見してエクスプロイトまで書いた、と説明している。インターネット越しの認証なしユーザーがroot権限を取れる、サーバーごと持っていかれる類の脆弱性だ。

この成果は事実として動かない。問題は、その能力が Mythos固有のものか どうかだ。Herbert-Voss氏の主張は、複数のオープンソースモデルを足場（scaffolding）で連携させ、互いの死角を埋め合わせる構成を組めば、商用クローズドモデルに匹敵するバグ発見器が成立する、というものだった。

異なるモデルが異なる種類の欠陥を見つける、という性質も追い風になる。1つのモデルでカバーしきれない盲点を、別のモデルが拾う。これは結果として、防御の多層化（defense in depth）にもつながる。

攻撃者と防御者の両方が、同じ性能を別の経路で手にする。これが超線形スケーリングのもう1つの帰結だ。

なぜ「Mythosでなければ」と思わされてきたのか

Anthropicは当初、Mythosを「Project Glasswing」という枠組みで、Microsoft、Apple、Google、JPMorgan Chaseなどの中核12社と、その他40以上の組織にのみ提供してきた。「危険すぎて広く公開できない」という説明とともに。米財務長官のスコット・ベッセント氏が大手銀行の幹部を集めてMythos利用を促す会合まで開いたと、Bloombergは伝えている。

しかしこの 囲い込み戦略 は、すでに二度ほど綻びている。FortuneとBloombergによれば、ある非公開Discordグループのメンバーが、サードパーティ業者経由でMythos Previewにアクセスし、現在も使い続けているという。Anthropicは「サードパーティベンダー環境への不正アクセスを調査中」と認めた。先月にはAIスタッフィング企業Mercorのデータ漏洩で、Anthropicの過去のモデル配置に関する情報も流出している。

数千人規模の社員を抱える組織群にアクセス権を配れば、漏れないほうが不思議だ、というContrast SecurityのCISO、David Lindner氏のコメントも筋が通っている。「危険だから秘密にする」 という前提自体が、現代のソフトウェア開発の現実と噛み合っていない。

加えて、The Registerの記事は、「Mythosが見つけたとAnthropicが主張する数千件の重大脆弱性」のうち、独立に追跡できる実数は 40件かそれ以下 という指摘もあると伝えている。研究者のDevansh氏はAisleの再現研究を引用し、軽量なオープンウェイトモデルでもMythosと似た分析が出せたと指摘した。Mythosが見つけた181件のFirefoxエクスプロイトは、ブラウザのサンドボックスを切った状態で動かしたものだったとも書かれている。

限定提供は、「能力は本物だが希少だ」という物語を演出するための仕掛けでもあった。その物語が、外側から先に綻びている。

つまり、特別説は技術面でも数値面でも揺らいでいる。

それでも欠かせない人間の手

オープンソースで同等の性能が出せるとして、それは誰にとっての朗報なのか。攻撃側にも、防御側にも、同じ手札が配られる、という話でもある。

Herbert-Voss氏は、人間の専門家が依然として必要だと釘を刺している。複数のオープンソースモデルをMythos級に束ねる足場の設計、そしてAIが吐き出すバグ報告の評価作業は、人間にしかできない。彼はファジング（fuzzing）を引き合いに出した。ランダムに近いデータを叩き込んで欠陥を炙り出す古典的な手法だが、誤検知の山を整理するのは結局人間の仕事だ。AIバグハンターも同じ問題を抱えている。

当面やることに事欠かない、というのがHerbert-Voss氏の結論だ。AIを使えという経済的な圧力、つまりGPUとデータセンターへの投資を回収する必要が、結果としてセキュリティチームのAI導入を加速させ、防御能力を底上げする方向に働くという見立てだ。

ただし、楽観だけではない。Mozillaの注釈にもあったように、AIで開発したコードの複雑さがAIのバグ発見能力を超えてしまったら、人間が理解できる範囲を超えたソフトウェアが世に増える、という懸念も同時に存在している。人間の理解可能性 が、これからのソフトウェア設計の生命線になる。

・・・

Mythosをめぐる一連の動きは、AIセキュリティの「神話化」がどれほど早く崩れるかを示している。秘密兵器は秘密のままではいられず、独占は技術的な必然ではない。一方で、攻撃する者がオープンソースで同じ武器を組めるなら、守る者だけが平和に過ごせる時代でもなくなる。Mythosという名に込めた神話の含意が、いま皮肉な響きを帯びている。

参照元

他参照