GadgetDrop
AI注目

Anthropicが「公開リスクが高すぎる」AIハッキングツールClaude Mythos 5を限定公開——一般向けはFable 5として提供

GadgetDrop 編集部6
Anthropicが「公開リスクが高すぎる」AIハッキングツールClaude Mythos 5を限定公開——一般向けはFable 5として提供

Anthropicが、これまでで最も高性能とされるClaudeの新モデルを「Fable 5」と「Mythos 5」という2系統に分けて公開する方針を明らかにしました。公開リスクが高すぎるとして取り扱いが慎重に検討されてきたMythos 5は、信頼できるセキュリティコミュニティのメンバーに限って提供されると伝えられています。Android Authorityが2026年6月9日に報じています。

Fable 5とMythos 5——同じ基盤を「安全機構の有無」で分ける構図

Android Authorityによると、Fable 5はMythos 5の上に強固な安全機構(safeguards)を追加した一般公開向けモデルとして位置づけられています。つまり、より素のままに近い高性能モデルがMythos 5であり、その能力を保ったまま社会的に受け入れ可能な形に仕上げたのがFable 5、という関係です。

一方のMythos 5は、こうした追加の安全機構の多くを備えないモデルとされ、サイバーセキュリティコミュニティの中でも信頼できるメンバーに限って招待制で提供される可能性があると伝えられています。一般ユーザーが触れられるのはFable 5のみという整理です。

なぜ封印せず限定公開を選んだのか

公開を完全に見送るのではなく、「責任ある展開」を選んだ点が今回の発表のポイント。脆弱性は悪意ある側より先に発見・修正されることに意義があるため、信頼できるセキュリティ専門家にMythos 5を使ってもらう必要があるという判断が背景にあると報じられています。

ファジングなどの自動バグ探索ツールは以前から存在していましたが、AIによる脆弱性発見はそれよりはるかに強力な脅威になり得ると指摘されており、この種のモデルの公開には開発者側にも慎重さが求められてきました。Anthropicは技術を死蔵させるのではなく、対象を絞って運用する道を選んだ形です。

「分類器」によるリスク用途のブロック

Fable 5には、利用者が何をしようとしているかを認識する一連の「classifiers(分類器)」が組み込まれていると説明されています。これはハッキング目的の利用だけを止めるためのものではありません。

  • 危険な化学物質や生物学的化合物の合成方法の開発を防ぐ
  • 安全機構なしのFable 5を再現するのに十分な内部情報の抽出を防ぐ
  • ゼロデイ脆弱性の探索など、悪用につながる利用を抑止する

ただし、Fable 5の制約を解除しようとする試みは確実に発生するとみられており、分類器による防御がどこまで持ちこたえるかは公開後の運用で問われることになります。

So What?——ユーザー体験はどう変わるのか

一般ユーザーから見れば、Fable 5は「これまでのClaudeより一段強力な汎用モデル」として扱える一方、セキュリティ研究のような踏み込んだ用途では分類器がブレーキをかける設計です。普段の作業で能力向上を享受しつつ、特定領域では明確な利用境界がある——この体感の違いが、従来モデルとの最大の差分になります。

リーク情報ではなくAnthropic自身の公式アナウンスに沿った動きであり、いま注視すべきは「分割公開と分類器による制御という新しい運用モデルが、実環境でどこまで機能するか」。今後はAnthropic公式の続報、そして分類器の突破事例(jailbreak報告)が出てくるかどうかをチェックしておくとよいでしょう。

Fable 5の価格・ベンチマーク・提供チャネル

Fable 5のAPI価格は入力100万トークンあたり$10、出力$50に設定されています。Pro/Max/Team プランでは2026年6月22日まで追加費用なしで利用でき、その後は usage credits 方式へ移行すると案内されています。ベンチマーク面でも数値が公表されています。

指標Fable 5Opus 4.8GPT-5.5
SWE-Bench Pro80.3%69.2%58.6%
FrontierCode29.3%13.4%

FrontierCode では Opus 4.8 の 13.4% に対して 2 倍超のスコアを記録しており、コーディング系タスクでの伸びが顕著です。提供チャネルも広く、GitHub Copilot では2026年6月9日からFable 5が一般提供(GA)として選択可能になり、Databricks の Unity AI Gateway 経由でもガバナンス付きで利用できるようになっています。なお安全機構が作動した場合は応答を Claude Opus 4.8 が肩代わりする設計で、発動はセッション平均5%未満に収まっていると説明されています。

Mythos 5の限定提供を支える「Project Glasswing」

Mythos 5の限定提供は、Anthropic が立ち上げた「Project Glasswing」という枠組みを通じて行われています。

  • 初期は約50組織でスタートし、2026年6月までに15カ国以上・約150組織へ拡大
  • 参加企業には AWS、Apple、Cisco、Google、Microsoft といった大手が名を連ねる
  • Anthropic は Mythos Preview の利用クレジットとして最大$100M、オープンソースセキュリティ団体へ$4Mの直接寄付を拠出

参加組織はすでに自社コードベースに対するスキャンを通じて、高・重大度の脆弱性を合計1万件超発見したと報告されています。さらに外部公開に先立ち、Anthropic は米政府高官に対して Mythos Preview の攻撃・防御双方の能力についてブリーフィングを実施しており、政府機関との事前すり合わせを経たうえで段階的に対象を広げる構図となっています。限定公開は単なる「招待制テスト」ではなく、政府・大手プラットフォーマー・OSS コミュニティを巻き込んだ運用体制として構築されている点が特徴です。

Q&A

Q. 一般ユーザーがMythos 5を使う方法はありますか? 現時点ではありません。Mythos 5は信頼できるサイバーセキュリティコミュニティのメンバーに対し、招待制で提供される可能性があると伝えられています。一般ユーザーが利用できるのはFable 5のみです。

Q. 「分類器(classifiers)」はどのように動作するのですか? 利用者の意図を認識し、ハッキング目的の利用、危険物質の合成手順、安全機構を取り除いたモデルの再現に必要な内部情報抽出など、リスクの高い用途をブロックする仕組みだと説明されています。一方、解除を試みる動きが発生する可能性も指摘されているとの見方もあり、実環境での耐久性は今後の運用で問われる論点です。

出典

ポストLINEで送るはてブ
GD

GadgetDrop 編集部

スマホ・PC・AI・XRなど幅広いテクノロジーを、スペックの行間まで読む視点で解説します。速報から深掘り分析まで、テック選びと業界理解に役立つ情報をお届けしています。