Anthropic神話級モデルClaude Mythosは一般公開されません

Anthropicは本日、ある計画を発表した:Project Glasswing(グラスウィング計画)。この計画を打ち出した理由は、Anthropicが新たな超高性能モデルClaude Mythos Previewの学習を完了したためであり、これは実は、つい先日ccのコードが漏えいした際に言及されていたモデルそのものだ。

プロジェクトの参加主体には、AmazonのAWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks、そしてAnthropic自身の合計12機関が含まれており、共同で立ち上げている。

要するに、このモデルがあまりにも強力すぎるため、安全テストのモードを採用し、認められた機関の内部でのみ使用し、外部には公開しないということだ。どれほど強いかというと、皆さんはデータ、コード、推論能力を見れば一目瞭然で、opus 4.6をそのまま叩きのめしている:

コード:

推論:

検索とコンピュータ利用

opusの字面の意味は「傑作」で、Mythosの字面の意味は「神話」。AnthropicのCEOおよび共同パートナーの錚々たる大物たちが、この計画の後ろ盾として次々に登場している。

Anthropicは、Claude Mythos Previewを一般公開するつもりはないと明確に表明している。ただし長期目標は、ユーザーが同等の能力レベルのモデルを安全に使えるようにすることだ。そのために、彼らはまず、近日リリース予定のClaude Opusモデル上で関連する安全防護メカニズムを開発・検証し、リスクがコントロールできる条件下で反復を完了させたうえで、段階的に推し進める計画であり、もしかするとすぐにopusの新バージョンを出し、相応の能力を提供する可能性もある。

では、Project Glasswingがいったい何なのかを詳しく見てみよう


このモデルは何を見つけた?

過去数週間、AnthropicはClaude Mythos Previewで、世界の主流のオペレーティングシステム、ブラウザ、その他の重要ソフトウェアをスキャンした。

結果:これまで未発見だったゼロデイの脆弱性を数千件見つけ、そのうち大量が高危険度に分類された。

いくつかの具体例:

OpenBSDにある、存在してから27年の脆弱性。OpenBSDはセキュリティ性で知られ、ファイアウォールなどの重要インフラを稼働させるのに使われている。この脆弱性により、攻撃者はターゲットマシンに接続するだけで、リモートでクラッシュさせられる。

FFmpegにある、存在してから16年の脆弱性。FFmpegは無数のソフトウェアで動画のコーデックに使用されている。モデルが脆弱性のあるコード行を見つけたが、それ以前は自動化テストツールによって500万回スキャンされていたにもかかわらず、発見されることはなかった。

Linuxカーネルで、モデルが自律的に複数の脆弱性を連鎖させ、攻撃者が通常ユーザー権限から完全に1台まるごと制御できるようにした。

以上の脆弱性はいずれも、関連するソフトウェアの保守担当者に報告済みで、すべて修正が完了している。残りの脆弱性については、Anthropicが先行して暗号化ハッシュ値を公開しており、修復が完了した後に具体的な詳細を公開する予定だ。


なぜこのことをやるの?

Anthropicの判断はこうだ:AIモデルがソフトウェアの脆弱性を発見し、悪用する能力は、少数の最上位の人間専門家を除くすべての人をすでに上回っている。

この能力の拡散は、発生するかどうかという問題ではなく、時間の問題だ。

世界のサイバー犯罪による経済的損失は、毎年およそ5000億ドルと推定されている。医療システム、エネルギー基盤、政府機関への攻撃はすでに実害をもたらしており、また民間および軍事の基盤に対する継続的な脅威にもなっている。

AIによって、こうした攻撃を仕掛けるために必要なコスト、ハードル、専門性が大幅に下がる。

Anthropicのロジックはこうだ:他人が先にこの能力を攻撃に使うのを待つより、自ら進んでそれを防御に使ったほうがいい。


計画は具体的にどう進める?

Project Glasswingには、現時点で2つのレイヤーが含まれている。

第1のレイヤーは、12の創設パートナーで、彼らはClaude Mythos Previewへのアクセス権を得て、自身の中核システムにおける脆弱性のスキャンと修復を行う。重点分野には、ローカル脆弱性検出、バイナリのブラックボックステスト、エンドポイントセキュリティ、ペネトレーションテストなどが含まれる。

第2のレイヤーは、さらに40余りの、重要なソフトウェアの基盤インフラを構築または維持する組織で、彼らも同様にモデルへのアクセス権を得て、自社およびオープンソースのシステムをスキャンする。

Anthropicはこれに対して、モデル利用の上限として最大1億ドルの利用枠を提供することを約束している。研究プレビュー期間の終了後、Claude Mythos Previewは参加者に対して商用アクセスを提供し、価格は1百万入出力tokenあたり25/125ドルで、Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry経由での接続に対応する。

さらにAnthropicは、Linux Foundationを通じてAlpha-OmegaおよびOpenSSFにそれぞれ250万ドルを寄付し、Apacheソフトウェア財団には150万ドルを寄付する。合計400万ドルの寄付で、オープンソースソフトウェアの保守担当がこの新たな情勢に対応できるよう支援することが目的だ。オープンソースソフトウェアの保守担当は、Claude for Open Sourceプロジェクトを通じてアクセス権を申請できる。

今後の計画

情報共有の面では、パートナーは可能な限り情報とベストプラクティスを相互に共有する。Anthropicは90日以内に研究進捗レポートを公開すると約束しており、その内容には、発見した脆弱性の件数、修正済みの問題、そして開示可能な改善成果が含まれる。

政策提言の面では、Anthropicは主要なセキュリティ機関と協力して、以下の方向性に関する実践的な提言を形成する:脆弱性開示プロセス、ソフトウェア更新プロセス、オープンソースおよびサプライチェーンのセキュリティ、安全なソフトウェア開発ライフサイクル、規制対象分野の標準、脆弱性分類の大規模化と自動化、パッチ自動化。

完全な情報は公式原文で確認:https://www.anthropic.com/glasswing

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン