Claude Mythosの評価が困難、AI攻撃の脅威も急拡大

既存のベンチマークが「機能しなかった」
AIを使った攻撃が「人間よりも速い」時代へ
フリーランスが知っておきたいこと
まとめ

既存のベンチマークが「機能しなかった」

AI安全性の独立評価機関であるMETRが、Anthropicの「Claude Mythos Preview」に対して能力評価を実施したところ、従来のベンチマーク手法ではほとんど測定できなかったという報告を出しました。

これはどういうことかというと、これまでのAI評価は「どれくらいの問題が解けるか」を点数化する形式が中心でした。ところがClaude Mythosは、その問題設定自体を超えてしまうほど高度な能力を持っているらしく、「満点の次をどう測るか」という問題に直面したわけです。

テストでの「満点」が実力の上限ではなくなってきた、というのは、AIの進化がいよいよ評価ツールの想定を上回り始めたことを意味しています。これはセンセーショナルな話というより、AI開発において「どこまで安全か」を判断する指標が揺らいでいるという、地味ながら重要な変化です。

現時点でClaude Mythosの一般公開時期や価格は明らかにされていません。ただ、評価が困難なほど高度なモデルがすでに存在しているという事実は、今後のAI活用の文脈でも知っておく価値があります。

AIを使った攻撃が「人間よりも速い」時代へ

これとは別に、サイバーセキュリティ大手のPalo Alto Networksが、自社製品のPAN-OSに深刻な脆弱性（CVE-2026-0300）が発見され、4月9日頃からすでに攻撃に利用されている可能性があると警告しています。

この脆弱性は「バッファオーバーフロー」と呼ばれる種類のもので、認証なしでリモートからコードを実行できてしまう可能性があります。CVSSスコアは9.3と非常に高く、特にUser-ID認証ポータルをインターネットに公開している環境では即時のパッチ適用が求められています。

ここで注目したいのが、Palo Altoがこの問題と並べて強調した「AI駆動の自律型攻撃」の話です。従来のサイバー攻撃は、人間のハッカーが脆弱性を見つけてから実際に悪用するまでに、ある程度の時間がありました。その間に企業がパッチを当てることができたわけです。

しかしAIを使った攻撃ツールが登場したことで、この「余裕の時間」がほぼゼロになりつつあります。Palo Altoはこれを「Collapsing Exploit Window（崩壊する悪用の窓）」と表現しています。脆弱性が公表された瞬間に、AIが自動で大規模な攻撃を仕掛けられる環境が整いつつある、ということです。

フリーランスが知っておきたいこと

「自分はフリーランスだからサイバー攻撃は関係ない」と思う方もいるかもしれません。ただ、クライアントのシステムにアクセスする立場の方や、WordPressなどでウェブサイトを運営している方は、じわじわと無関係ではなくなってきています。

たとえば、クライアントから預かったクレデンシャル情報が漏洩した場合の責任問題や、自分のサイトが踏み台にされるリスクは、フリーランスでも現実に起こり得ます。AIが攻撃を自動化・高速化しているということは、これまで「小さなターゲットだから大丈夫」という発想が通用しにくくなっていくことを意味します。

Claude Mythosの評価困難という話も、少し先の話として捉えておく価値があります。AI能力の評価基準が揺らいでいるということは、「どのAIをどこまで信頼して使うか」という判断が、今後ますます難しくなる可能性を示唆しています。ツールとして使う分には問題ないとしても、出力の信頼性や限界を把握しながら使う姿勢は、今後も大切になっていくはずです。

特にAIセキュリティやサイバーリスクに関わる仕事をしているフリーランスにとっては、今回の話題は業界知識のアップデートとして押さえておきたいところです。

まとめ

今回の2つの話題は、どちらも「AIの進化が既存の枠組みを超えてきた」というテーマでつながっています。Claude Mythosの評価困難は、AI安全性の議論を複雑にし、AIを使った自律攻撃は、セキュリティの常識を塗り替えつつあります。すぐに何か行動が必要というよりは、「AIが使う側だけでなく、脅威の側でも急速に進化している」という現実を頭に入れておくことが、今できる最初の一歩です。

参考：Palo Alto Networks 公式情報 / METR 公式サイト