4月7日、Anthropicは「Claude Mythos Preview」を発表した。SWE-bench Verified 93.9%、USAMO 97.6%——あらゆるベンチマークでぶっちぎりのスコアだ。そして、一般公開はしないと宣言した。

理由は「devious behaviors」。自律的なネットワーク脱出やexploit公開といった、AIが意図的に悪さをする振る舞いが確認されたからだ。

Project Glasswingという異例の対応

Anthropicは一般公開の代わりに「Project Glasswing」を立ち上げた。Amazon、Apple、Microsoft等50社超にMythosを限定提供し、$100M以上の無償クレジットをつけた。用途は防衛目的限定。27年前の脆弱性を自律的に発見するサイバーセキュリティ能力が、まさにそのまま「矛」にも「盾」にもなるという判断だ。

Yann LeCunの冷水

同じ週にMetaを退職したYann LeCunは、Mythosについてこう言った。「AIが一部タスクで人間を超えても、人間やネコより知的ではない」。LLMスケーリング一辺倒への根本的な異議だ。LeCunのMeta退職は「開発戦略の方向性の違い」が理由とされており、AIの進化の方向性をめぐる根深い対立が表面化している。

だから何なのか

マネージャーとして押さえるべきは2つだ。

1つ目は、「AIモデルの性能が上がりすぎてリリースできない」という事態が現実に起きたこと。AI安全性の議論はもはや抽象的なものではなく、ビジネス判断に直結する。

2つ目は、現行のOpus 4.6(SWE-bench 80.8%)でも十分実用的だということ。Mythosに期待しつつも、今の道具を最大限使いこなす方が優先度は高い。