「AIエージェントが仕事を変える」。そう聞いて久しいが、実際に本番環境で動いているエージェントはどれだけあるのか。

RAND調査(2025年)の数字は冷酷だ。AIエージェントプロジェクトの80-90%が本番環境で失敗している。3月14日のHacker Newsでは「AI agents: Less capability, more reliability, please」というスレッドに253コメントが集まり、「少数タスクの例外的高品質 > 広い能力」が繰り返し支持された。フライト予約のデモはもはやジョークと化しているという指摘すらある。

「セクシーではないが確実に価値を出す」領域

Reddit/HNの議論を横断すると、成功事例には共通パターンがある。コードレビュー、データ入力、レポート生成。いわゆる「セクシーではないが実際に価値を提供する」狭い領域だ。逆に言えば、「何でもできるエージェント」を目指すプロジェクトほど失敗しやすい。

HNの別スレッド「AI agents are starting to eat SaaS」(386コメント)でCTOが証言した内容が象徴的だ。「コーディングは最も簡単な部分。真の価値はまだ発見されていないニーズの理解だ」。SaaSのmoatはドメイン知識と顧客フィードバックループにあり、それはAIでは再現できない。

成功事例は「1人チーム」に集中

一方で、成功事例も確実にある。@Shimayusが紹介したAnthropicのマーケチーム事例は示唆に富む。たった1人で運用し、広告作成を2時間から15分に短縮、出力量を10倍にした。「少人数で特定業務にAIを深く組み込む」パターンが勝ちパターンなのだ。

コンピュート供給の制約も中長期的に重要だ。@dwarkesh_spと@dylan522pの分析によれば、2030年のコンピュート生産上限は200GW/年で、EUVツール生産が律速になる。フロンティアモデルほど高マージンになる「勝者総取り」経済が予想される。

明日からどうするか

「AIエージェント」という言葉に惑わされず、まず1つの業務プロセスに絞ること。「この業務のこの工程をAIに任せたら、どれだけ楽になるか」。その問いに具体的に答えられるスコープから始めるのが、80-90%の失敗を回避する最も確実な方法だ。