106件の研究が突きつける不都合な真実

「AIを導入すれば生産性が上がる」――多くのマネージャーが暗黙に前提としているこの信念に、冷水を浴びせるデータが出た。博報堂DYが106件の研究をメタ分析した結果、「人間とAIの組み合わせは、平均でパフォーマンスが低下する」ことが明らかになったのだ。

これは衝撃的な結論だが、最も重要なのは「平均で」という修飾語だ。タスクに習熟した人間がいるチームでは、AI活用によってパフォーマンスが向上している。つまり問題は「AIの性能」ではなく「運用体制の設計」にある。

1.7倍成長 vs 投資収益ゼロの二極化

JBpress が「AIのお試し期間は2025年で終了」と題した記事で指摘した通り、企業は明確に二極化している。AI活用に成功した企業は1.7倍の成長を遂げている一方で、MIT の2025年調査では企業AI投資($300〜400億)の95%が「投資収益ゼロ」と報告された。

McKinsey のデータも興味深い。AIエージェントへの関心は62%の企業が示しているが、全社展開にまで至ったのはわずか23%。約40ポイントの「関心と実行のギャップ」が存在する。このギャップの正体こそが、運用体制の設計力の差だと私は考えている。

「正直しんどい」というエンジニアの声

Zennで公開された「AIエージェント時代、正直しんどい話」(@ryo369)は、技術コミュニティで広く共感を呼んだ。複数のAIエージェントとの対話が一人の開発者に集中する認知負荷問題、AIの「完璧です」という回答への信頼欠如、大量のコード出力のレビュー負荷、セッション外で成果が揮発する「記憶に残らない問題」。

この記事が重要なのは、AI導入のコストが「ライセンス料」だけではないことを可視化しているからだ。人間の認知資源というコストが見落とされがちで、それが「平均でパフォーマンス低下」の一因になっている可能性がある。

2026年は「評価される年」

HN(Hacker News)の議論でも、懐疑派の中身が変化している。前回(3/14)は「AIエージェントの80-90%が本番で失敗する」という技術的失敗論が中心だったが、今回は「コード品質」「実装の一貫性」「認知負荷」といった実装品質の問題に焦点が移った。これは逆説的に、AIが現場に浸透したからこそ出てくる現実的な課題だ。

Time誌も「今こそAIバブルへの準備が必要」(3/26)と警鐘を鳴らしている。ただし WEF は「AIは既に $4.5T 分のタスクを実行できる。バブル論は過大」と反論しており、評価は割れている。

マネージャーの処方箋

3つのアクションを提案したい。

第一に、AI活用タスクには必ず「そのタスクの判断力を持つ人間」の最終確認ステップを設計すること。博報堂DYの知見はここに集約される。

第二に、2025年のAI投資のROIを今期中に測定すること。「お試し期間」は終わった。数字で語れなければ、下半期の投資判断ができない。

第三に、認知負荷の問題を組織として認識すること。エンジニア一人にエージェント対話が集中する構造を見直し、レビュー体制とタスク分散を設計する必要がある。AIの導入は「ツールの追加」ではなく「組織の再設計」だということを、このデータは教えている。