AIエージェント導入の最大のボトルネックは性能より信頼(feat. 時間)
(maily.so)AIエージェントは実際どれほど自律的に働いているのか
- Anthropicは数百万件のClaude Codeの相互作用を分析し、AIエージェントが実際にどれほどの仕事を任されているのかを測定しました。
- 研究の核心はモデル性能ではなく、人間がどれだけ自律性を委任したかでした。
- ほとんどの作業は短時間ですが、最も長い自律作業時間は3か月の間に25分→45分以上へと増加しました。
- 興味深い点は、この変化がモデルのアップグレードよりもユーザーの信頼の蓄積によって生じたことです。
- 経験豊富なユーザーは自動承認の比率を高めつつ、**必要なときに途中介入する「モニタリング方式」**へと監督戦略を変えていきます。
- またAI自身も、不確実なときには質問したり停止したりする自己統制メカニズムを示します。
- 現在、エージェント利用の半分はソフトウェア開発領域に集中しています。
- 結局、AIエージェントの自律性はモデル性能よりも信頼・組織文化・ツール構造によって決まります。
1件のコメント
ちょっと待って!<ctrl+ enter>