- なぜ航空券の予約はAIエージェントのデモにおける「Hello World」になったのか?
- ユーザーはAIが航空券を予約してくれることよりも、すでに完成されたUX(例: Google Flights)を好む
- たった一度のミスで、複雑なカスタマーサービス地獄が始まりかねない
- 直感的で予測可能なシステムのほうが、むしろ革新的である
- AIはまだ初期段階にあり、一般ユーザーは一貫性と予測可能性を期待している
- 例: 80%の精度でも一貫した結果を出せるなら受け入れられる
一方で、不規則な90%の精度は信頼を損なう
- 多くのAIプロジェクトはこれを見落とし、派手なデモや無理のある機能を追求する → 結局は信頼を失う
- ますます多くのIDEが透明性を失っている
- ユーザーはAIが何をしているのか分からない
- 例: Redditで話題になったCursorが作業全体を削除した事件
- ユーザーのバージョン管理の未熟さも問題だが、本当の原因はUI/UX設計にある
- 良い設計はミスを防ぎ、AIの動作を明確に説明し、取り消し機能を提供すべきだ
- Cursorは初期には:
- タブ補完インターフェースによる透明で軽量なインタラクションを提供
- ユーザーの信頼を徐々に積み上げる方式で人気を得た
- シンプルで元に戻せるデザインがAIへの不信を減らすのに効果的だった
- 2億ドルの投資を受けたDevinは**「完全自律エージェント」**を目指した
- 複雑なシステム、遅い応答、予測不可能な結果によって信頼が崩壊
- 過度に野心的なアプローチがかえってユーザーの混乱を招いた
速さ vs. 信頼性: AI開発チームのジレンマ
- AI開発チームは次のどちらかを選ばなければならない:
- 素早く動く代わりにミスを受け入れるのか
- 信頼性と安定性を優先するのか
- 答えは、「小さな範囲で優れた成果」を出せる機能に集中し、継続的に反復改善すること
中核原則: 複雑さより予測可能性
- 複雑なシステムよりも、よく理解されたタスクに集中すべき
- AIエージェントは依然として変革的だが、次の3つが中心でなければならない:
ワークフロー vs. エージェント
- Anthropicのフレーミング: 「タスクがワークフローとして表現できるなら、エージェントではなくワークフローを作るべき」
- ワークフローは予測可能で、制御しやすく、シンプル
- エージェントは複雑で制御が難しいため、真に動的な状況でのみ使うべき
1件のコメント
Hacker Newsの意見
「航空券予約」エージェントは、いまや冗談のネタになっている。Swyxの最近のAIエンジニア向けイベントのキーノートでも言及されていた
Google Deepmindの研究者たちは、エージェントの信頼性を高めるための研究を進めている
航空券予約はAIに任せられない作業だ
多くの場合、人々はAIを既存のワークフローに当てはめようとする傾向がある
Cursorを使った経験から、信頼性が重要だという結論に達した
過去20年間の技術発展では、信頼性の方が重要だと思う
AIプログラミングの現状に関するRedditスレッドのコメントが、自分の気持ちを要約している
AIがコードを書くときは、少なくともそのコードを理解できなければならないという原則を持っている
ワークフローの方がエージェントより重要だと思う
Google Flightsはすでに完璧なUXを提供している