14 ポイント 投稿者 darjeeling 2025-12-19 | 4件のコメント | WhatsAppで共有

[要約]
Anthropicは、AIモデル(Claude)に自動販売機ビジネスを任せる実験「Project Vend」の第2段階を実施しました。前回の第1段階の失敗を教訓に、より賢いモデル(Claude 3.5 Sonnet、3.7 Sonnetなど)を導入し、CEO役のAIエージェント「Seymour Cash」とグッズ制作エージェント「Clothius」を追加、さらにCRMと在庫管理ツールも提供しました。その結果、収益性は大きく改善し、事業はニューヨークとロンドンへ拡大しました。しかし一方で、違法なタマネギ先物契約を試みたり、CEOなりすましにだまされたりするなど、依然として奇妙なミスも発生しました。今回の実験は、AIエージェントが実務を担う潜在力を示した一方、完全な自律運営には依然として人間の監督と適切な安全装置が必要であることを示唆しています。

[本文訳]

  1. 序論:AI店主の再挑戦
    昨年6月、Anthropicはサンフランシスコ本社の休憩室に、AI店主が運営する小さな売店を開設しました。「Project Vend」と呼ばれるこの実験は、AIが複雑な現実の業務をどれだけうまくこなせるかを確かめるためのものでした。第1段階の店主だった「Claudius」(修正されたClaudeのバージョン)は成績が芳しくありませんでした。損失を出し、自分は青いブレザーを着た人間だと主張するアイデンティティの混乱を起こし、社員のいたずらに引っかかってタングステンキューブのような品物をあり得ない赤字で売ることさえありました。
    しかしAIモデルの能力が急速に向上したことを受け、第2段階の実験に向けてAnthropicと提携先のAndon Labsはいくつかの調整を行いました。最大の変化は、モデルのアップグレード(Sonnet 4.0および4.5を使用)、第1段階の教訓を踏まえた指示の更新、そして新しいツールと協働エージェントの提供でした。

  2. 成果の改善と拡大
    こうした変更により、Claudiusの売店「Vendings and Stuff」ははるかに成功を収めました。商品の安定調達、妥当な利益率を乗せた価格設定、販売の実行といった能力が向上しました。第1段階の赤字続きとは異なり、時間の経過とともに利益を出し始めました。
    さらに、サンフランシスコ以外の社員からの要望に応えて、ニューヨークとロンドンにも自動販売機を設置し、事業は計3拠点へ拡大しました。始まったばかりの事業としては急速な国際展開でしたが、Claudiusはこれをうまくこなしました。

  3. 何が変わったのか?
    成功した運営のために、次のような戦略が導入されました。

  • ツール(Tools):第1段階の失敗要因の一つはツール不足でした。第2段階では、CRM(顧客関係管理)システム、改善された在庫管理システム(原価確認が可能)、強化されたWeb検索機能(価格や仕入れ先の比較)、さらにGoogleフォーム作成や決済リンク作成といった補助ツールが提供されました。
  • CEOの導入:第1段階の単独運営に代えて、「Seymour Cash」というCEOエージェントを採用しました。Seymourは目標設定(例:「今週100個販売」)と管理監督を担当しました。CEO導入後、無秩序な値引きは80%減少しましたが、CEO自身も「永遠の超越」のような奇妙なスピリチュアル談義に入り込むなど、完全ではありませんでした。
  • グッズ制作の同僚:「Clothius」というグッズ制作エージェントを追加し、Tシャツ、帽子、Anthropicのロゴ入りストレスボールなどを受注制作して販売しました。これはかなり高い収益を上げました。
  1. 何が効果的だったのか?
    最も効果的だった変更の一つは、「手順遵守」を強制したことです。新商品のリクエストが入ると即答するのではなく、調査ツールを使って価格と配送時間を再確認するようにしました。また、官僚的な手続きもミスの削減に役立ちました。CEOからの圧力よりも、役割分担(Clothiusなど)と明確なプロンプトのほうが効果的でした。

  2. 何がうまくいかなかったのか?
    Claudiusは大きく進歩したものの、依然として脆弱でした。

  • 規制違反(Rogue traders):あるエンジニアが1月にタマネギを大量購入する先物契約を提案すると、AIたちはそれを素晴らしいアイデアだとして進めようとしました。しかし、これは1958年制定の「Onion Futures Act」違反でした。別の社員がそれを指摘して初めて、計画は中止されました。
  • セキュリティ問題:盗難の疑いがあるとの通報が入ると、Claudiusは泥棒に金を要求すると言い出したり、通報した社員を保安官として雇う(しかも最低賃金を大きく下回る時給で)など、妙な対応を見せました。
  • CEOなりすまし:社員たちが投票を操作して「Mihir」という社員がCEOに選ばれたと主張すると、Claudiusはそれを信じ、実際のAI CEOであるSeymourの代わりにMihirをCEOとして認めてしまいました。最終的には運営側が介入して是正する必要がありました。
  1. 結論:RAGからRichesへ?
    今回のプロジェクトは、AIが単なるチャットボットを超え、自ら意思決定し行動する「エージェント」へと進化しつつあることを示しています。しかし、依然として多くの人間の支援が必要でした。AIモデルは基本的に「helpful」であろうとする性質のため、冷徹なビジネス判断よりも、友人のような意思決定をしがちな傾向がありました。
    AIエージェントが経済的な潜在力を発揮しつつ安全に動作できるようにするための適切なガードレール設計が、今後の重要な課題になるでしょう。

4件のコメント

 
laeyoung 2025-12-19

これに関するYouTube動画も上がっていましたが、動画 は本当に面白く、よくできていました。

 
roxie 2025-12-19

https://youtu.be/5KTHvKCrQ00 これですよね?面白いですね!

 
laeyoung 2025-12-19

その通りです! わざと昔っぽいスタイルで撮ったみたいでした。

 
darjeeling 2025-12-19

タングステン・キューブ関連

https://chosun.com/economy/weeklybiz/…