Amazon従業員、AI利用圧力の中で作業をでっち上げている
(fastcompany.com)- Amazonの従業員は業務にAIをもっと組み込むよう圧力を受けているが、適用箇所が不明確なため不要な作業が生まれている
- 一部の従業員は社内ツールMeshClawを、生産性向上よりもAI活動量を増やすためのエージェント生成に使っている
- 従業員は、AIトークン消費量の追跡が品質より使用量を優先する雰囲気を生んだと見ている
- Amazonは全社的なAI指標や社内リーダーボードは存在しないと述べたが、従業員は80%利用目標と追跡があると話している
- OpenClawとMeshClawはローカル実行により独立性が高いが、過剰なアクセス権を与えるとリスクが大きくなり得る
AI利用圧力とMeshClawの利用
- Amazonの従業員は業務フローにより多くのAIを含めるよう圧力を受けているが、どこに適用すべきかは明確でなく、AIリソースが不要な作業に使われる余地が大きくなっている
- _Financial Times_報道によれば、一部のAmazon従業員は社内AIツールMeshClawを、生産性向上よりもAI活動量を増やす不要なAIエージェントの生成に使っている
- ある従業員は「これらのツールを使えという圧力が強すぎる」と述べ、一部はトークン使用量を最大化するためにMeshClawを使っていると語った
利用指標をめぐる食い違い
- 従業員は、AmazonがAIトークン消費量を追跡することで、一部の同僚が技術利用の質より量を優先するようになったと見ている
- 匿名のAmazon従業員複数名は、AI利用への期待が高まるにつれて職場環境が悪化していると見ている
- AmazonはAI利用統計が人事評価には含まれないと従業員に伝えたとみられるが、すべての従業員がそれを信じているわけではない
- 別の従業員は、利用量の追跡がゆがんだインセンティブを生み、一部の従業員を非常に競争的にしていると見ている
- インタビューに応じた従業員たちは、会社が毎週開発者の80%がAIを利用することを目標にしており、従業員のトークン消費量が社内リーダーボードで追跡されていると話した
- Amazonの広報担当者は、AI利用に関する全社的な指標はなく、従業員同士を比較する社内リーダーボードも存在しないと述べた
- Amazonによれば、従業員は個人ダッシュボードで自分のAI利用量を確認できる
OpenClawとローカル実行のリスク
- 一部のAmazon従業員がAI利用量を水増しするのに使っているMeshClawは、別のAIツールであるOpenClawに着想を得たツールである
- OpenClawとMeshClawは他のAIモデルとは異なり、ユーザー自身のハードウェア上でローカル実行されるため、独立性が高い
- 今年初め、Meta Superintelligence Labsのアラインメント担当ディレクターがOpenClawによってメール受信箱全体を危うく削除しかけた出来事が話題となり、AIに過剰なアクセス権を与えたときに生じるリスクを示した
1件のコメント
Hacker Newsの意見
Amazonだけの話ではなく、大手テック企業全般と一部の小さな会社まで同時におかしくなっている感じがする
ある日CEOが「出張費の支出を奨励したいので、できるだけ多く出張を予約して金を最大限使え。サテライトオフィスに行くときはファーストクラスに乗り、Uberの代わりにリムジンを使い、高級レストランで食事しろ。十分に出張費を使わなければ人事評価で低い等級になる」と言うような状況に似ている
今は完全に異常な時代だ
Amazonの副社長なら買収提案も検討するだろうし、追加機能付きのエンタープライズ版も開発中だ
Show HN: https://news.ycombinator.com/item?id=48151287
叱られるかと思ったら、逆に表彰され、他の社員に成功のやり方を共有する短い発表まで頼まれた
今ではインフラ支出の20%がトークンで、開発者1人あたりの週次プルリクエスト数は4.2件から5.1件に増えた
そのかなりの部分はエージェントが設定ファイルを1〜2行変える程度なので、全部魔法的思考に見える
他の便ではファーストクラスのほうが安く取れたのに、会社の方針でファーストクラスには乗れなかった
私たちはいつだって異常な時代に生きてきた
それが起きないので、社員が魔法のようなAIを十分な頻度で使っていないせいだと仮定しているようだ
自社のAI製品を作っている会社は、社員にAIをできるだけ多く使わせ、最終的に社員の大半または全員を置き換えるための学習データを得たいのかもしれない
自分のAI代替物を訓練することを拒む社員を罰するのは、今はコストがかかっても将来の節約がはるかに大きいと見れば、彼らには筋が通るのだろう
6か月ほど前にAWSの社員から、私たちのユースケースに合った AIツール の発表を聞いた
発表の途中で突然、画面共有上で「今月自分がどれだけトークンを使ったか見てほしい。Opusをものすごく回している」と言い、その数字は侮辱的なほど大きかった
そのとき「妙な自慢だな。こんなに高価なのにたくさん使っているという事実自体が危険信号ではないのか」と思った
彼はAWSインフラを管理・調整するClaude Codeのユースケースをいくつも見せたが、インターネットより年上の古参システム管理者である私の目には「AIで単一コマンド1つで済むことをやった」ように見えた
だからこの話は筋が通る。6か月前から手当たり次第に使うよう奨励されていたわけだ
なのに
tabを押すと、その行がAIが編集した行として集計される残りのかなりの部分も、マルチカーソル、vim移動、マクロを学んでいれば、すでに同じような速度でできていたことだ
実際には、そうしたものを使わなくても画面にコードを出す速度がボトルネックになるほど遅かったことがなかったので、学ばなかっただけだ
おそらく二分法ではなく、さまざまな要因によって変わるのだろうが、あまりに異なる報告が同時に見えるのは妙だ
そう考えると、こうした指示がどこから来て、なぜ慎重でもバランス重視でもないのか、計算が合う
これはシステム開発の大きな弱点であり、敵対者にとっては巨大な 攻撃面 になりうる
AIの価値のかなりの部分はまさにそこにある
もうそのコマンドを知らなくても、機能的契約 だけ知っていれば必要な作業を実行できる
これはものすごい変化だ
「トークンを使わなければならないから無駄に燃やした」という話がたくさん上がってくるが、気候非常事態 の中では信じがたい行動だ
さらに押し進めれば、3度の温暖化すら達成できそうだ
誰も食べたがらない鯨肉の割当を満たすために、ソ連がクジラをほぼ絶滅させかけたという話を思い出す
実質的に中央計画が生まれ、その体制の病理もそのままあるが、ソ連と違うのは、偶然金持ちになったか適切な相手に賄賂を渡した数人が、私たちのGOSPLANを運営しているという点だけだ
「本物の」生産性向上でもなく、ただ トークンを使うため だなんて
トークンを燃やさなければ成果指標を達成できず、ラッダイトのレッテルを貼られて、AIに仕事を奪われる前に追い出されるかもしれない
こうした流れと、好戦的な人々が地球を壊していることに同意する
「誰も食べたがらなかった」という言い方も根拠が弱い
幸いアプリ管理側で働いていて、最後の利用日だけ見ればいいと分かっているので、1日にクエリを1本入れるだけで大丈夫だ
それでもこの AI過熱 には本当にうんざりしている
FAANGの1社で働いているがAmazonではなく、社内外でこういう話をたくさん聞いた
ただし重要人物、つまりリーダーシップが公式にそう言ったことは一度もなかった
いつも噂か、社内の誰かが作ったダッシュボードや指標から始まって拡大する
リーダーたちが「私たちが見ているのはそういうものではなく、高価なトークンを浪費してはいけない」と言うのも聞いた
もちろん過去にコード行数やコミット数のような愚かな指標を使いながらも、完全に認めたことはあったが、トークンが多いほど良い ほど単純だとは思わない
私たちが反論すると、リーダーシップもトークン支出が良い指標ではなく、人々が悪用する可能性が高いことを認めるが、すぐにまたチームのトークン支出を増やせと言う
リーダーシップが見ているトークン追跡ダッシュボードがあり、会議で直接見せてくるので知っている
まだ全員に順位表のように公開してはいないので、それだけは救いだ
トークン支出が人事評価に入るという噂が多く、リーダーシップは否定するが、その直後にトークン支出を増やすことがどれほど重要かという会議をさらに開き、ダッシュボードに見える不足を議論する
トークン使用の順位表を作ったり、AIツールの使用を拒むエンジニアを解雇できるとほのめかしたりする会社では、問題が爆発する
すると生き残るために、できるだけ多くのトークンを使う競争が始まる
特にソーシャルメディアを多く読む開発者の間でひどい
Twitter、Threads、Mastodon、LinkedInなどでは、AI-nativeになってAIを十分使わない人を解雇するというバイラルな話が繰り返し再利用され、不安な開発者たちは、避けられない整理対象から逃れるには同僚より速くトークンを燃やさねばならないと考える
その後、組織の個人貢献者たちは、あらゆる仕事にAIを使うよう言われ、そうしないとキャリア上の不利益がありうると言われた
日常業務でのAI利用を動機づけるとして、強制研修、ワークショップ、ハッカソンが続いている
シェルスクリプトで簡単にできることに対しても「これをどうやってエージェント化できるだろう」と聞くような調子だ
Copilotにかなり金を使ったので、人々が使っているのを見たいのだ
目標そのものが、人々に指標を ゲームさせること なのかもしれない
AIをもっと使えと押し進めれば、試し、実験し、時間を「無駄に」しながら学ぶ
それが最終目標だ
今は役に立たないことにトークンを使いながら、どこで役立つのかを探っていて、どこで役立たないのかもそうやって学ばなければならない
うちの会社も同じことをしている
無駄はあるかもしれないが、AIが実際にビジネスのどこで役立つのかを探る最速の方法だ
社員の80%がトークンを無駄にしても、残りの 20% はやり方を見つけている
金を燃やすほどあるなら、もっとひどい消費の仕方も思いつくが、真面目に見れば愚かなことだ
あるツールに企業が数百万ドルと人の時間を使って、「このツールは何に役立つのか」を探したことがあるか
問題を探している解決策そのものだ
初期段階でこのツールがどんな問題を解くのか明確でないなら、捨てて先へ進むべきだ
余った金は従業員と株主に回したほうがいい
AIには今や 普遍的基礎雇用 プログラムがあるのに、人間にはまだないのが残念だ
会社はAIに穴を掘らせるために金を払い、別のAIにその穴を埋めさせている
[1] https://locusmag.com/feature/cory-doctorow-full-employment/
ソ連はずっと前に100%雇用を達成しており[0]、それに伴う貧困もあった
これは税金で運営されているわけではないので同じではない
民間企業が自分の金で実験しており、後でコスト上昇を招いて顧客が他へ行くリスクも負っている
生産性と無関係に強制課税で人々に金を配るよりは、ずっとましだ
[0] https://nintil.com/the-soviet-union-achieving-full-employmen...
Amazon社内では、Kiroを使うと トークン使用量がゲーム化 されている
チームにAWSのように費用請求されたり、以前のシステムのように容量を説明させられたりする方式ではないからだ
社内順位を誰が見るより前から、人々がこの指標をゲームしていたという話は十分信じられるし、熱心な利用者が各種の社内プロジェクトを作って共有しているのも多い
社内発表でN00%の生産性向上のような話を聞いた管理職が圧力をかけるのは確かだが、私のいるところでは、実際の仕事の代わりに偽の作業を作ればかなり早く見抜かれるだろう
圧力は、攻撃的な締め切りと、年次OP1プロセスでよりアジャイルなやり方に変わったことから来ている
AWSや、AWSではない他のFAANG社員からも似た話を聞いた
すべてのトークン順位表には「これは人事評価に反映されない」という免責文句が付いているが、その後に暗黙の 目配せとウィンク が続く感じだ
私が聞いたある組織には、GasTownを24時間動かしてトークンを食い続ける人がいる
貢献は大してないが、悠々と1位を取っている
GasTownを回して、エージェントにコードベースのあちこちを触らせるので、1日に50件くらいコミットが出る
互換バージョンやフォーマット調整のようなものだ
ただ問題は技術ではなく、その人自身だ
彼はLLM以前からすでにそうだった
リポジトリをより小さなリポジトリに「リファクタリング」して、突然コード全体に自分の名前が付くようにしたりしていて、ざっと見ると会社のコードベースの大きな塊を彼が作ったように見えた
私がやろうとすることを却下しておいて、後から自分でやることもあった
私のプルリクには延々と難癖を付けるか、そもそもその仕事をやるべきではないと言った後、振り向いて自分で実装する
私のコードをコピペするわけではないが、私のPRが開いた後で、自分が却下した同じアイデアをまた実装する
とても頭がいいが、とても不誠実で、その不誠実さを隠すのがうまい
尋ねると「このやり方のほうが整理されて見えると思った」といった具合に答える
外から見れば一方のやり方が他方より良いと主張できる余地があるので、不誠実さは明白ではないが、私は彼のやっていることを100%見ているので、パターンは完全に明らかだ
さらに、ある週に休暇を取ると言ったとき、明確に拒否はしなかったが、The Thingを納品しなければならない圧力が大きいので休暇を延期できないかと言われた
私が「いいえ、延期しません」と言うと承認したが、実際その週になると本人も同じ週に休暇を取っていた
これは追及しなかった。彼が、自分なら決して受け入れないことを他人に要求するのを恥じない人間だと、もう十分に知っていたからだ
Amazonの広報担当者が、会社全体のAI利用指標も、社員同士を比較する社内順位表もなく、個人ダッシュボードで自分の利用量しか見られないと言ったのなら、完全なでたらめだ
Kiro/QuickSuite(旧Amazon Q)の利用量をトークン基準で社員別に順位付けする グローバルダッシュボード がある
ダッシュボード自体はQuickSight上にあり、QuickSightもどうせQuickSuiteの一部になった
データは誰にでも開かれているだけでなく、順位、日次・週次・月次・年次の利用量で並べ替えられる
現職社員と元社員の両方が社内エイリアス基準で含まれている
そのうえ、PhoneToolプロフィールに表示される社内の「表彰」システムもあり、各社員がKiro/AmazonQ/Quicksuiteの称号である「Blaze」「Thunderstorm」などを受け取る
同じ賞を受けた他の人もクリックひとつで見られる
ちなみにPhoneToolは、他の社員を検索できる社内プロフィールディレクトリだ
一方で、まともなコードを自力で書いたり、何かに直接統合したりできない人を何人も知っている
ずっと手を引いてやらないといけない人たちが、Kiro/AmazonQで膨大な量を生み出し、最近ではSDEより上位に来ている
彼らはSDEというより、SysDev、サポートエンジニア、TPMに近い
それ自体を必ずしも良いとも悪いとも言えないが、トークン使用量でスタックランキングすると、「良い」コードを書こうと努力する優秀なエンジニアが、簡潔な解決策に努力しない人より低く評価される可能性が高い
結局品質は落ち、リーダーシップが何が起きたのか気づく頃には手遅れになるだろう
Amazon-Q/Kiro関連の障害をすでに見ているのに、まだ否定し続けている
うちの職場にもこういう流れが来ている
毎日MS OfficeのCopilotを使わないと怒った通知が来るので、ただ Hello と入力している