1 ポイント 投稿者 GN⁺ 4 시간 전 | 1件のコメント | WhatsAppで共有
  • Microsoftは大半のClaude Code直接ライセンスを取り消し、エンジニアをGitHub Copilot CLIへ移行させることで、社内AIツールのコスト削減を進めている
  • Claude Codeは数千人の従業員にコーディング実験用として提供された後、急速に人気を集めたが、利用規模が拡大するにつれてコスト負担も増大した
  • UberはAIコーディングツールの予算を2026年の4か月間で使い切っており、社内リーダーボードでチーム別のAIツール利用を奨励している
  • 企業が生産性向上のためにトークン使用量を増やすほど、トークン単価が下がっても総請求額は大きくなりうる
  • Goldman Sachsはエージェント型AIが2030年までにトークン消費を24倍に増やす可能性があると見ており、Gartnerも消費増加が単価下落を上回る可能性があるとみている

企業内で拡大するAI利用とコスト負担

  • Microsoftは、The Vergeの報道を受けて、大半のClaude Code直接ライセンスの取り消しを開始し、エンジニアをGitHub Copilot CLIへ移行させている
  • Claude Codeへのアクセス権は6か月前、開発者、プロジェクトマネージャー、デザイナーなど数千人の従業員にコーディング実験用として提供され、急速に人気を集めたが、利用規模が大きくなるにつれてコスト問題が浮上した
  • Claude Codeライセンスの取り消しは、MicrosoftのFoundry契約には影響しない
    • この契約には、Anthropicへの最大50億ドルの投資、Foundry顧客によるClaudeモデルへのアクセス、AnthropicによるAzureコンピュート容量300億ドル分の購入約定が含まれる
  • Uber CTOのPraveen Neppalli Nagaは、The Informationで、Uberが2026年のAIコーディングツール予算全体をわずか4か月ですでに使い切ったと明らかにした
  • Uberは、チーム別のAIツール使用量を順位付けする社内リーダーボードによって導入を積極的に後押ししている
  • Nvidiaの応用ディープラーニング担当副社長Bryan CatanzaroはAxiosのインタビューで、「私のチームでは、コンピュートコストが人件費をはるかに上回っている」と語った
  • AnthropicはFortuneのコメント要請に即座には応じず、Microsoftもコメントを出していない

より安いトークンがより大きな請求書になる構造

  • 企業は生産性向上のために従業員のAI利用拡大を強力に推し進めているが、トークンベース課金では利用量が増えるほど総コストも増大する
  • Metaの従業員は、Anthropicのモデル名にちなんだ「Claudeonomics」リーダーボードを作り、従業員ごとのAI利用量を追跡していた
  • Amazonは従業員に「tokenmaxxing」を奨励しており、これはAIコンピュートの基本構成単位であるトークンをできるだけ多く使うことを意味する
  • Goldman Sachsは、消費者と企業によるAIエージェント導入によって、エージェント型AIが2030年までにトークン消費を24倍に増やし、月間120兆兆個のトークンに達する可能性があると予測している
  • Gartnerは、2030年までに1兆パラメータLLMの推論コストが2025年比でほぼ90%低下すると見ているが、より安いトークンがそのまま企業のAIコスト削減に直結するわけではないと予測している
    • エージェント型モデルは、標準モデルよりも1作業あたりはるかに多くのトークンを必要とする
    • 消費増加が単価下落を上回る可能性がある
    • AIプロバイダーが低下したコストを消費者に完全には転嫁しない可能性がある
  • GartnerのシニアディレクターアナリストWill Sommerは、「CPOは汎用トークンのデフレをフロンティア推論の民主化と混同してはならない」と警告した
  • Nvidia CEOのJensen Huangは、いずれ従業員1人あたり100体のAIエージェントが一緒に働くようになると述べているが、トークン消費が単価下落よりも速く増えれば、このエージェントの未来は経営陣の想定よりはるかに重いコストを伴う可能性がある

1件のコメント

 
GN⁺ 4 시간 전
Hacker Newsの意見
  • 元記事ベースの活発な議論はこちら: https://news.ycombinator.com/item?id=48238896
    記事には「MicrosoftがClaude Codeの直接ライセンスの大半を取り消し始めたとThe Vergeが報じた」とある

    • この記事はかなり雑に書かれているように思う
      1. MicrosoftがAIは従業員より高いと言ったという引用はない
      2. Nvidiaのディープラーニングチームが従業員よりAIに多くの費用を使っているというのは、そのチームの目的がエージェント的コーディングではなく、深く重いAI活用だから筋が通る
        「トークン課金では、より多く使って効率が良くなるほど高くつく」というくだりもおかしい。なぜ効率が上がるとコストが増えるのか分からない
  • タイトルが誤解を招く気がするし、記事を読めばその理由はもっとはっきりする。これらの会社には、できるだけ多くのトークンを燃やせというばかげたOKRや目標がある
    トークン使用量を指標にすれば、当然ものすごく高くつく結果になる
    推論コスト自体は負担可能な水準だし、この技術を有用に使うのに必ずしも最新の独占モデルが必要なわけでもない。人間のエンジニアはかなり長く必要だろうが、「一部の人間 + LLM」が単に人間をさらに雇うより高くつくとか、今後もずっと高いままだという点には同意しない

    • 単にこう言ってもよかったのでは: 会社がIT部門に対して、開発者1人あたり1日1000ドル以上使えというOKRを導入した。会社はITコストが以前よりはるかに大きくなったことに驚き、なぜこうなったのかを把握するシステムを作ると言って、それを開発者1人あたり1日1500ドルに引き上げた
      今はバイブコーディングよりバイブ・リーダーシップのほうが問題に見えるし、バイブ・リーダーシップは本質的にAIとは関係ない。曖昧な直感ひとつにしがみつき、コストや結果に関係なく非論理的な結論まで押し通す人たちだ
    • 記事を見る限りでは、「AI」をやめたのではなく、LLMをClaude CodeからGitHub Copilotに切り替えたように見える
    • グッドハートの法則: 指標が目標になった瞬間、その指標は良い指標ではなくなる
    • 投資家が興奮する売上高の数字は、まさにそのトークンを指標にする世界に基づいているのではないかと思う。爆発的に成長する事業であると同時に、より厳しく支出しなければ投資収益率が出ない、という両方を同時には成り立たせられない
    • メディアはAIを燃やし尽くすと決めたかのように見える。ニュースフィードには、データセンターの悪、AIの無用さ、みんながAIを嫌っているという記事ばかりだ
  • この記事の前提は間違っている。Microsoftが社内のClaude Code利用を取り消すのは、AIコストが高すぎるからではなく、競合製品であるGitHub Copilotを持っていて、従業員に自社製品を使わせたいからだ
    ロックダウン中にTeamsがあれほど注目されたのも同じ理由だ

    • その通り。記事はMicrosoftの行動をコスト問題と混ぜているが、実際にはコストが理由ではない。そこに「Nvidia応用ディープラーニング担当副社長」の恣意的な引用を付け足して、自分のチームではコンピューティングコストが人件費より大きいと言わせている
      しかしそのチームはソフトウェア開発用のLLMを使っているのではなく、文字通りディープラーニングのチームで、ディープラーニング開発のやり方で計算資源を燃やすチームだ
      少し計算すれば、MicrosoftがAIに開発者以上の金を払っているはずがないと分かる。製品開発職の従業員は約8万人で、シニア開発者の総コストはおそらく40万ドル程度だろう
      Microsoftに320億ドルのClaude請求書があるだろうか? ないと思う
    • 両方とも正しい可能性はある。Claudeが高すぎるのと同時に、従業員をCopilotへ移したいのかもしれない。自社製品だからコストが下がり、その結果として利用量やフィードバックが増えることも期待できる
      ただ、ロックダウン中にTeamsが注目された事例が前の主張とどう平行しているのかは、よく分からない
  • 記事のどこにも、MicrosoftがAIは人間の従業員より高いと報告したとは書かれていない

    • うわ……Fortuneに何があったんだ? こんなクリックベイトよりずっと良い媒体だと思っていたのに
    • 投稿タイトルの単語が1つ抜けているのかもしれない。「Microsoft reports show AI is more expensive...」であるべきだろう
      Microsoftが明示的にそう言っていなくても、AIのほうが高いという事実自体は示されている
  • tokenmaxxingブームは、今回のAIの波から出てきた最も愚かな発想の1つに思える。効率性と生産性の最大化とは正反対なのに、広く受け入れられている

  • http://archive.today/l3EEo

  • MicrosoftがClaudeを取り消したのは、CopilotがいまひとつだからCopilotを自分たちで使わなければならないからだ。社内で認められている話で、秘密でもない
    今はAnthropicのトークンが補助金を受けていたため、Microsoftにとってはむしろ高くなっていた可能性がある

  • AI利用のコストを分析するには、利用文脈を見る必要がある
    多くの人が、文書、Slackの会話、メールをきれいに整えたり、短いプロンプトで不必要に大きな文書を作ったりするためにAIを使っている。社内でSlackメッセージやメールを送るのにAIが必要だった理由はない。意味を大きく変えもしないのに、もっともっともらしく見せるために資源と時間を無駄にしている

    • そういう用途はコストがかなり低いほうではある
  • トークンを燃やすのは、金を炉に投げ込むのと同じくらい簡単だ
    トークン使用量は生産性の良い指標ではない。問題は、生産的なAI活用をどう測るかをまだ誰もきちんと見つけていないことだ。開発者たちが生産性を最大化しているのか、ただトークンを燃やしているだけなのか、変化に抵抗しているのかを見分けにくい

    • 新しいコード行数指標だ
  • AIは人間の従業員に賃金を払うより高くはない。まだAIは人間の従業員を代替できないのだから、タイトルの前提が間違っている