21 ポイント 投稿者 GN⁺ 2025-09-04 | 8件のコメント | WhatsAppで共有
  • 最近のAIコーディングツールの生産性向上という主張をデータで検証した結果、実際には速度や成果物が目立って増えていない
  • METRの研究では、開発者はAIコーディングツールによって生産性が20%向上すると信じていたが、実際には19%低下していた
  • 数多くの宣伝文句や企業、開発者による誇張された10倍の生産性という主張は、市場の現実や新規ソフトウェアのリリースに反映されていない
  • Shovelware(大量生産アプリ、低品質ソフトウェア)の急増のような現象は観測されておらず、目に見える変化がない
  • GitHub、Copilot、Cursor、Google、OpenAIなどの企業と一部開発者による生産性の誇張が、投資、リストラ、年収設定に悪用されている
  • 核心となる結論: 「実際により多くのソフトウェアが生まれていない限り、AIコーディングが開発者を10倍にするという主張は虚構だ」。したがって開発者は圧力に振り回されず、データで対応すべきだ

序論: ソフトウェア開発者、AIコーディングに憤る

  • 長年ソフトウェア開発者として生きてきて、プログラミングに誇りとアイデンティティを持っている
  • AIベースのコーディングツール導入初期には期待を抱いていたが、最近の研究(METR)によって懐疑的になった
    • 自分ではAIコーディングによって約25%速くなったと思っていたが、METRの研究ではむしろ19%遅くなるという結果だった
  • この研究により、開発者が体感するAIツールの効率性と、実測データが正反対であることが確認された
  • 自ら実験してみた結果でも、AI活用が実際のプログラミング時間に好影響を与えていないと実感した

自ら検証: AIあり・なしのランダム比較実験

  • 作業単位ごとにAIを使った場合と使わなかった場合の**時間差(Delta)**を測定する実験手法を適用
  • 6週間の実験で得られたデータからは、統計的に有意な差は見つからなかった
  • 小規模なサンプルにもかかわらず、AI利用は実際にはむしろ21%遅くなる傾向が確認された(METR研究と同じ数値)
  • もし本当に2倍、10倍の改善効果があったなら、データにはっきり表れていたはずだ
  • 現在のAIコーディングという夢は実現しておらず、実際には変化がない

期待と現実: Shovelwareの爆発的増加がない理由

  • AIコーディングの生産性革命が現実なら、あらゆるアプリやサービス、ゲームが爆発的に増えているはずだ
  • 数多くのAIコーディングツールのマーケティングメッセージ(“Built to make you extraordinarily productive” など)が飛び交っている
  • Google、OpenAI、GitHub Copilotなども、開発者の25%速度向上10倍の生産性を主張している
  • しかし実際の新規ソフトウェア公開データ(GH Archive、BigQueryなど)では、急激な成長や爆発的増加は起きていない
  • 2022年以降、AIコーディングが一般化したにもかかわらず、世界全体の新規リリース数やプロジェクト数値には大きな変化がない

市場への影響と開発者の現実

  • AI-First戦略、FOMO、大規模レイオフ、開発者の年収引き下げといった業界内の社会的波紋まで生じている
  • 実際の開発現場では、AIツールは生産性革命をもたらしていない
  • 学習曲線やツール習熟度でも、絶対的な生産性差を説明することはできない

結論: 冷静なデータベース判断の必要性

  • 現時点で新規ソフトウェア出荷量に変化がないことを、データで確認するのが核心だ
  • AIで10倍コーダーになったという主張には証拠がない
  • 開発者は圧力に屈せず、自ら確認したデータに基づいてツール選定を行うべきだ

よくある反論への反駁

  1. "プロンプト技術をきちんと身につければ10倍開発者になれる"

    • 実際に10倍の生産性を達成した人たちがいたなら、世界の新規ソフトウェア生産量は2倍以上になっていたはずだ
    • 主張よりも**客観的な成果物(アプリ、プロジェクトなど)**こそが重要な証拠だ
  2. "まだ初期段階だから時間が必要だ"

    • すでに数十億ドルが投資され、実際の現場にも導入済みだ
    • 今日の意思決定が現実の人々の生活に直接影響する
  3. "今導入しなければ出遅れる"

    • GitHub Copilotのデータなどを見ても、習熟度向上による実質的な生産性向上はごくわずかだ(29% → 34%承諾率)
  4. "量は同じでも品質が良くなっただけだ"

    • 業界全体の品質はむしろ後退しており、テストも減っている
    • 本当に10倍コーダーのためのツールなら、Shovelwareの氾濫が現実になっているはずだ
  5. "すべてがWebサイト中心で、今はドメイン名に関心はない。Vercelのようなサービスのサブドメインで十分だ"

    • 依然として独自ドメインを好むユーザーは多い
  6. ".aiドメインの急増(今年47%)=実質的な増加だ"

    • 新規ドメイン増加はAIスタートアップのピボットによるもので、全体の新規ドメイン数が爆発的に増えたわけではない
    • ドメイン総数はそうなっていない
  7. "開発の本質はコード以外の業務だ"

    • 大企業ではない個人・小規模開発者の環境では、実際にはコードが中心だ
    • ちょっとしたコーディング欲を満たす新規プロジェクトが、目に見えて増えているわけでもない

まとめ

  • 開発者は実際にはより多くをリリースしていない
  • AIコーディングが10倍の生産性をもたらすという主張は、データで反証できる
  • 業界のFOMOやマーケティングの物語に振り回されず、実際の成果物を中心に評価すべきだ
  • 著者のメッセージ: 「プレッシャーを感じるなら、データとグラフを見せよう。10倍生産性の主張には領収書を求めよ。

8件のコメント

 
ahwjdekf 2025-09-07

10x開発者なら、AIの助けで12xくらいまで跳ね上がることはあるでしょう。

 
overthetop 2025-09-06

AIはまやかし。信頼できず、レベルも低い。AIで開発できるというのは誇張された嘘だ。不可能だ。そしてAIを使うのは、開発者の倫理を捨てる無責任な行為だ。

 
nemorize 2025-09-06

単純な反復作業はAIに完全に任せて、より重要な作業に完全に没頭できるレベルになってこそ、そのとき初めてAIがコード作成の生産性向上に大きく役立つと言えるのではないかと思います。

命令を一度出すと、数十秒ほど待った末にアウトプットが出てきますが、その数十秒の間を有効活用できるわけでもないですし、数十秒待てば常に完璧なアウトプットを期待できるわけでもありません。

結局のところ、その簡単な作業が完璧に終わるまでは自分がずっと気にかけていなければならず、別の作業に切り替えることもできないので……有意義な向上を期待するのは難しいんですよね。

 
nemorize 2025-09-06

いっそダングンで時給1万ウォンを払って、数時間だけ単純作業をしてくれるアルバイトを1人探すほうが、生産性向上にはもっと役立った気がします。
週に10万ウォン前後の支出だけでも、個人的にはかなり満足していました。

特に、経理の仕事をしていて辞めた後、専業主婦をされている年配の女性の方々とも何人か一緒に仕事をしたことがありますが、コーディングをまったく知らない方でも、何度かフィードバックをするととてもきれいに作ってくださいます(笑)
ボイラープレートコードは、Excelを使ってオートフィルや数式などであっという間に作ってくださることもありましたし…

 
zxcv123 2025-09-05

うーん……正直に思うのは、AIもやはり道具なので、うまく活用しないといけないということです。
どんな道具でも、うまく使う人に比べて、ただ適当に使ったり、きちんと活用できない人のほうが多いです。
AIが質の高い結果を出せるように設定すれば、十分に圧倒的なパフォーマンスを見せてくれます。
AIで質の高い結果を出す方法を知らない人たちが、ただ間抜けなプロンプトを投げまくって、生産性が下がったと言っているだけなのではないかと思います。AIの生産性を否定するのは、どうしても理解できません。

 
kirrie 2025-09-05

しかし、そのようにおっしゃるのは、「本当にCSを深く理解し、十分に熟練を積んだ人は、どんなAIよりも生産性が高い」という話と同じで、何も証明していないように思います。

 
ndrgrd 2025-09-04

少し前に話題のMETR研究を見たのですが、自分が感じていた疑問をうまく説明してくれる結果でした。

Hacker Newsのコメントにある「反復作業」をやらせても、実際には大半で手作業による確認と修正が必要です。
AIが書いた「簡単な」成果物の支離滅裂なロジックを見て、いっそ自分でやったほうがよかったのではと思ったことは一度や二度ではありません。

本当に単純なコピペレベルの作業ならうまくやるのでしょう。
でも、そういうものは単にコピペやスニペットのほうが効率的です。インターネットに接続して他人のサーバーに自分のデータを上げ、何十秒も待つ必要もありませんし。

 
GN⁺ 2025-09-04
Hacker Newsの意見
  • 私にとってAIはベルカーブのようなもので、多くの人にとっても似たようなものだと思う。アウトプットを評価する基準が重要だと思う。基準は「コード行数」ではなく、「高品質で保守可能、拡張可能で、アップグレードしやすいコード行数」であるべきだ。この基準で見ると、「リポジトリ全体を生成して」みたいな依頼の結果は意味のないゴミだが、AIが getUser(... のようなコードを自動補完してくれるのは生産性向上だ。これが0.1%増なのか、1%なのか、10%なのかははっきりとは言えない

  • 私の立場からすると最も深刻な問題は、今会社で私が扱っている問題は慎重な計画と実行を必要とするのに、AIがまったく役に立たないという点だ。ところがうちのマネージャーは「うちはAI-firstの会社だから」という理由で、プロジェクトの納期を従来見積もりの20%に縮めたと言っている。SVPやPMの間でこうした集団的狂気がものすごく広がっていて、こんなのはこれまで見たことがない

    • マネージャーがプロジェクトの納期を元の見積もりの20%に縮めたと言っていたが、これは本当にとんでもない話だと思う。こういう非現実的な数値を誰かが勝手に決めて現実にしてしまう。結局うまくいかなければその責任は私に回ってくるし、上はそのマネージャーの責任を問うだろう。AIで本当に生産性が上がるなら不要な開発者を整理すればいいが、それはLLMが開発プロセスにうまく定着してからやることだ。投資資金もAIバブルに備えてS&P 500から引き上げるべきか悩み始めている
    • もしインシデント対応までLLMに任せられるなら、CEOの望む通りにやらせて、それに伴う評判上の損害も受け入れればいい。もし失敗したら、LLMが書いたコード以前の時点までgitを巻き戻せばいいと思う。半分冗談で半分本気だ
    • 現在のAIの水準は開発者を置き換えるほどではないが、以前は自動化しにくかった多くのオフィス業務やマネージャーの役割は十分自動化できるほどには良くなっていると思う。Googleは実際にAIのためにミドルマネジメントをかなり減らした一方で、開発者はそれほど減らしていないようだ
    • AIは、技術的リーダーシップに欠けるマネージャーが開発者に圧力をかける口実として使われている
  • 複数のことが同時に真実であり得る。LLMが、ランダムに選ばれた一般的な作業に対して開発者の生産性を10倍にするわけではない。一方で、LLMが特定範囲の作業では生産性を劇的に高めるのも事実だ。忙しい反復作業の自動化にも使えるし、人間より実時間は長くかかってもバックグラウンドで回るので問題にならない。新しいAPIやライブラリを学ぶのにもLLMは大幅に速度を上げてくれるし、知らない言語で小さなglue codeを書くときにも時間を節約でき、不要な学習までしなくて済むので非常に助かる。大きな既存コードベースの保守作業では、それほど生産性の違いは感じない。新しいWebサイトのスキャフォールディング設定は、LLMが驚くほど上手い。mockクラスの作成も、mockライブラリの使い方をきちんと把握して、私が2、3回やって忘れてしまうような複雑な作業も一瞬で処理してくれる。新しいコードベースの構造把握も70%くらいは満足できる。複雑に設計されたプロジェクトでHTTPルートの場所や依存性注入関数の場所を探すようなときにも、「おいClaude、auth関連の関数ってどこにある?」と聞けるので便利だ。正しい道具を正しい仕事に使うべきだと思う

    • 新しいAPIやライブラリを学ぶのがLLMのおかげではるかに速くなったという感覚には同意しつつも、実際にLLMの回答を見てドキュメントも自分で読むと、慣習に従っていなかったり、単純な例だけを無理やり引っ張ってきたり、誤った特徴を使って動作が妙だったり複雑な道を選んだりすることがあるのは心配だ。魔法のように感じる一方で、信じすぎると実際にはちゃんと理解していないのに理解した気になりやすい
    • 「忙しい反復作業をバックグラウンドでLLMが自動化する」というのが具体的に何を指すのか気になる。実際にどんな作業で成功しているのか、AI擁護派は具体例を明確に示すべきだと思う。曖昧な話にはだんだん疲れてきた
    • 「LLMが新しいAPIやライブラリを素早く学ばせてくれる」という表現をより正確にするなら、「すでに十分古いライブラリやAPIに初めて触れるとき」に変えた方がよさそうだ。本当に新しいライブラリやツールには、LLMがあまり役に立たないことが多い
  • 動画の中で画面にコードがあふれ出し、「ジュニア開発者は終わった」という主張以上の実体がないことがほとんどだ。その理由は、経済が不安定で、AIが救世主になってくれるという期待に誇張と不安が満ちた空気があるからだと思う。実際にAIで印象的な結果を得ることもあるが、基本的にはある程度腕のある人でないと無意味だ。初心者から中級者レベルの人たちは、ソーシャルメディアで誇張された成功談ばかりを流している。人それぞれが「AIスーパーパワー」を守ろうとして心理的にも現実的にも必死になる雰囲気ができている。結局はハイプサイクルの中でどこかの時点で均衡点を見つけ、何十億ドルかが再び焼却される日を待つだけだ

    • 私の経験では、AIツールは完全に空のプロジェクト(ブランクキャンバス)では本当に力を発揮する。たとえば新しいReactプロジェクトを作るときは、ツールの方が私より速くセットアップしてくれる。ところが実務のリポジトリではほとんど役に立たない。だからこそAIツールはデモや宣伝では強烈な印象を与えるのに、現実では失望だけを残す結果になる
    • 「十分に自分で手を動かしてやってみるだけの経験がある人」だからうまく扱えるのか、AIツールとその限界に慣れている人でなければならないのか、それともその両方が必要なのか気になる
    • AIに関する大げさな話はたいてい、深みのない論文のアブストラクトだけを読んで、もうすぐ現実になると騒ぐ一般向け科学メディアの記事に似て聞こえる
  • 私の経験では、AIはいくつかの些細な作業(例: 小規模なリファクタリング、型定義の自動化など)には役に立ったが、それ以上に複雑な作業ではいろいろ見落として再作業が必要だった。将来は自分の言葉を撤回することになるかもしれないが、最近は経験の浅いエンジニアが大きな機能を実装しようとして、AIが出した結果を「良いコード」だと無批判に受け入れることが増えている。ところがそうしたコードは、私たちのスタイルガイドやパターンに従っていなかったり、すでに存在するライブラリの代わりにわざわざロジックをゼロから実装してしまい、結局私たち自身で管理しなければならないコードが増える。後になると、すべてを一度にやろうとする巨大なPRが出てくることさえある

    • 純粋に新しく書くコードなら、しばしば50行程度のコードのために大きなライブラリを引き込むより、ただ自分で書いた方が良いと思う。この点は前向きだ
    • こうしたコードやライブラリの存在そのものを把握する「発見」が宿題として残っており、チームメンバーが内部コードを自律的に使えるようにするため、ドキュメントや検索そのものをLLMに頼る方法も研究中だ。内部ライブラリの知識が偏在する現象が悩みの種だ
    • エントリーフェーズの開発では状況が変わる。プロジェクト初期はコーディングスタイルや基準がない状態なので、LLMが出す結果はチームメンバーの意見と大差ない。デモ状態までコードを作るだけでも価値がある。複数のプロジェクトを素早くデモ段階まで持っていけるのは大きな後押しだ
  • ここの主張には同意する。AIを使っても生産性が劇的に上がるのは見ていない。ソフトウェアエンジニアが継続して問題解決、判断、コード化の練習をしなければ、神経的な知識が弱まっていく可能性があると思う。AIが将来2倍、10倍の生産性をもたらす技術だという約束には実体がなく、個人のコードベースで多少の生産性向上があったとしても、市場で実際により良い製品のリリースが増えたわけではない。コンサルティングをしながら、創業者やCTOがAIを押し込もうとして、かえってコードをきちんと管理できず、より多くの混乱を招くのをよく見る。最近はエンジニアリングのベストプラクティス確立のためにアドバイザー役を務めることも多い

    • ほとんどの技術がそうであるように、実地と練習が途切れると感覚は鈍る。自転車に乗るのも久しぶりだと体の感覚が鈍るように、コーディング能力も実質的に弱くなる。ITエンジニアリングにも当てはまると信じている。実際に警戒すべきサインだ
  • CEOたちはAIで既存の開発者の生産性が10倍になると言うが、それが本当なら、むしろ開発者をもっとたくさん雇うべきではないかという疑問が湧く。同じ投資で生産性が10倍になるなら、当然その「エンジン」に資金を注ぎ込むのが合理的だ。ところが現場では、生産性はそのままで人件費だけを削っているのではないかと思えてしまう

    • 利益率が下がれば、結局は人件費から価値を搾り出さなければならないと思う。AIの魅力の99%は人件費削減で、採用はそれに逆行する。私自身はAIの生産性向上の主張には同意しないが、こうした動機の要素があることは指摘しておきたい
    • 多くのCレベルは、残っている人員もAIで置き換えられると期待しているように見える。「もうすぐAGIが実現する」というナラティブに従っている。私はそうは信じないが、その立場なら開発者をさらに雇わないというロジックは理解できる
    • 今日「収穫逓減の法則」が何かを学べそうだ。組織に投入できる人や資源には限界がある。必要以上に投入しても無意味だ。解雇が増えた理由はAIが効率を上げてくれたからであり、人間一人がやっていた仕事量をAIがカバーするようになれば、その分雇用は減る。人間一人 = AI一つではなく、仕事量がAIに移って人間が減る構造だ。人の置き換えが完全に終わったわけではないが、どれだけ人間が必要かが新たな需給の基準になるだろう。創造的な人材は常にもっと必要になるはずだが、そういう人材は不足している。年収10万〜20万ドルを望むソフトウェアエンジニアの中には、自分が企業にどれだけ節約をもたらせるかも分かっていない場合が多い。学校教育が創造性を殺してきたのではないかという気もする。問題は能力不足ではなく、自分で方向をコントロールしたりアイデアを生み出したりする力が足りないことだと思う
  • 新製品リリース数を新鮮な角度から見る分析が印象的だ。急成長どころか、予想より大きな変化はないように感じた。別の見方として、実はコードを書くことが製品リリースのボトルネックではなく、何を作るべきかを探索し、実際のプラットフォームに載せること自体に多くの時間と労力がかかっている、という解釈もできる。一方で、AIツールを間違って使うのがあまりにも簡単だという点にも同意する。時には「ついに分かった!」と思った翌日に、「また別のやり方で間違って使っていたのか」と気づく。ソフトウェア開発がなぜこんなに難しく、生産性の加速が難しいのか、20年以上開発をしていてもまだはっきりしない

    • 「コードを書くことがボトルネックではなかった」という洞察は本当に刺さる。ソフトウェアで本当の価値が出るのは「難しい問題」を解くことからであり、簡単な問題はすでにテンプレートのようにどこにでもあると気づかされる。LLMは簡単な問題はすぐに片づけるが、本当のボトルネックは依然として「ハード」な問題にある。技術、ビジネス、顧客などの理由で難しい問題はLLMではきちんと解けず、本当の利益はこの地点にある。一方で、テンプレート化できる簡単な問題ではLLMが本当に生産性を高める
    • ソフトウェア提供において、コーディングそのものがボトルネックだったことはない。AIは会社の人員削減の名目や資金調達のための口実として使われているだけだ
    • 製品開発では、反復的なユーザーフィードバックや例外ケースの修正など、時間のかかる工程はAIがあっても短縮しにくい。こうした点は、ソフトウェアには10年かかるという joelonsoftware.comの記事 ともつながっている
  • 私たちはその未来を今まさに作っている。実際、私がスピードに乗り始めたのはagentic AIが十分に良くなった4〜5月からだった。今日だけでもiMessageアーカイブをWebサイトにエクスポートするCLIツールを作ったし、以前なら数週間かかったようなことが、今では1日か2日でhomebrew formulaまで作れそうだ。iOSアプリも手書きするよりはるかに速く進んでいるが、あえてゆっくり進めている。ちなみにその投稿のデータは3〜4月で終わっているが、この時点からgenerative AIがコーディングに実質的な助けになり始めたと思う。(私はCopilotを2022年11月から使っていた)

    • こういう論争が出るたびに、「君はまだ最新のAIを使ってないんだな、今回は本当にうまくいってる」という反応が繰り返されるのは驚きだ
    • 私の経験もほとんど同じだ。私はAIハイプへの乗車が遅かったが、最近出た新しいモデルとツールの組み合わせを使ってみて考えが変わった。私の周りでは大企業がようやくこうしたツールの使用を許可し始めたところなので、実際の生産性向上データにはかなり時差があり、その影響は後になって現れるだろうと予想している。METR研究への物足りなさもあり、こうした生産性に関するメタ研究がもっと出てきてほしい
    • 同意する。agentic AIは「伝統的な」AIとは完全に違うツールだ。1年後に著者のデータや実験がどう出るのか大いに期待している
    • 「AIがついに速くなった」と言う瞬間が、わずか5か月前のことだなんて。AIの進化速度では5か月が6年に相当する変化のように感じる
  • かつてはフルタイムの開発者で、その後マネージャーやCTOとして働くうちに、だんだん開発の実務から離れていった。もう一度コーディングしようとすると、フレームワーク、API、言語、細かなコツを新たに学び直さなければならず、昔は面白かったが今では苛立たしい。ところがClaude Codeのようなツールとソフトウェア設計の経験のおかげで、以前のように大きなシステムをまた開発できるようになった。生産性が20%上がるわけでも、10倍速くなるわけでもない。そもそもやるつもりのなかったことをまたやるようになったのだから、無限大の生産性向上と表現したい。もし私が開発を愛する腕の立つ人なら、こういうツールは煩わしいだけだろうが、普段開発しない人にとっては正反対だ

    • すごいな、大きなシステムを一度どころか何度も作り直したなんて。詳しい事例を共有してほしい
    • 私のAIコーディングツールに関する大きな持論は、実際の時間を大きく短縮するというより、苛立ちを大幅に減らしてくれるということだ。文法、コンパイラ、反復作業にまつわる不要な苛立ちを減らし、本当に重要なことに意識を向けられるようにしてくれる。そのおかげで、以前なら面倒すぎてやらなかったことも今はやるようになり、退勤前に散歩へ行く代わりに、そのまま机に向かって数時間余計に作業できるようになる