StackOverflowの月別質問数の変化を可視化したデータクエリページ サービス初期の2008年には月あたり数千〜1万件程度から始まり、2014〜2018年には約15万〜20万件の質問が登録され、2019年を境に月別質問数がピークから減少傾向へ転換 2023〜2025年の間に減少幅がさらに大きくなり、2025年には月間質問数が約1万件水準まで低下 これは最盛期と比べて約90%以上減少した数値
2件のコメント
StackOverflow の将来が気になる
Hacker Newsの反応
昔、楕円と点の最短距離を求める方法を Stack Overflow に投稿したことがある
自分の回答へのリンク
自分で作ったアルゴリズムで、数行しかないコードなのに非常に高速に収束する。人生でいちばん美しいコードだと思っている
昔はこれを引用した論文もあったし、Unity の衝突プラグインにも使われたと聞いた。今はもう誰からも連絡がない
最近はこれをどこに載せればいいのかも分からない。論文にするには微妙だし、昔は SO がこういうものを載せるのにちょうどいい場所だったのに、今はそういう中央リポジトリがなくなった感じがする
自分も昔 SO にEKF が singular な状態になるのを防ぐコツを投稿したことがあるが、教授がそれを見て自分に気づいたと言っていた。ああいうコミュニティは代えがたい
たとえ記事が少なくても、そういう個人ブログで世界は満たされてこそ豊かになる
だとすると、技術者が創造性を発揮する問題をどこで見つければいいのかという悩みが出てくる
このグラフを見て本当に驚いた。SO がここまで急激に衰退していたとは思わなかった
ブリタニカが Wikipedia 登場から 9 年で紙版をやめたよりも速いペースだ
自分は SO の問題を「荒っぽい運営」のせいだとは思わない。根本的には、人々がもっと速く答えを得られる別の経路ができたからだ
2016 年ごろから Reddit が検索結果によく出るようになり、Discord でも質問すれば答えが得られた
最後の決定打は LLM だ。今では SO レベルの答えを即座に得られる
では今後、LLM は何を学習するのだろうか。2014〜2020 年の SO データを延々と再利用し続けるのだろうか?
たとえば API ドキュメントが細かなシナリオを扱っていなくても、LLM は複数の文書を組み合わせて答えを作り出せる
ただし Salesforce や Workday のような特殊なエコシステムでは、今もフォーラムのほうが有用だ
今後は LLM がこうした経験を大規模に収集し、再配分する役割を担うことになるだろう
LLM の登場で SO の問題点が露わになった
質問が不当に閉じられたり、古い回答が更新されなかったり、上位回答者たちの独善的な文化が強かった
その点では LLM のほうがずっとましだと感じる
公開ベータ公開(2020) 以降、だんだんそちらを使うようになった
この 2 週間、Spark の変換の問題で苦しんでいたが、Gemini と Claude がくれた答えはもっともらしいのに全部間違っていた
結局 SO で答えを見つけて解決し、そのおかげで Spark ドキュメントの正確な箇所にまでたどり着けた
LLM は親切だが、間違った答えを自信満々に言う友達のようだ
一方 SO は不親切だが、実際に問題を解決してくれた
LLM では、そうした人間同士の議論や経験の深みを代替できない
時間がたてば、ますます正確になっていくだろう
自分の場合、LLM のほうが正答率は高い
プログラミングでは、LLM は今でも圧倒的に速く、反応が即時だ
追加情報を与えればすぐ修正し、問題を完全に理解するまで繰り返してくれる
しかも嫌味を言う人もいない
人々はこの下落を AI のせいにするだろうが、実際にはコミュニティの毒性とサイトの方向性の問題だった
重複したコメントへのリンク
だがある時点で、たいていの質問にはすでに回答があり、Google がその答えへ直接案内していた
LLM はその上に乗った「最後の一片」にすぎない
2020年の CEO 交代とモデレーター委員会発足
SO に毒性があったという話には同意するが、それでもインターネット上の開かれた知識の偉大な成果だった
プログラミングを大衆に開いた影響力は今なお非常に大きい
データアナリストとして見ると、質問減少は自然な現象だ
簡単な質問はすでに出尽くしており、新しい質問はますます難しくなっている
このグラフには削除された投稿が含まれていないので、実際より少なく見える
実際のデータグラフ
むしろ良いことかもしれない。重複質問が 20% もあり、検索さえうまくすれば解決できるものが多かった
ただし Discord のような場所へ移るのはよくない。知識が私有化され、検索できなくなるからだ
それでも SO のデータは完全に公開されているので、会社がなくなっても復元可能だ
自分は 2009〜2010 年の SO 初期に活発に活動していたが、コミュニティ運営者の過剰な干渉のせいで去った
貢献できない人たちがルールを武器にして影響力を行使する現象があった
こうしたことは、人気のある技術コミュニティならどこでも繰り返される。HN でも少しずつ見られる
SO は質問を投稿するだけでも大変な敵対的な環境になっていた
6k の評価と複数の金バッジを持っていたが、正当な質問が止められることが多かった
重複として誤って閉じられた質問が多く、結局「もうそのまま死なせておこう」と思うようになった
SO は「助ける場所」ではなく「データ正規化」を優先する文化だった
結局、その文化的衝突が自分を去らせた