バイブコーディングの幻想とAIコードの水準、そして未来
(medium.com)-
最近のAIコーディングは「実行されるコード」を素早く作れる一方で、ユーザーが期待する「良い製品」まで自動で作れるわけではないという主張
-
著者はその原因を大きく2つあると見る
- AIの常識・暗黙知の不足
- RLVRベースの学習では、「良いコード/製品」よりも「コードの実行成功」のほうが報酬されやすい構造
-
例として、世宗大王MacBook Proのハルシネーション、洗車場テスト、韓国の教室/学生画像の生成失敗を挙げ、最新モデルでも人間ならすぐ気づく違和感を見落としうると指摘
-
コーディングRLVRの報酬が実行可否に偏ると、LLMは過剰な
try-except、fallback、防御ロジックを作り、技術的負債を積み上げる可能性がある -
囲碁は勝てばよいが、ソフトウェアは「とりあえず動く」ことではなく、「人が望み、お金を払う製品」でなければならない点が核心
-
KarpathyのAJI(Artificial Jagged Intelligence)という観点で見ると、現在のAIの弱い部分は「taste」、製品感覚、暗黙的な常識の領域
-
Anthropicもデザイン/tasteの領域はまだ人間が多く担っている一方、モデル改善に伴ってその境界は再交渉されつつあると見ている
-
著者はGPT-5.4 → GPT-5.5のようにモデルが改善されるにつれ、このギャップは徐々に縮まっていくと展望
-
究極的には、人間と区別しにくいレベルの感覚と判断を備えればチューリングテストを通過し、その時点をAGIと見なせると主張
要約:
AIコーディングの問題は「コードが書けない」ことではなく、「人が望む製品が何かを理解しないまま、実行可能な成果物に最適化される」こと。現在の人間の役割は、AIに不足する常識、taste、製品判断を補うことにある。
10件のコメント
筆者がどんな方なのかは知りませんが、個人的にはここ10年で読んだ文章の中で最もレベルの低い文章でした。
あまりにも衝撃的で、読んでいる途中で呆然としてしまうような感覚になりました。
では、まずはご自身で良い文章を一つ書いてみてください。
同意できる部分もあれば、そうでない部分もありますね。結局のところ、まだ人間の知能が積極的に関与するのが正しいのだと思います。バイブコーダーたちも、コーディング自体が得意でなくても、ソフトウェア構造や最低限の常識を土台にして開発すべきです。結局、マネジメントもできず、ドメイン知識のないアイデアは砂上の楼閣で、長くは続かないと思います。
当たり前の話を長々と書いて、有名な名前をいくつも並べているだけで、あまり読む価値はないと思います。
私も当然の話だと思います。
ただ、この文章を書いたのは、私自身が実際にそう感じたことや、複数のコミュニティでそうした話を聞いたことがあったからです。
うわぁぁぁぁ
昔からずっと言われてきたこと。だが結局は時間が解決してくれる問題だ。10年後も今と同じだろうか?
違うと思います。
AIがいつか、指示文にもない内容について疑問を持って意見を言える日が来れば
本当に人間が代替されるのかもしれませんが
お金持ちが自動運転ではなく運転手を連れて歩くのと似たように
何かをやれと言われたら、一つひとつ確認する役を代わりに担う人が未来のエンジニア(私の姿)になるのでしょうか
現在のLLMの水準では、単に疑問を持つことよりも、「人間の常識」を持つことのほうが重要でしょう。
将来、LLMが一瞬で人間の望むものを開発できるようになり、ソフトウェア企業は消滅するだろうと、数年前にある有名人が予測していました。