バイブコーディングの幻想とAIコードの水準、そして未来
(medium.com)-
最近のAIコーディングは「実行されるコード」を素早く作れる一方で、ユーザーが期待する「良い製品」まで自動で作れるわけではないという主張
-
著者はその原因を大きく2つあると見る
- AIの常識・暗黙知の不足
- RLVRベースの学習では、「良いコード/製品」よりも「コードの実行成功」のほうが報酬されやすい構造
-
例として、世宗大王MacBook Proのハルシネーション、洗車場テスト、韓国の教室/学生画像の生成失敗を挙げ、最新モデルでも人間ならすぐ気づく違和感を見落としうると指摘
-
コーディングRLVRの報酬が実行可否に偏ると、LLMは過剰な
try-except、fallback、防御ロジックを作り、技術的負債を積み上げる可能性がある -
囲碁は勝てばよいが、ソフトウェアは「とりあえず動く」ことではなく、「人が望み、お金を払う製品」でなければならない点が核心
-
KarpathyのAJI(Artificial Jagged Intelligence)という観点で見ると、現在のAIの弱い部分は「taste」、製品感覚、暗黙的な常識の領域
-
Anthropicもデザイン/tasteの領域はまだ人間が多く担っている一方、モデル改善に伴ってその境界は再交渉されつつあると見ている
-
著者はGPT-5.4 → GPT-5.5のようにモデルが改善されるにつれ、このギャップは徐々に縮まっていくと展望
-
究極的には、人間と区別しにくいレベルの感覚と判断を備えればチューリングテストを通過し、その時点をAGIと見なせると主張
要約:
AIコーディングの問題は「コードが書けない」ことではなく、「人が望む製品が何かを理解しないまま、実行可能な成果物に最適化される」こと。現在の人間の役割は、AIに不足する常識、taste、製品判断を補うことにある。
まだコメントはありません。