- LLMベースのコーディングツールに対する誇大宣伝にもかかわらず、実際のソフトウェア開発成果物の品質は大きく向上しておらず、むしろ 偽造(forgery) に近い産物が氾濫している
- LLMがしていることの本質は、個人が自分または他人の 潜在的な成果物を模倣 してより速く作り出すことであり、それを本物の代替として使おうとすると問題が生じる
- オープンソースプロジェクトは、AI生成の低品質PRによって 公開コントリビューションを停止 したりバグバウンティを中止したりするなど、実害を受けている
- ゲーム業界は、消費者主導で AIコンテンツのラベリングとフィルタリング を求め、効果的に抵抗している一方、ソフトウェアエンジニアは無防備なまま受け入れている
- LLMが嘘をつくのをやめるには 適切なソース帰属(source attribution) が不可欠だが、現在のモデル構造では技術的に不可能な状態にある
AI利用の不可避性というフレームへの反論
- 業界の誇大宣伝によれば従来のソフトウェア開発は終わったことになっているが、数年にわたってLLMベースのツールを使っても、成果物は以前とほぼ同じ水準にとどまっている
- 技術に対する 膨大な量の誇大宣伝 が莫大な投資を呼び込み、その投資がさらに多くの誇大宣伝を必要とする循環構造になっている
- 新しいモデルは、すでに退役したモデルが達成しているはずだった約束を果たすために、引き続き訓練されている
- 「AIを使わなくてもまったく問題ない」 — これは時代遅れの態度ではなく、むしろAIを受け入れた側よりストレスが少なく、満足度が高い可能性すらある
職人技(Craft)vs 大量生産(Kraft):偽造というフレーム
- LLMの働きをめぐるさまざまなフレーミング(支援、創造性、生産性 vs 怠惰、使い捨て、盗用)の中で、驚くほど欠けている言葉が 偽造(forgery) である
- Van Gogh風に絵を描いて彼の署名を入れれば偽造、法的文書になりすませば偽造、データを改ざんした研究も偽造であり、偽造かどうかは対象物とその 制作方法に内在 している
- LLMは、個人が自分または他人の潜在的成果物の 偽造品をより速く 作れるようにするツールである
- 模倣それ自体は表現の自由として合法だが、偽造品を 本物の代替物 として使おうとすると問題になる
- サンタクロースからの手紙を「偽造」しても逮捕はされないが、極度に精巧な「模造通貨」を収集品として所持するだけでも、どの法域でも許されない
原産地保護と品質基準の比喩
- フランスの 「Brie de Meaux」 のような原産地統制食品は、伝統的な製法、高品質の原材料、特定の地理的原産地のすべてを要求する
- 海外生産を認めれば、必然的に 安価な模造品の氾濫 につながり、本物のブランドを損ない、世代を超えて受け継がれてきた希少な地域的専門性を脅かす
- 個々の消費者の判断だけでは市場の適切な機能を保証できず、店頭に並ぶ商品の範囲はすでに消費者の統制外にある要因によって決まっている
- 職人製チーズの品質は、現代的な方法で運営される サプライチェーン全体 を代表しており、それを別の場所に移植するには人的資本、インフラ、農業への莫大な投資が必要となる
- あらゆる社会は 「伝統的な職人チーズ」 と 「工業用化学物質で作られた偽の卵」 の間のどこかに線を引かなければならず、食の職人技の価値を理解し維持する社会だけが、70%以上の肥満率(ナウルの事例)を避けられる
オープンソースと日常コーディングにおけるAIスロップ(slop)の被害
- オープンソースのメンテナが 最初に副作用を実感 している — もともと意欲ある貢献者を見つけ、プロジェクトの目標やエンジニアリングの考え方に適応してもらうだけでも大きな困難があった
- GitHubの履歴書を飾るために スロップで書かれたPR を送る貢献者が現れている
- tldrawは 公開コントリビューションを停止、curlプロジェクトは バグバウンティを中止、他のプロジェクトは偽の貢献者を嘲笑する形で対応している
- バイブコーディング(vibe-coding)の同僚と働く日常でも同様の効果が生じる — 新人社員が素早く適応しているように見えても、実際には 初期学習プロセスをボットに丸投げしている にすぎない
- 2026年時点では、新人社員が非常に詳細な説明とコメント付きのPRを提出したら、そのすべての言葉を疑わなければならない
シニアエンジニアと10x/100x生産性という幻想
- AIを使う経験豊富なベテランが以前の10倍、100倍のコードを生産すると言われるが、実行し依存するすべてのコード行は負債(liability)である という点をいまだに理解していない
- 「AIコーディングが素晴らしいのは、エージェントに必要なことがすべてコードベースに書かれているからだ」という発言は 致命的に誤った主張 である — それが本当なら、実際に行うべきコーディング作業そのものが存在しないはずだ
- 核心的な違いは、エンジニアがキャリアの大半を 他のソフトウェアが生んだ問題を解決 することに費やしてきたか、それとも ソフトウェアが存在する前から人々が抱えていた問題 を解決することに費やしてきたかにある
- 後者だけが、問題の実際の制約条件やユーザーニーズについて考える方法を教えてくれる
- ソフトウェアをそれ自体を目的と見なすと、月額10ドルのVPS で十分なものを、過剰設計されたインフラクラウドにしてしまう
スロップコードの特徴と業界の反応
- 職人技を備えたエンジニアはレビュー時にスロップを容易に見抜く — 過剰な重複コード、不必要な複雑さ、リファクタリングの拒否 などの形で現れる
- シニアですら、長年の経験があるにもかかわらず、バイブコーディングで 当惑するようなミス を犯し、それをそのまま流してしまう事例が観察されている
- Microsoftの Co-pilot Discord で「Microslop」という侮辱語を禁止した件 — ユーザーの反発を「スパム」や「有害」とフレーミングすることで、約束のほうが実際の結果より重要に扱われる 現象が見られる
- これらのツールは 「中毒性がある」 とか 「持ちうる最高の友達」 とまで呼ばれるが、それに伴う創造性や達成のカンブリア爆発は見えてこない
ソフトウェア産業の構造的問題とAIの役割
- AIで作られているものの大半は、PC革命以降にソフトウェアアプリケーションが より閉鎖的で、分散的で、企業的 になったことで必要になったグルーコード(glue)である
- HTTP APIは、毎晩スキーマが変わる ドキュメント不十分なJSON blob を要求するため、真のオープン性を提供できていない
- 多くの会社はいまだに主として Excel で運営されており、JSONにとってのExcelに相当するツールは存在しない
- SQLがビジネスを専用ツール依存から解放すると言われていたが失敗し、歴史は繰り返している
- バイブコーディングされた Electronアプリ が依然としてマルチプラットフォームのネイティブアプリより好まれている状況で、100倍生産性の実体はどこにあるのか疑問である
- Appleですら最新OSで 適切なフォームとアイコン体系 を維持できていない状況では、ウェブスロップで訓練されたAIの可能性はさらに低い
ゲーム業界の効果的な抵抗
- ソフトウェアエンジニアは救命胴衣なしで飛び込んだが、ゲーム業界 は消費者主導で効果的に抵抗している
- 多くのゲームタイトルが、ラベルのないAIコンテンツについて 謝罪し、削除 している
- Steam はAIコンテンツに関する明確な方針を持ち、SteamDBはAI生成ゲームを フィルタリングするツール を提供している
- 最近Steamのポリシーが更新され、プレイヤーに提示されるコンテンツを生成しない 開発ツールの「効率向上」 用途は除外された
- ゲーム市場が効果的に抵抗できる理由は2つある:
- デジタル配信の 純粋なD2C(消費者への直接販売)市場 であり、ゲーマーがすべての選択権を持ち、透明性を要求するテイストメーカーもゲーマー自身である
- ほとんどのゲームは 芸術的 であり、特定の芸術的魅力によって購入される — 芸術において模倣は原作の価値を下げ、クレジットを奪うものと見なされる
コード再利用と芸術的独創性の対比
- コードは一般に再利用によって損なわれず、インフラではむしろ 利益 になる場合もある
- これが、オープンソースプロジェクトが才能ある 芸術的クリエイティブを引きつけるのに特に不向きな 理由である — コストのない共有の精神は、芸術的デザインが本来の文脈を失ったまま即座に盗用されることを意味する
- 古典的な プロシージャル生成(procedural generation) は先例として注目に値するが、概して期待に応えられなかった
- No Man's Sky(2016年版)の事例 — 限られたソースから指数関数的なコンテンツを作るという約束は、自らの産出物の多様性を無価値にしてしまう
生成AI、海賊ライブラリ、そして法的曖昧さ
- アーティストが生成AIを 大規模な剽窃 として糾弾するのは当然であり、テック起業家やデータ整理者がそれを理解できず、海賊版の シャドーライブラリ でモデルを訓練するのもまた当然である
- NvidiaがAnna's Archiveの膨大な海賊版書籍コレクションに対する 高速アクセス取引 を試みたとされる疑惑
- 出力が 平凡で、粗雑で、疑わしい のには明確な理由がある — 学習ソースの多様な訓練サンプル自体が、機械向けのスロップにすぎない
- これにより、何が引用で、何が幻覚で、何が独創なのかを 判別不能なもっともらしい否認可能性(plausible deniability) が生み出される
- AIコンテンツに AI生成ラベル やウォーターマークを付けるのは、たいてい責任回避であって、真に責任ある開示ではない
- バイブコーディングが受容可能で正当化されるためには、エンジニア自身の成果物が 使い捨てで、創造的ではなく、クレジットに値しない と見なさなければならないという逆説的な立場に立つことになる
ソース帰属(Source Attribution)という解決策
- どの裁判所もAI成果物全体について合法性や著作権性を判断すべきではなく、出典のない成果物は偽造として扱うべき である
- LLM問題の解決策は明確だが達成不能である: LLMが推論とともに 適切なソース帰属を実行すること
- これは芸術面だけでなく、バイブコードのかなりの部分が元の著者、ライセンス、リンクを省いたまま既存コードベースから コピー&ペースト されていることを明らかにしうる
- 現行モデルで実際の帰属は 技術的に不可能 である — LLMが出典に言及し引用する能力そのものが、収集データの 創発的特性(emergent property) だからだ
- LLMはテキスト内の現在位置にふさわしいときにだけ出典を引用でき、それはしばしば正しく引用されるものをうまく引用しているにすぎない 引用ロールプレイ(citation role-play) である
- 帰属要求の含意は膨大である: 重みが帰属可能で順伝播が監査可能でなければならないなら、逆伝播(backpropagation) はどのような姿になるのか、
int4 には収まらないだろう
- 「AI検出ツール」 が逆方向から解こうとしている問題はまさにこれである
- ワールドワイドウェブと、それを活用するGoogle規模の検索エンジンに続く次世代技術が、情報の出所を設計上示せない技術 であるというのは逆説的である
- 機械が嘘をつくのをやめるには、出典をきちんと引用しなければならない。AI企業も同様だ
3件のコメント
何だこれ、俺、語彙力が落ち始めてるな。
「創発的、スロップ、出典帰属、フレーミング効果、カンブリア爆発」なんて調べて座り込んでる。
Hacker Newsの意見
ビデオゲーム市場は消費者がAIに反発した珍しい事例に見えるが、実際には AIアートアセット にだけ反発があった
コードがAIで書かれていようといまいと、誰も気にしていない。SteamのAIアンケートを見ると、コード生成はすでに許容されている状態だ
結局 LLMコーディングの拡大は不可避 だ。手続き的生成も同様で、ツールの問題というより使う人の力量にかかっている
LLM論争にはうんざりする。この技術は人を 強化 するより 統制 し、解雇を容易にし、富をさらに集中させる方向で使われている
まるで豚たちが ベーコン製造機 の有用性を論じているようだ
ラッダイト運動 は単純な反技術主義ではなかった。彼らは品質低下を懸念し、実際にその通りになった
中世ヨーロッパの手工芸のウールスカーフは、現代の工場製品とはまったく異なっていた。技術発展は常に 1:1の置き換えではない
今でも非技術者が作った社内ツールが何百時間も節約するのを見て、完璧でなくても 効果があるなら十分 だと感じる
LLMが明らかにした現実は、プログラミングの大半が ボイラープレートコード だという点だ
本当の価値は、より高いレベルでの小さな革新にある
LLMの理想的な活用法は 教師の役割 だ。コードの代わりに概念を素早く教える道具として使うのがよい
職人のチーズやハムのように、未来には Artisanal Coding が生まれるかもしれない
人間の代わりに仕様をコードへ写す機械になったわけだ
冷徹な現実として、誰も私たちの コードそのもの には関心がない
ほとんどの人は動くかどうか、速いか、安いかしか気にしない。結局、私たちは 工場労働者 に近い
時計職人が自動旋盤を見て感じた喪失感に似ている
結局、私たちが守ってきた「創造的な仕事」という ロマン的な物語 が崩れつつある
このすべての議論は、結局 TTP(Time To Penis) ミームのように繰り返される人間の本性の問題のように思える
この記事は本当に 現実的でバランスの取れた視点 を示している
本文も返信も驚くほど否定的ですね。みんなClaude Codeを動かしてみたこともないんでしょうか..