- A16Zのおすすめ書籍リストに含まれる一部作品の説明で「多くの本が文の途中で止まる」という事実と異なる表現が発見された
- Neal Stephensonは、自身の小説には議論の余地はあっても実際に文の途中で終わったことはないと明確に指摘
- 彼は、この誤りはAIが生成した文言をチェックなしで公開した結果である可能性が最も高いとみている
- 実際、GitHubのリポジトリ履歴からCursor IDEが生成した下書きと、その後の人的な不注意による修正プロセスが確認された
- このケースはAI生成コンテンツの信頼性と検証不足の問題を示す重要な例として意義を持つ
A16Zの書籍リストと誤った記述
- A16Zが公開したおすすめ読書リストにはNeal Stephensonの複数作品が含まれている
- リストの説明文には「多くの本が文の途中で止まる(文字通りmid-sentenceで終わる)」という表現が含まれていた
- Stephensonはこの表現が事実ではないと指摘し、「literally」という語が含まれている点から単なる比喩ではなく明白な誤りだと述べた
- 彼は一部の読者が結末に不満を抱くことはあるかもしれないが、『Snow Crash』、『The Diamond Age』、**『Seveneves』**などはすべて明確な結末を持つと説明した
誤りの性質と問題点
- この記述は単なる**文学的批評(opinion)**ではなく、**事実的主張(factual assertion)**として誤った情報である
- Stephensonは、この誤りが作家と編集者の誠実さを損なうと述べた
- 彼は「なぜその主張がA16Zのウェブサイトに掲載されたのか」という点を問題として提起した
仮説1: AI生成文言
- 最も可能性が高い説明として、AIが作成した文言を人手による検証なしで投稿した可能性を示した
- この現象は、すでに法務、学術界、報道などさまざまな分野で頻繁に起きている
- Stephensonはこの過程を**「Inhuman Centipede」に例え、誤情報が次世代LLMに再学習されるリスク**を指摘した
仮説2: 人間の誤ったデータ使用
- 第二の可能性として誤った資料に基づく人的なミスを提示した
- サブ仮説A: 違法コピー(bootleg PDF)を用いて途中で切れた版を参照した可能性
- サブ仮説B: 翻訳版の品質問題により、実際に文が中断しているように見えた可能性
実際の原因追跡
- Stephensonはサイトを調査した結果、GitHubリポジトリのコミット履歴で手がかりを発見した
- 2023年7月21日のコミットでCursor IDEが生成した原稿が確認された
- 原稿には「セグフォルト(segfault)」の比喩があったが、後に人が「文の途中で止まる」に誤って修正した
- さらに別の人物が要約工程でタイプミスを追加し、誤りは完成した
- 彼はこれをAI活用の怠慢と人間の不注意が組み合わさった結果と評価した
インターネットの信頼性とAIコンテンツ
- Stephensonは、インターネット利用者がなおもオンライン情報を盲目的に信頼し続けていると指摘した
- 過去に、自身の小説『Cryptonomicon』の文の断片がスパムメールにランダムに挿入された例を挙げた
- それらの断片は実際に文の途中で切れており、LLMがこの種のデータを学習している可能性があると指摘した
- 彼はこの事件を通じて、AIが事実と虚構を区別できないままコンテンツを生成するリスクを強調した
結論
- StephensonはA16Zの推薦に対して感謝の意を示しつつ、誤った文言について明確なファクトチェックの必要性を提起した
- 本件はAI生成コンテンツにおける検証不足と、人間の検閲責任の問題を明らかにした事例として評価されている
1件のコメント
Hacker Newsの意見
コミット履歴が公開されているので、そのリーディングリストがAIの手を経たことは簡単に分かる
関連コミットへのリンク を参照
コミットメッセージは単に「stephenson」なので、なぜ変わったのかは不明
修正後のコミットへのリンク
LLMに対する自分の経験は、他の人たちほどポジティブではない
GoogleのGeminiプロモーションを例にすると、感謝祭の夕食準備のタイムラインを提示していたが、質問すると互いに矛盾する3つのバージョンを出してきた
単に「パンの上にタオルをかけて温かく保て」程度で済んだはずなのに、見当違いの答えばかり繰り返した
コード生成は6回中1回だけ成功、StackOverflow型の質問は6回中5回成功、一般的な質問はばらつきがある
失敗するときはあまりに深刻で、世界がこうした大規模LLM利用へ突き進んでいるのが怖く感じられる
しかも「AI Overview公開前日の株価」を聞いたら、それすら間違えた
コード本体より長く、変数宣言ばかり繰り返す意味不明のスパゲティだった。もう二度と使わない
A16Zを真面目に受け取るべきではないと思う。完全に詐欺師集団のようだ
ブログ記事を文の途中で終わらせていたら本当に見事だったと思う
彼の他の作品も人間の混沌とした内面を描いているが、結末や教訓はない
2000ページ以上読んでもなお結論は「おすすめしない」のまま
Neal Stephensonには「完結した文で終えてくれてありがとう」と伝えたい
彼の本はいつも早すぎるか遅すぎるかで終わる感じがあって、面白い設定にもかかわらずなかなか手が伸びない
Werner Herzogの自伝を思い出す
序文で「狙撃手の銃弾に当たって生が断たれるかもしれない」と述べ、本を突然終わらせる仕掛けとして使うと予告している
そして実際にそう終わるのだが、すぐ後に「これがまさに私が予告した結末だ」と付け加える、いかにもヘルツォーク風のひねりがある
大企業が年末のリーディングリストを出すのは、「私たちには感情と好みがあります」というPRメッセージのためだ
しかし今回の件で、それが単なる宣伝用の演出にすぎないことが明らかになった
「人生の意味は整数(integer)だった」という文で終わるのを見て、これは間違いなくAIが書いた文だと感じた
リスト全体がLLM特有の語り口で満ちている
出どころを考えれば驚くことでもない。実際、最初の仮説(LLM執筆説)の時点で話は終わっていたはずだ
Stephensonを「文の途中で終わらせるダダイスト作家」として風刺している
別の仮説として、単なる記憶違いの可能性もある
ずっと前に読んだStephensonの本の結末があっけなかったと記憶していて、別の本の「文の途中で終わる」と混同したのかもしれない