- 日本で1994年に発売されたセガジェネシス向け再発売ゲーム 「Phantasy Star Fukkokuban」 を検索していた際、実在しない AI生成の虚偽記事 を発見した事例を中心に、インターネット信頼の崩壊を論じた文章
- 検索結果の上位に表示されたサイトが、グラフィック向上・天候エフェクト など事実とまったく異なる内容を含む記事を掲載しており、これは 大規模言語モデル(LLM) が作り出した虚構だと判明
- 筆者はChatGPTに同じゲームの説明を求めた際にも、誤ったプラットフォーム・内容 を提示されるなど、訓練データ不足によるハルシネーション(hallucination) を直接確認
- こうした自動生成コンテンツは、SEO目的の広告サイト に大量流入し、情報検証なしに もっともらしい偽情報 を広める構造を強化している
- 結果としてインターネットの 共有知識基盤が損なわれ ており、信頼できる情報は LLM以前の時代に評判を築いたサイト に頼るしかない、という結論を示している
Phantasy Star Fukkokubanの事例
- 1994年に日本で発売された セガジェネシス向け「Phantasy Star Fukkokuban」 は、元のマスターシステム版ゲームをそのまま収録した再発売版である
- 一部のジェネシス本体ではマスターシステム用ゲームを実行できないため、そのカートリッジも動作しない
- 筆者はこのゲームの発売日を確認しようとして、検索結果上位で 虚偽情報を含むサイト を見つけた
- 問題のサイト「Press Start Gaming」は、グラフィック向上・天候エフェクト・昼夜変化 などに言及していたが、実際のゲームには存在しない
- 記事の最初の一文が「Game data not found」であったにもかかわらず、AIが生成したもっともらしい説明文 が続いていた
大規模言語モデルのハルシネーション問題
- LLMは 次のトークン予測 に基づいて動作し、訓練データにない希少な題材について もっともらしい虚構 を作り出す
- 「Phantasy Star」シリーズと「Fukkokuban(復刻版)」という語の意味を組み合わせ、存在しないリメイク版 を想像してしまった
- 筆者がChatGPTに同じゲームの説明を求めたところ、セガサターン向けコンピレーション と誤認する回答を受け取った
- 実際には「Phantasy Star Collection」という別のゲームと混同したものとみられる
- これと同様に、筆者が扱った別の希少ゲーム 「Mahjong Daireikai」 についても、日本語圏Web上に AIが生成した虚構の説明 が存在する
インターネット信頼の崩壊
- 「Press Start Gaming」サイトは、広告収益目的の自動化コンテンツプラットフォーム と推定される
- サイト下部には「©2025 Cloud Gears Media」という文言があるが、実在企業との関連は不明である
- こうしたサイトは 事実の伝達より検索露出(SEO) を優先する
- LLMの導入により、虚偽情報の生産コストが急減 し、検証のないコンテンツが大量拡散している
- 以前は低賃金ライターであっても最低限の事実確認はしていたが、今では AIが完全な虚構を生成 する
- 筆者は「もはや新しいサイトを信頼するのは難しい」として、AI以前に評判を築いた媒体にしか頼れなくなった と述べている
AI時代の情報生態系の毀損
- 筆者は「インターネットの共有知識(common)は、すでに 取り返しがつかないほど損なわれた 」と評価する
- 信頼できる情報源でさえ、AIコンテンツに汚染される危険 がある
- 例として、Ars Technica がAI生成の引用文を含む記事を掲載後、訂正と撤回 を行った事例に触れている
- LLMがより多くのデータを統合するようになれば、いずれ精度は向上するかもしれないが、現在の被害はすでに進行中 である
- 筆者は「これは単なる怒りの吐露(rant)だ」としつつ、インターネット信頼喪失の現実的な実感 を強調している
結論
- AIとSEO中心のコンテンツ生態系は、情報の真偽より生産効率 を優先する
- 結果として、事実確認のない自動生成記事 が検索上位に表示され、ユーザーの学習と探究の基盤 を損なっている
- 筆者は「インターネットはもはや信頼できない」という宣言で文章を締めくくり、デジタル知識の信頼回復が急務である ことを示唆している
1件のコメント
Hacker Newsの意見
友人たちと一緒に、自分たちの町にメッシュネットワークを構築中
オープンなインターネットはずっと前から下り坂だったが、LLMがその終焉を加速させている
90〜2000年代初頭のインターネットはもう死んだのだと受け入れた
これからは信頼できるローカルネットワークが代替になると思う
金儲けにしか興味のない人たちのせいで、閉じた空間に引きこもらざるを得ない現実が悲しい
核心はネットワークではなくコンテンツの質だ
信頼できる人だけを招待するフォーラムを作れば十分だ
うまくいくことを祈る
今はネットワーク対応のMP3プレーヤーを磨いているところで、まだ初期段階だが楽観している
プロジェクトリンク
最近オンラインに誤情報が以前よりはるかに多い理由は、予測市場(prediction markets)のせいかもしれないと思っている
金を賭けるために人々の認識そのものを歪める構造だ
2023年のLK99超伝導体騒動以降、こうした現象が急激に増えた
予測市場は情報を金で取引できるようにするが、意図的な虚偽情報を広めるほどの規模ではない
むしろ政治家やインフルエンサー、広告収益を狙う参加型の虚偽情報が主因だと思う
問題はインターネットの信頼崩壊だ
以前はたまに誤情報にだまされる程度だったが、今はボットが再生産したコンテンツであふれている
人間対ボットの比率はほぼ0に近い
結局、私たちはWebを焼き払ってしまったようなものだ
もう操っていた側の人間ですら何が起きているのかわかっていない気がする
だから今のモデルが、むしろ最も偏りの少ないバージョンとして残るかもしれない
HNをどう守れるか考えたが、結局招待ベースのシステム以外に答えはなさそうだ
最近はコメントが人間のものかどうかすら疑わしく、感情的に疲れる
AIを宗教のように信じる雰囲気で、ボットアカウントとAIでフィルタリングされたコメントが混在している
MastodonのようなFediverseはまだ健全だが、いつかあそこも汚染されるだろう
インターネットの信号対雑音比(SNR)は史上最低だ
解決策は人間認証されたデジタル署名しかないと思う
eIDASのような制度を通じて、匿名性を維持しつつ人間であることを証明できるべきだ
関連議論リンク
匿名性は維持しつつ、Sybil攻撃を防ぐ仕組みが必要だ
Intel i7-4790T関連の動画を探していて衝撃を受けた
最近の動画の大半は、LLMが生成したスクリプトを読むだけの「スロップ(slop)」コンテンツだった
製品は小売で販売されたことすらないのに、YouTubeチャンネルが1日に何十本も投稿し、Amazonアフィリエイトリンクで収益を狙っている
例の動画1 / 例の動画2
偽コンテンツ制作コストが0に近くなった今、スケーラブルな信頼メカニズムが必要だ
個人的にはWeb of Trust構造が魅力的に見える
一部は排除されるだろうが、仕方のないことだ
私はGeminiプロトコルベースの補助アーカイバを構築中だ
robots.txtで許可されたWebだけを記録する予定だ
個人だけでなく、サイト間でも信頼網を形成できる
地域コミュニティや趣味グループ単位で始め、徐々に拡張していく構造になり得る
最近Hollow Knightの新作情報を探していて、LLMが作った偽攻略サイトをいくつも見た
発売からまだ6か月しか経っておらず、実際の情報があまりないので、広告収益狙いなのだろう
こうしたニッチな話題ですら偽コンテンツを作るのが本当に採算に合うのか疑問だ
「でたらめ非対称性理論」が実地で機能しているわけだ
SEOの弱いWebサイトほど、かえって信頼できる
インターネットの未来は招待制コミュニティに向かう気がする
次世代のフォーラムが出てくるのか、それともPHPBB時代に戻るのか気になる
ゲーム化やスパムの標的にならないコンテンツだけが生き残れる
HNと似た雰囲気だが、招待制構造で運営されている