6 ポイント 投稿者 GN⁺ 2024-01-12 | 1件のコメント | WhatsAppで共有

インターネットは今や機械同士が会話する空間

  • インターネットは、人々が互いに質問し回答するというシンプルな使われ方から、いまやAIが生み出した誤情報であふれる空間へと変化している。
  • Googleユーザーは、Googleが「卵は溶ける」と誤って案内していることを発見した。これは、Googleがウェブサイトを直接表示する代わりに、ページのスナップショットをドロップダウンメニューで提供し、ユーザーがクリックしなくても検索結果を読めるようにした結果である。
  • 最近ではGoogle検索の無用さが増しており、たとえば慢性副鼻腔炎を検索すると、炎症を起こした陰茎に関する結果が返ってくる事例もある。

インターネットトラフィックの「強奪」とSports IllustratedのAI記事騒動

  • 昨日、あるTwitterユーザーがインターネットトラフィックの「強奪」を主張した。彼は競合ウェブサイトのサイトインデックスを見て記事URLを抽出し、その後AIを使って素早く記事を書いた。
  • また、Sports IllustratedがAIで書かれた記事を掲載し、実在しない人物の名前で記事を公開していたことも明らかになった。これについて問い合わせがあった後、該当コンテンツは削除された。

インターネットの根本的な破壊

  • インターネットはもはや人と人とのコミュニケーションの場ではなく、機械同士が会話する空間へと変質している。
  • 「Googleに聞け」という言葉は、いまや無意味になりつつある。誤情報や完全な作り話を返してくる可能性が高まっているためだ。
  • Sports Illustratedのような企業は、読者にサービスを提供することよりも、Google検索結果での露出や広告収益を高めることにより強い関心を向けている。

GN⁺の見解

  • インターネット上の情報の質はますます低下しており、これはユーザーに混乱と不便をもたらしている。
  • AI技術の発展がもたらした副作用のひとつとして、AIが生成した誤情報のせいで信頼できる情報を見つけにくくなっている。
  • こうした変化は、ユーザーがインターネットで情報を得る方法を改めて考えさせるものであり、情報の質を保証するための新たなアプローチが必要であることを示している。

1件のコメント

 
GN⁺ 2024-01-12
Hacker Newsの意見
  • 大規模言語モデル(Large Language Models, LLMs)の普及によって生じた問題の1つは、以前はスペルや文法の誤りを手がかりに価値のない投稿を素早くふるい落とせる有用なヒューリスティックがあったのに、今ではAI生成コンテンツは言語運用能力が完璧で、その方法がもはや通用しないこと。たとえば、curlプロジェクトではAI生成の偽のバグレポートによる問題があった。この問題は今後さらに深刻になると予想される。

  • インターネットの変化には同意しつつも、GPT-4、3、2以前と比べてインターネットはそれほど大きく変わっていないと考える意見もある。インターンやインドのバーチャルアシスタントが書いたありふれた話題の記事の多くは、たいていAI生成コンテンツと同じくらいひどく、見分けもつきにくい。検索エンジンがWebページのテキストとクエリの一致度よりも評判を基準に並べ替える傾向も問題だ。人々は今やWebよりアプリの中で生活しており、Webの質は長い間悪化してきたが、やがて重要ではなくなるだろう。もし今後もインターネットが存在するなら、新しい匿名化されたレイヤーへ移行し、低品質なコンテンツ生成を減らすために貨幣のやり取りを頻繁に求める方向へ発展してほしい、という考えもある。

  • クリアネットの現状が深刻である一方、情報がDiscordの内部に隔離されているのも悪くないように見える、という意見もある。検索エンジンにインデックスされないことで、AIゴミと一緒に表示されたり、学習データとして使われたりするのを避けられる。インターネットの未来は人間にかかっており、機械はもはや基本的な作業すら信頼できなくなっている。

  • BeamMPプロジェクトでのAI生成の偽バグレポートやPRs(プルリクエスト)の経験が共有されている。こうしたAI生成物は簡単に見分けられ、関連するコードを変更したり、コンパイルできない解決策を提示したりするといった特徴がある。本物の人間は怠け者なので不要な作業はせず、AI生成のゴミは時間の無駄なのでマージしない。

  • インターネットで真正性を保つことが重要だ。署名されたコンテンツだけが真正性を保証できる。AIがより多くを投稿できる状況では、誰が何を投稿したのか、彼らが何を言っているのかを把握できる信頼と真正性に依存することが、フィルタリングの唯一の方法だ。Web of Trust(信頼の網)は試みられたが主流にはならず、再び試す時期かもしれない。

  • LLMが加速させた古い問題だという意見もある。Googleが広告収益と広告技術の支配力を高めようとする中で、検索結果ではSEOがはびこり、そのせいで客観的な情報を得にくくなっている。まずRedditで情報を検索するのが解決策になり得るが、Redditもここ数年で操作されたコンテンツにあふれている。

  • インターネットはすでにSEOのせいで人間生成のゴミであふれていたのだから、「AI」の登場で実際にはそれほど多くを失ったわけではない、という意見もある。この問題を業界で長年指摘してきた人たちもいる。

  • 広告は結局のところ金を稼ぐためのものであり、ボットがクレジットカードを持っていない限り、それは人間からの金を意味する。Googleのような企業は、トラフィックが増えてもそれが人間の支出に転換されないなら、その影響を財務的に感じるはずだ。最近相次ぐ技術分野の大規模レイオフは、この問題への対応が始まっていることを示しているのかもしれない。

  • 『Anathem』という本を読んだことがあるなら、私たちの任務はReticulumからゴミをふるい落とすことだ、という意見もある。