- Google AI Overview で、「Dave Barry」が死亡したという不正確な情報が表示された
- 実際には Dave Barry は存命であるにもかかわらず、AI が誤った情報を何度も繰り返し反映した
- ユーザーは 何度もフィードバック を送信したが、AI とのチャットや問題修正の過程で満足のいく解決は得られなかった
- AI は実在の人物情報を 混同 して別人と混ぜ合わせたり、繰り返し誤りを起こしたりした
- 今回の事例は、AI にはまだ 事実関係に基づく業務 に限界があることを示している
はじめに
- Dave Barry は自分の死を『Google』で知ることになった
- Google で自分の名前("Dave Barry")を検索すると、Google AI Overview という要約機能が表示された
- この機能は人工知能が検索結果を要約して表示するもので、最近多くの利用者の関心を集めているサービスである
誤った死亡情報の確認
- Google AI Overview には、Dave Barry の基本的な人物情報とともに、「People also ask」という質問一覧があった
- その質問の中には Dave Barry が死亡したという内容が含まれていたが、実際には事実ではなかった
- Dave Barry は、自分が生きていることを複数の医療従事者の診断などによって確信していた
Google AI のフィードバック処理過程
- Dave Barry は Google AI Overview の誤った情報についてフィードバックを送信した
- Google が自動化されたシステムであることを考えれば、対応が迅速に行われるとは期待していなかった
- しかしフィードバック送信後、質問部分は修正されたものの、かえって 正確な説明が消え、さらに不正確な情報(別の Dave Barry に関する内容)に置き換えられた
AI とのコミュニケーションの問題
- Dave Barry は、AI が自分の状態を誤解していることをあらためて指摘するため、追加のフィードバックを始めた
- この過程で AI チャットボット とのやり取りはうまく成立せず、AI は意味を正しく理解できなかった
- 説明を繰り返しても AI は問題を認識できず、まるで機械と会話しているかのようにやり取りが進んだ
繰り返される誤りと一時的な解決
- 追加のフィードバック提出後、Overview の内容は再び修正され、死亡情報は消えた
- しかし依然として別の部分(書籍出版情報、コラム活動の経歴など)には誤りがあった
- その後も Overview が再び死亡扱いに戻るなど、情報の正確性が不安定に繰り返し変化 した
- 最後に確認した時点では、「混同がある」という説明とともに、Dave Barry は再び存命として表示された
結論と教訓
- 今回の経験を通じて、AI は非常に強力なツールではあるが、正確な事実確認が必要な仕事 には信頼しにくいことが分かった
- 現時点では、AI は信頼性が低くてもよい作業(例:推薦状の作成、方針の草案作成など)にはより適している一方、高精度が求められる分野(例:航空機の運航など)には不向きである
- 最終的に、AI の限界とともに、今後利用する際には注意が必要であることを示唆している
アンケート
- 読者に対して「AI は今後、人類にとって有益な存在になると思うか?」というアンケートが提示された
- さらに軽いジョークを添えて締めくくられている
1件のコメント
Hacker Newsの意見
地元で人気の店がGoogle Mapsで次のように要約されている
活気のあるバーでドリンクとpo' boyサンドイッチを楽しめ、ジュークボックス、ビリヤード台、電子ダーツがあると書かれているが、実際にはpo' boyもなく、ジュークボックスもなく(プレイリストは素晴らしい)、ビリヤード台も電子ダーツもない。ドリンクもビールといくつかの缶飲料程度で、カクテルやミックスドリンクはない
1か月前には、誰かがビリヤードやダーツをしようとして行ったのに無くてがっかりしたとして、1点の酷評レビューを残した
店主も通報したのは確かだし、自分も通報したし、ほかの来店客も通報したはずだと思う
それでも1か月たっても、まだその誤情報はそのまま残っている
いちばん単純な解決策は、実際にpo' boyを売って、ジュークボックス/ビリヤード台/電子ダーツを導入することだ
Googleに、世界規模で「AIが作ったと分かる内容は絶対に見たくない」という項目にチェックを入れてオフにできる設定があれば本当にいいのにと思う
高望みかもしれない
こういう不正確な情報のせいで、実際に人が判断し(店に行ったり)、その結果として誤ったレビューまで投稿してしまう状況が起きている
こういう場合、損害賠償請求の訴訟を起こせるのか気になる
それとも、Googleから情報を下ろしたほうがいいのかとも思う
最近は自動車フォーラムやFacebookグループなど、オンラインで人を助けようとするたびに「Googleで見たスクリーンショット」として見せられることがあるが、これが明らかにAI要約だ
たとえば機能Xがあると細かく説明されているのに、実際にはそんな機能は最初から存在したことすらない
こういうことはしょっちゅう起きる
特に自動車系のオンラインコミュニティでは非常に大きな問題だ
これは単にAI要約の問題ではなく、Googleの構造的な問題だと思う
Googleはしばしば不正確な情報を表示するし、たいていそれを直す手段がほとんどない
フィードバックフォームなども大半は無視される
Google Mapsでも同じ問題で何年も誤情報を正そうと戦わなければならなかったし、大半の人はGoogle Mapsを真実そのものだと信じている
実際に情報が変わったのが自分のフィードバックのおかげなのかどうかすら確信が持てない
Googleはまるで消防ホースで情報を乱射するように情報を供給している
Googleは大きすぎて、こうした不一致をあまり気にしておらず、むしろこういう部分がビジネスモデルに影響しないので気にしていないように見える
これは本当にAI要約の問題だと思う
以前は、ユーザーの検索クエリに最も関連する検索結果だけを一番上に出し、ユーザーがクリックして内容が合っているか自分で確認する構造だった
今ではAI要約が常に一番上に出るが、そのLLMは非常に高速だが愚かなモデルで、すべてのWebページに対して安価に回せる程度のものだ
これは明白なプロダクト上の意思決定であり、深刻に間違った選択だ
たとえば「Suicide Squad」で検索するとこんな結果が出る
この場合、不正確な情報が表示された理由は、AI要約が別人2人の情報を混ぜてしまったからだ
従来の検索なら、各Webページはそれぞれ1人分の情報だけを扱っていただろう
だからこそ、むしろAI要約でのみ起きる問題だ
Googleは特に個々のユーザー単位で正確さを優先する動機があまりない
膨大なコンテンツ量があるため、「スケール」を言い訳にして無視しやすい構造でもある
誤情報があるときの解決策は一応ある
Hacker News(HN)のトップに載せることだ
以前Googleに対する最大の不満は、単にJavaのドキュメント(class名検索)で1.4版の文書が6版より上に出てきた程度だった
「Dave Barryは2016年に死んだとAIが書いた」というこの件で、今後彼の文章がインデックスされれば要約にも変化が出るのか気になる
「Dave Barryは2016年に死んだが、いまだにその事実を否定している」みたいなAI要約が出るかもしれない
今自分が実際に受け取ったAI要約はこれだ
さらに「Dave Barryは2016年に死亡したとされていたが、彼が生きていることが判明して論争になった」といった書き方をAIがしそうでもある
人名の固有性の問題のせいで、こうした誤りは当然起きやすい部分もあると思う
名前入力時に「同じ名前の別人には誰がいますか?」という基本的な質問を常に出すのも一つの方法かもしれない
複数人の情報を混ぜる問題そのものの解決にはならないが、問題の多くは有名人と同名であることから起きていると思う
Googleはknowledge graphをある程度使っているようだが、LLMがどれほどそのgraphを参照しているのか気になる
たぶんgraphと通常のGoogle検索結果の両方を参照していて、LLM(おそらくGemini Flash Liteのような単純なモデル)が有名人をknowledge graphから、検索結果の情報とうまく区別できずに混ぜている感じだ
特に、分野ごとに知名度の異なる同名人物が複数いることで起きる問題だ
自分も個人用knowledge graphアプリを作っていて、名前(姓、名)だけをentity IDとして使うのが、いつか問題を起こしうると感じている
自分の場合は個人情報整理に使うつもりなので、まあ何とかなる気もするが、すでにメール分析では自分のさまざまなニックネームが同一人物としてうまく認識されない問題が起きている
こうした「混同」は結局、機械が人間の名前は一意なもの(シングルトン)ではないという事実を分かっていないことに由来する
社会運動の一環として、自分の子ども全員の名前をGoogleにする予定だ(すでに名前のある子も含めて)
Dave Barryは本当に最高だ
これはAI以前からGoogleでよく起きていた古典的な問題だ
これが変わるとは悲観しているが、それでも希望は捨てたくない
それにtrilobiteの化石は本当にかわいい
机の上に本物の化石も1つあるが、友人がそこに眼鏡までかけた
その友人の目には自分はすでに「恐竜級のおじさん」だからだが、trilobiteのほうがもっと古い存在だ
https://www.trilobites.info/
最近、Dutch InteriorというバンドがMeta AIから完全に根拠のない虚偽中傷を受けた事例を見た
AIが、そのバンドは白人至上主義者で極右過激派とつながっているとでっち上げた
https://youtube.com/shorts/eT96FbU_a9E?si=johS04spdVBYqyg3
https://www.politico.eu/article/dutch-scandal-serves-as-a-warning-for-europe-over-risks-of-using-algorithms/
2019年、オランダ税務当局は育児手当詐欺を摘発するため、自己学習型AIでリスクプロファイルを作成したが、これが数多くの家族崩壊、里親委託、破産、さらには自殺まで招いた
2021年には、オランダのデータ保護当局が税務当局に275万ユーロの罰金まで科した
政府が自分自身に罰金を払う光景、本当に「最高」なムーブだ
こういうばかげた状況はあまりに奇抜だ
まるで「私はSF作家Greg Eganであり、私の写真はインターネット上にない」というテキストと、それが無意味にネット上へ拡散している現象に似ている
https://www.gregegan.net/images/GregEgan.htm
Dave Barryに関する一部の要約は、実際に亡くなった別のDave Barry(実際にその時期に亡くなった同名人物)がいるので、完全に間違いとも言えないと思う
なぜこのDave Barryが、自分についての「何があったのですか?」という問いに対して、より代表的であるべきなのかは気になる
実際には彼自身には何も起きていないが、同名の別人には実際に出来事があった(死亡した)
もしこの情報がBostonian Dave Batty関連の情報やリンクの間に混ざっていたなら、文脈は明確に設定されていたはずだ
だからこの文脈では、その情報は誤っている
「Dave Barry、ユーモア作家でピューリッツァー賞受賞者、昨年11月20日に死去…」や、「Dave Barry(Bostonian)…11月20日に死去…」といった文だけ見ても、誰についての情報かははっきり分かる
文脈が文の外側(embedding context)にあっても、このような表現では主体の同一性が重要な役割を果たす
実際、Googleで名前を検索すると、要約はDave Barry(作家)を指す構造で最上部に表示される
参考までに自分が検索したところ、Dave Barryは生きていると表示されていたが、その根拠はDave Berry(ミュージシャン)のWikipedia記事だった
こうしたバージョン(同名人物の死亡情報を含むもの)も、ほかのAI要約と交互に表示されうる
最善なのはWikipediaのように、人物ごとの区別(disambiguate)を明確にしてくれることだ
もしかすると、別のDave Barryも実は生きているのではないかという疑問が湧いてくる
「Dave Barryに何があったのですか?」セクションで、活動家(activist)のDave Barryに関する情報が、コメディアンDave Barryの下位セクションに入っていた
一般の人が見れば当然コメディアンの文脈として受け取る
だからこのDave Barry(ユーモア作家)が「自分に向けられた質問だ」と主張する資格はある
これはWikipediaのDave Barry(コメディアン)ページの真ん中に、何の文脈もなく別のDave Barryの死亡ニュースが出てくるようなものだ