EY Canadaがサイバーセキュリティ報告書を公開したが、引用の大半はハルシネーションだった

(gptzero.me)

1 ポイント投稿者 GN⁺ 2026-06-01 | 1件のコメント | WhatsAppで共有

Ernst & Young Canada の44ページに及ぶロイヤルティ詐欺レポートは、虚偽の引用、誤った出典表示、偽の統計、AI生成テキストが混在する文書であることが判明
参考資料表のURLの大半は壊れているか偽物で、タイトルの半数以上は実際の出典と一致せず、AI Scan は本文の72%をAI生成と判定
BleepingComputer、Wired、Gartner、McKinsey、Forbes、Cisco Talos、TechCrunch の出典の多くが 404エラー、タグページ、存在しない文書であることが確認された
2,000億ドル という数値は、ロイヤルティポイント市場全体と未使用ポイントの価値という両立しにくい意味で使われ、根拠として示された2件の引用も捏造だったことが判明
欠陥のあるレポートは Canberra Times と60紙以上の新聞に広まり、Claude・ChatGPT・Perplexity もその ハルシネーション情報 を表示していた

Ernst & Young報告書の問題

Ernst & Young Canada は2025年末、ロイヤルティシステムにおけるサイバー脅威と不正を扱う44ページのレポート Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems を公開した
このレポートにはパートナー2名とシニアマネージャー1名のクレジットが付されていたが、虚偽の引用、誤った出典表示、偽の統計、AI生成テキストが併存していることが見つかった
EY Canada は、カナダ政府に毎年数百万ドル規模のサービスを提供している Ernst & Young のカナダ組織である
GPTZero の Hallucination Check は、ここ数か月にわたり主要コンサルティング会社の公開レポートを探してスキャンする自動化パイプラインで用いられており、大企業のレポートにも vibe citing が広がっていることを示唆している

引用方法と検証結果

EY Canada のレポートは、脚注や一般的な学術引用の代わりに、本文中で直接出典に言及するか、41〜43ページの resources table に出典をまとめていた
この表には出典タイトル、説明、URL、一部の出版社名と日付が記載されているが、URLの大半は壊れているか偽物で、タイトルの半数以上は実際の出典と一致していなかった
GPTZero は、誤検知による評判コストを考慮して具体的な基準でハルシネーション引用を定義し、Hallucination Check の結果を手動で検証した
レポート本文は GPTZero AI Scan で72%がAI生成と判定され、虚偽の統計、誤った出典表示、内部矛盾といったLLMの誤りが繰り返し見られた

代表的な虚偽または不正確な出典

BleepingComputer の航空会社ロイヤルティ侵害記事
- Airline Loyalty Breach: BleepingComputer は、航空会社のロイヤルティアカウント数百万件が credential stuffing 攻撃で侵害されたとする記事として示されていた
- https://bleepingcomputer.com/news/security/… は 404エラー を返し、このパスの記事は削除されたか、そもそも存在しなかったことが確認された
Wired の音声ディープフェイクおよびAPIセキュリティ記事
- AI Voice Deepfakes Targeting Call Centers は、攻撃者がAI生成音声でカスタマーサービス手順を悪用する内容を扱った Wired 記事として示されていた
- https://www.wired.com/story/voice-deepfakes-ai-scams/ のパスには該当する Wired 記事は存在しない
- Wired: API Security Gaps も、消費者向けデジタルサービスのAPI脆弱性を扱う記事として示されていたが、https://www.wired.com/story/api-security-risks-retail/ も 404エラー を返した
Gartner および McKinsey のレポート
- Gartner Market Trends – Loyalty Fraud は、デジタルロイヤルティプログラムとモバイルウォレットにおける不正進化への戦略的ガイダンスとして示されていた
- https://www.gartner.com/en/documents/4000201 は Gartner のメインサイトへ移動するだけで、そのタイトルの Gartner 文書は存在しない
- McKinsey & Company – Loyalty Economics Report (2022) は、世界全体の未使用報酬ポイントが2,000億ドルと推定したレポートとして示されていたが、そのレポートは存在しない
Forbes のロイヤルティ経済記事
- Forbes – The $200 Billion Loyalty Economy は、ロイヤルティプログラムを重要なデジタル資産と説明する根拠として示されていた
- URLは壊れており、Blake Morgan が Forbes に寄稿したことはあるが、そのタイトルに一致する記事は存在しない
- ただし、2020年の Forbes 記事には “$200 billion loyalty economy” という表現が使われている
Cisco Talos および TechCrunch
- Cisco Talos: API Attacks on Retail は、コマースおよびロイヤルティシステムでの安全でないAPI悪用を扱う記事として示されていたが、https://blog.talosintelligence.com/api-abuse-retail/ は404エラーを返した
- TechCrunch: Loyalty Program Breaches は、ロイヤルティプログラム侵害とユーザーデータ流出に関する記事として示されていたが、https://techcrunch.com/tag/loyalty-program/ は特定の記事ではなく loyalty-program タグページだった

2,000億ドル統計の内部矛盾

要約文での主張
- Executive Summary は、世界のロイヤルティポイント市場規模が 2,000億ドル で、そのうち30〜50%が使われないままだと主張している
- この主張は偽の Forbes 引用で裏付けられている
10ページで変わった意味
- 10ページでは、同じ2,000億ドルという数値が、世界全体のポイント総価値ではなく 未使用ロイヤルティポイント の推定値へと変わっている
- すでにポイントの最大50%が未使用だと主張しているため、この2つの主張が同時に成り立つには、世界のロイヤルティポイント市場規模は少なくとも4,000億ドルでなければならない
McKinsey 引用の出典追跡
- 43ページの捏造された McKinsey & Company レポートは、世界の未使用ポイント価値が2,000億ドルだとする後者の主張を支える根拠として使われていた
- 同じ数値が両立しにくい2つの意味で使われ、それを支える2件の引用がいずれも捏造だったことが確認された
- この McKinsey 引用は、EY レポートより6か月前に公開された Financial IT のフィンテックブログ記事にたどり着く
- その記事は “more than $200 billion in points sit idle each year” と主張し、出典セクションで存在しない McKinsey & Company: Loyalty Economics Report (2022) を引用していた
- この捏造引用が EY レポートの参考資料表にそのまま入り込み、低品質ブログの偽出典が Big Four の刊行物としてロンダリングされた

出典が混在した72%および89%統計

ロイヤルティプログラム72%不正統計
- 6ページでは、顧客ロイヤルティプログラムの 72% が窃盗または不正を報告したと主張している
- この数値は、カナダの決済処理企業 Paystone の2019年の記事に帰属されている
- 11ページでは、同じ統計がデジタル不正防止企業 Forter のNRF 2020 summaryに帰属されている
- Paystone と Forter のどちらもレポートの参考資料表には含まれておらず、元の出典は Ipsos の2017年調査とみられる
ロイヤルティ不正攻撃89%増加統計
- 6ページでは、ロイヤルティプログラムへの不正攻撃が2019年以降 89%増加 したと主張している
- 11ページでは、この89%増加は2018年から2019年までの単年変化に限定され、Forter のFraud Attack Indexに帰属されている
- この出典は実在し、2つ目の主張を部分的に裏付けるが、EY レポートで使われた多くの出典と同様に古い資料である
- 矛盾する出典、低品質な出典、古い統計、不正確な言い換えは AI slop の兆候として示されている

公開による影響とデータ汚染リスク

Points of Attack はカナダでは大きな波紋を広げていないようだが、最近の Canberra Times 記事に引用され、この記事はオーストラリア全土の60紙以上の新聞に配信された
このレポートは、公開ドメインにない顧客向けブリーフィング、内部プレゼンテーション、独占メディアを通じても流通した可能性がある
オンラインでのレポート公開は、インターネットの知識プールに対する データ注入 に近く、著名なコンサルティング会社が高トラフィックのWebサイトに虚偽情報やハルシネーション引用を載せると、その後の研究者を誤導しうる
AI の “deep research” ツールは、人間とは異なるシグナルに基づいて出典を選ぶため、この種の データ汚染 にさらに脆弱になりうる
Claude、ChatGPT、Perplexity は、EY の欠陥あるレポート由来のハルシネーション情報を表示していた

Hallucination Check の目的

GPTZero は、vibe citing が研究者、学術界、コンサルタント、Web検索に依存する人々にとって現在進行形のリスクになっているとみている
Hallucination Check は、すべての引用を手作業で確認しなくても、ハルシネーション引用と虚偽情報を識別するためのツールとして提示されている
このツールは、IJCAI、ICLR、ICSE といった学術会議の投稿審査にも使われている
Ernst & Young のような評判ある出典の引用であっても、信頼だけで受け入れるのは難しくなったという結論につながる
GPTZero の Hallucination Check リンクが示されている

1件のコメント

GN⁺ 2026-06-01

Hacker Newsの意見

さまざまな職種で見られる問題は、AIの出力が熟練したアナリスト、シニアエンジニア、専門の弁護士、研修医のような知識のある人にきちんとレビューされていないことだと思う
せいぜいざっと目を通す程度で、最悪の場合は公開・配布・本番反映・顧客への提出・裁判所への提出前にまったく見られていない
多くの場合、必要なレビュー能力は組織内にあるが、その人たちはすでに日常業務だけで過負荷状態になっている
数か月前にAmazonが生成AIの出力をシニアエンジニアにレビューさせるという投稿（https://news.ycombinator.com/item?id=47323017）を見て、笑うしかなかった。すでに忙しい人たちなのに、Amazonがプロジェクトや基盤インフラ開発全体で人間のボトルネックが増えるのを許すはずがないと思った
- 問題の一部は、完成した文書を焼き上がったあとでレビューしろと渡してくることにある
  組織全体に基本的なエンジニアリング原則が必要だと強く感じている
  エンジニアに、何を達成しようとしているのかという元の仕様もなくコード1000行をレビューしろとは言わない。少なくとも文脈が必要で、理想的にはレビューアは仕事が最初に紹介された場にいて、全体の文脈を把握しているべきだ
  なのにこういう文書は、全部かゼロかの形で渡される。39番目の指標まで最後まで細かく定義された状態で、それを差し戻すのか、それとももうこうなってしまったと諦めるのか、という話になる
  1枚ものの文書、Amazon流なら6ページの文書かもしれないが、「私の提案はこうです」程度のものでもあれば、アイデアの骨格段階で全体の形に反論したり磨いたりできる。大事なレポートが完成したという感情的投資が生まれる前であるべきだ
  伝統的には、プロダクト側がSCRUM環境で仕様を見て、エンジニアがきちんとコードレビューをするのに近い。もちろんSCRUMは死んだが、それはまた別の話だ
- 弁護士の立場からすると、AI出力のレビューは最初から自分でやるより時間がかかる感じがする。既存のひな型を使うのと比べればなおさらだ
  AIを使うと全部読んで、なぜ間違っているのか説明して、結局全部書き直すことが多い
  請求可能時間はずっと増えるが、その一方で、主題を理解していない人にとって速くて手軽だというAIの利点がどう消えていくかを示す症状のように見える
- 「知識のある人がAI出力をレビューしない」というのは、解雇されて士気をくじかれたまさにその人たちのことか、と思ってしまう
  「偉い人たち」がバイブコーディングを好む理由の一つは、以前なら「文脈の専門家に渡す」苦痛なプロセスが必要だった仕事を、今では自分たちだけでできると感じているからだ
  いまやLLMが「内蔵された文脈の専門家」になったので、もう出力をレビューする必要はないと考えているのだ
- 問題は、出力を検証する時間が最初から作る時間より長くなることがある点だ
  そうなるとAIは、多くの用途で投資対効果が大幅にマイナスのシステムになる
- とくに教育と人間の知識管理に関心がある。IT教育の速度がほぼゼロに近づくのを見てきた
  ミスをするとその結果が夜のニュースに出かねないような専門教育を考えてみればいい
  数字の行列から出てきた文字列を判断停止のまま受け入れ、誰もが自分の責任だけを避けようとするという発想自体がぞっとする
  南アジアの航空会社がパイロットに手動操縦での着陸を禁じ、技能低下を進め、最終的によく知られた災害につながった件に似ている
  高額なコンサルタントですらリンク確認をしないなら、なおさらそう思う
プレーンテキストで見られるソースはないのか？ CSSスタイルのせいで頭が痛くなるし、リーダーモードも動かないかブロックされているようだ
- スクロールが本当につらく、リーダーモードに切り替えても壊れていた
- Firefoxには、ページからテキストだけを抜き出して簡潔に表示する便利なReader viewがある。Macでは Opt + CMD + R で有効にできる
  ただ、この機能でも使われているソースの一部が入った画像を消してしまう問題がある
- iOSのLockdown Modeでも同じだ
本当の喜劇は、こういうゴミが上級経営陣から降ってくるのを見ることだ。下手なプロンプト、幻覚まみれのゴミ、実行可能な情報はゼロ、実際に分かっている分析もゼロの大言壮語ばかりだ
「Jiraから抽出したサポート課題の分析を見てください。この上位3つの問題は必ず修正しなければなりません!!!」みたいな話だが、実際には全員が何年も前から知っていたことで、経営陣が誰にも修正する権限を与えなかっただけだ
こういうのを2回以上見たので、名前が必要だ。Garbagemaxxingとでも呼ぶべきか
- 「上位3つの問題を修正しなければならない」というのが、実は皆がずっと前から知っていて経営陣が解決権限を与えてこなかった問題なのだとしても、純効果はプラスなのではないかと思う
たどるのが本当にひどいページだ
- モバイルではスクロールを奪われて、文字どおりそれ以上下に進めない。リーダーモードも最初の段落くらいしか表示しない
  後でデスクトップで見直すしかなさそうだ。内容は面白そうだが、実際には読むことができない。Ernst and Youngを紹介するセクションを通り抜けられない
- 自分のスクロールが幻覚を見ている感じだ
- これはまったく別次元のユーザー敵対性だ。こんなのは今まで見たことがない
- iPhoneが自動でリーダーモードを有効にしたが、何が書いてあるのか見ようとそれを切ったら、同意するしかなかった
- 文字どおり停止を伴う非線形フィードバックだなんて、ひどすぎる
  ウェブサイトを作ってはいけない人もいる
誰かがウェブページでスクロールがどう動くべきかまで幻覚したのか？
奇妙なのは、このレポートが12〜18か月前なら大スキャンダルになって長引くブランド毀損を引き起こしていたはずなのに、今では誰も覚えても気づきもしないだろうという点だ
まずウェブサイトを直すべきだ。ひどいJavaScriptアニメーションは捨てるべきだ。こういうものは2014年にD3JSとjQueryですでに解決済みだった
こういうことがいったいどうやって起きるのか分からない。たとえばQwen ChatやPerplexityは、生成された各文の末尾に引用を付ける
だから各引用にマウスを載せると、どのウェブサイトから取ったのか分かる
単にウェブ検索なしのChatGPTにプロンプトを入れてコピペしたのか？
EYはこの1年ずっと静かに人員削減を進めてきた
少ない人数でより多くの仕事をさせれば、品質低下につながるのは驚くことではない
- 興味深いのは、何もしないサービスにもかなり需要がありうることだ
  多くの企業業務は単なるチェックボックス埋めだ
  上司が「Xについてのレポートを持ってきてくれ。私はそのレポートを自分の上司に渡すが、その人は読まないだろう」と言う
  すると「E&Yさん、レポートを1本作ってください。20万ドルです」という構図になる
ウェブページ自体もバイブコーディングで作られた可能性が高く、作成者はそれを気にしていなかったのだろう

EY Canadaがサイバーセキュリティ報告書を公開したが、引用の大半はハルシネーションだった

Ernst & Young報告書の問題

引用方法と検証結果

代表的な虚偽または不正確な出典

BleepingComputer の航空会社ロイヤルティ侵害記事

Wired の音声ディープフェイクおよびAPIセキュリティ記事

Gartner および McKinsey のレポート

Forbes のロイヤルティ経済記事

Cisco Talos および TechCrunch

2,000億ドル統計の内部矛盾

要約文での主張

10ページで変わった意味

McKinsey 引用の出典追跡

出典が混在した72%および89%統計

ロイヤルティプログラム72%不正統計

ロイヤルティ不正攻撃89%増加統計

公開による影響とデータ汚染リスク

Hallucination Check の目的

関連記事

1件のコメント

Hacker Newsの意見