LLMs Will Always Hallucinate, and We Need to Live With This
序論
- 大規模言語モデル(LLM)がさまざまな分野で広く使われるにつれ、その固有の限界を批判的に検討することが重要である
- 本研究は、言語モデルのハルシネーションが単なる誤りではなく、こうしたシステムに不可避の特徴であると主張する
ハルシネーションの本質
- ハルシネーションは、LLMの根本的な数学的・論理的構造に由来する
- アーキテクチャの改善、データセットの向上、ファクトチェック機構によってこれを取り除くことは不可能である
- 計算理論とゲーデルの第一不完全性定理に基づき、停止問題、空白問題、受理問題のような問題の決定不能性を参照する
LLMプロセスのあらゆる段階で生じるハルシネーション
- 学習データの収集、事実検索、意図分類、テキスト生成のすべての段階でハルシネーションが発生する確率がある
- 構造的ハルシネーションという概念を導入し、こうしたシステムの本質的な特性として位置づける
結論
- ハルシネーションの数学的確実性を確立することで、これを完全に緩和できるという従来の考え方に異議を唱える
GN⁺の要約
- この研究は、LLMのハルシネーションが必然であることを数学的に証明し、完全には除去できないことを強調する
- 計算理論とゲーデルの不完全性定理を通じて、ハルシネーションの本質を説明する
- LLMのあらゆる段階でハルシネーションが発生しうることを示す
- この研究は、LLMの限界を理解し、それを受け入れることが重要であることを示唆する
1件のコメント
Hacker Newsの意見
数学的確実性によってハルシネーションを証明することで、ハルシネーションは完全に解決できるという従来の考え方に異議を唱えている
ハルシネーションは、質問に対する最初の可能な回答を述べる結果である
現在のアーキテクチャには根本的に「ハルシネーション」が内在しており、実用的な利用を制限している
LLMのハルシネーションは、知識を表現する方法と関係している
不完全な学習データは測定する価値がない
LLMは「エキスパートシステム」のようなものになっていくだろう
LLMと効果的に協働するには、本質的に信頼できず非決定論的な技術を使いこなす能力が必要である
いまこそバブルが弾ける時だ
私たちはLLMを「受け入れる」必要はない
この論文は拙い書き方で、意味のある数学理論が構築されたとはあまり思えない