大規模言語モデルの本質的限界: 幻覚は不可避
- 大規模言語モデル(LLMs)における幻覚現象は、広く知られた重大な欠点である。
- 多くの研究が幻覚の程度を減らそうと試みてきたが、その大半は経験的な方法にとどまり、幻覚を完全になくせるのかという根本的な問いには答えられていない。
- 本論文では問題を形式化し、LLMsにおいて幻覚を除去することは不可能であることを示す。
形式的世界における幻覚の定義
- 幻覚を、計算可能なLLMと計算可能な基準真理関数との不一致として定義する形式的世界を定義する。
- 学習理論で得られた結果を活用し、LLMsはすべての計算可能関数を学習できず、したがって常に幻覚を経験することを示す。
現実世界における幻覚の不可避性
- 形式的世界は、はるかに複雑な現実世界の一部にすぎないため、現実世界のLLMsでも幻覚は不可避である。
- 証明可能な時間計算量によって制約される現実世界のLLMsについて、幻覚が発生しやすいタスクを記述し、これを経験的に検証する。
幻覚緩和メカニズムと実用的含意
- 形式的世界のフレームワークを用いて、既存の幻覚緩和メカニズムの可能性と効果を論じる。
- LLMsの安全な展開に関する実用的含意を論じる。
GN⁺の見解
- この研究は、大規模言語モデルの中核的問題である「幻覚」現象に対する根本的な理解を提供する。
- 幻覚現象が不可避であるという理論的証明は、LLMsの設計と改善において新たな方向性を示しうる。
- 安全で信頼できるAIシステムを構築するための議論に重要な貢献をもたらし、これは技術発展における重要なマイルストーンとなりうる。
1件のコメント
Hacker Newsの意見
1つ目のコメントの要約:
2つ目のコメントの要約:
3つ目のコメントの要約:
4つ目のコメントの要約:
5つ目のコメントの要約:
6つ目のコメントの要約:
7つ目のコメントの要約:
8つ目のコメントの要約:
9つ目のコメントの要約:
10つ目のコメントの要約:
Aに対してのみ「はい」と答えるよう訓練する。A入力に対する正しい出力が「はい」であり、他のすべての入力に対する正しい出力が「いいえ」であると定義する。