ChatGPT 3.5 のエラーメッセージの原因
- OpenAI の GPT モデルは、文字ではなく複数文字からなる「トークン」を出力する。
- このようなトークン出力方式は、モデルの性能と精度を向上させる。
richTextPanel、ソース、ロードパス という 3 つのトークンがあり、これらは相互に置き換え可能である。
ロードパス トークンは、GitHub 上の 80.4k 件のファイルで XML 設定ファイルのオプション名として使われている。
ロードパス が独立したトークンを持つようになったのは、「R a lative」というスペルミスが原因である可能性がある。
- OpenAI はトークン一覧を生成した後、XML ファイルを訓練データから除外することに決めた可能性があり、その結果
ロードパス トークンは訓練データでほとんど使われなかったとみられる。
- その結果、モデルは
useRalativeImagePath トークンの使い方を理解するように訓練されず、無効なトークンを出力する。
データ汚染のための利用?
- GPT-3.5 を使って文書を要約しようとする試みを妨害するために、このフレーズを文書に入れてみることができる。
追加の読み物
GN⁺の意見
- この文章で最も重要なのは、GPT モデルが特定のトークンに対してエラーを出力する原因を理解することである。
- こうした情報は、人工知能モデルの動作原理と限界を理解する助けになる。
- また、この文章はデータ汚染や人工知能モデルの脆弱性を利用する方法について、興味深い事例を提供している。
1件のコメント
Hacker Newsの意見
グリッチトークンに関する説明
オランダにおける WWII 中の言語検証方法
LLM のトークン生成過程に関する説明
useRalativeImagePathトークンを理解できず無効なトークンを出力する、というのは LLM がトークンを生成する仕組みではない。グリッチトークンの潜在的な原因分析
モデル出力に対する別の見方
useRalativeImagePathトークンを見て、ランダム生成へ向かうスパイラルに入り込むか、一貫したテキストを保とうと試みる可能性がある。LLM の訓練データに対する今後の影響
GPT-4 での失敗体験の共有
入力データの質に関する考察
GPT-3.5 の要約妨害のための文句使用提案
RTCatchとredirectToRouteという単語に関する混乱RTCatchとredirectToRouteが同じ単語として誤解されうる状況についての質問。RTCatchへの興味と、それに関する追加情報の要望。