心を読む技術の新たなブレークスルー
- シドニー工科大学の GrapheneX-UTS Human-centric Artificial Intelligence Centre の研究チームが、「心を読む」技術に関する新たなブレークスルーを発表。
- この研究は、思考を画面に表示された単語へ変換することに成功し、生の EEG 波形を直接言語へ翻訳する先駆的な試みとして評価されている。
- 脳波をテキストへ翻訳する過程で離散符号化手法を導入し、大規模言語モデルとの統合によって神経科学と AI 分野に新たな展望を開いたという。
脳波を利用した言語翻訳技術
- 参加者がテキストを黙読している間、DeWave という AI モデルが、彼らの脳波のみを入力として用い、画面に単語を投影。
- この技術は、脳インプラントや大型 MRI 装置へのアクセスなしに、脳信号を言語へ翻訳できる唯一の技術。
- 追加入力、たとえば視線追跡ソフトウェアを必要とした従来技術と比べ、この新技術はそうした追加機能なしでも利用できる。
実用性と利便性
- ユーザーは EEG を通じて脳活動を記録する帽子を装着するだけでよく、視線追跡装置や MRI 装置よりはるかに実用的で便利。
- 研究チームは、信号がインプラントから得られる情報よりややノイズが多いことを認めつつも、試験では技術がかなり良好に機能したと明らかにした。
- BLEU アルゴリズムを用いた精度測定では、この技術は約 0.4 のスコアを記録した。
精度改善の可能性
- モデルは動詞の一致にはより優れている一方、名詞では「作家」の代わりに「男」のような同義語ペアを好む傾向がある。
- 研究チームは、脳がこれらの単語を処理する際、意味的に類似した単語が似た脳波パターンを生み出す可能性があると考えている。
- 研究チームは、精度を 0.9 まで向上させられると見ており、これは従来の言語翻訳プログラムに近い水準。
- 研究チームは 29 人の参加者を対象に実験を実施しており、これは他のデコーディング技術の試験よりはるかに多い数値。
GN⁺の見解
- この技術は、脳波を通じて人の思考を直接言語へ翻訳する驚くべき進歩を示している。
- 脳インプラントや複雑な装置なしに EEG キャップだけで使えるというアクセスのしやすさは、この技術を非常に革新的なものにしている。
- 将来的には、この技術はコミュニケーション障害を持つ人々に大きな助けとなり得るほか、人間と機械の相互作用を新たな次元へ引き上げる可能性を持つ。
1件のコメント
Hacker Newsの意見
脳コンピューターインターフェース(BCI)の研究は、主に麻痺患者がコミュニケーション能力を回復できるようにすることに焦点を当てている。
脳信号を言語に翻訳できる技術はこれが初めてではないが、脳インプラントや大型MRI装置へのアクセスを必要としない唯一の技術である。
この技術は自己省察にも役立つ可能性がある。
DARPAの「Silent Talk」プロジェクトは14年前に始まり、神経信号の分析によって戦闘中に口頭での意思疎通なしにユーザー同士のコミュニケーションを可能にすることを目標としていた。
この技術は脳卒中患者に役立つ可能性があるが、フィルタリングされていない思考を出力してしまう可能性もあり、問題になりうる。
EEGを使って思考を予測するのは、ムンバイの雲を見てオースティンの雲を予測しようとするようなものだ。個々のニューロンの電気信号は大規模な振動の中に埋もれ、さらに脳と装置の間にある骨、筋肉、組織の層によっていっそうぼやける。ビットレートは毎秒1ビットで、ほとんどの用途にはまったく不十分である。
このモデルの基本バージョンにはコード上のバグがあり、ベンチマーク結果が水増しされていたため、現在問題を調査中である。
非言語的な思考でも機能するのか気になる。たとえば、日常活動に関連する信号のデータセットに基づいて、犬の思考や夢を解読できるかもしれない。
あらゆる恐ろしい含意を脇に置くとしても、この技術は非常にクールなことを可能にする。すなわち、双方向の精神的コミュニケーションだ。