1 ポイント 投稿者 GN⁺ 2023-12-18 | 1件のコメント | WhatsAppで共有

心を読む技術の新たなブレークスルー

  • シドニー工科大学の GrapheneX-UTS Human-centric Artificial Intelligence Centre の研究チームが、「心を読む」技術に関する新たなブレークスルーを発表。
  • この研究は、思考を画面に表示された単語へ変換することに成功し、生の EEG 波形を直接言語へ翻訳する先駆的な試みとして評価されている。
  • 脳波をテキストへ翻訳する過程で離散符号化手法を導入し、大規模言語モデルとの統合によって神経科学と AI 分野に新たな展望を開いたという。

脳波を利用した言語翻訳技術

  • 参加者がテキストを黙読している間、DeWave という AI モデルが、彼らの脳波のみを入力として用い、画面に単語を投影。
  • この技術は、脳インプラントや大型 MRI 装置へのアクセスなしに、脳信号を言語へ翻訳できる唯一の技術。
  • 追加入力、たとえば視線追跡ソフトウェアを必要とした従来技術と比べ、この新技術はそうした追加機能なしでも利用できる。

実用性と利便性

  • ユーザーは EEG を通じて脳活動を記録する帽子を装着するだけでよく、視線追跡装置や MRI 装置よりはるかに実用的で便利。
  • 研究チームは、信号がインプラントから得られる情報よりややノイズが多いことを認めつつも、試験では技術がかなり良好に機能したと明らかにした。
  • BLEU アルゴリズムを用いた精度測定では、この技術は約 0.4 のスコアを記録した。

精度改善の可能性

  • モデルは動詞の一致にはより優れている一方、名詞では「作家」の代わりに「男」のような同義語ペアを好む傾向がある。
  • 研究チームは、脳がこれらの単語を処理する際、意味的に類似した単語が似た脳波パターンを生み出す可能性があると考えている。
  • 研究チームは、精度を 0.9 まで向上させられると見ており、これは従来の言語翻訳プログラムに近い水準。
  • 研究チームは 29 人の参加者を対象に実験を実施しており、これは他のデコーディング技術の試験よりはるかに多い数値。

GN⁺の見解

  • この技術は、脳波を通じて人の思考を直接言語へ翻訳する驚くべき進歩を示している。
  • 脳インプラントや複雑な装置なしに EEG キャップだけで使えるというアクセスのしやすさは、この技術を非常に革新的なものにしている。
  • 将来的には、この技術はコミュニケーション障害を持つ人々に大きな助けとなり得るほか、人間と機械の相互作用を新たな次元へ引き上げる可能性を持つ。

1件のコメント

 
GN⁺ 2023-12-18
Hacker Newsの意見
  • 脳コンピューターインターフェース(BCI)の研究は、主に麻痺患者がコミュニケーション能力を回復できるようにすることに焦点を当てている。

    • EEGは、頭蓋骨の外側で脳の電場が弱まるという物理的な限界のため、十分な信号対雑音比を提供できず、良好な通信速度を支えられない。
    • 商用の「読心術」おもちゃは、実際には頭や目の筋肉の信号に基づいて動作している。
    • 埋め込み電極はより良い信号を提供するが、商業的に実用化されるまでには何度もの改善が必要である。数か月が経つと、脳が電極の周囲に瘢痕組織を形成するため信号は劣化し、脳手術には明らかにリスクがある。
    • 人間を対象とした試験には政府の承認が必要なため、反復サイクルは非常に遅い。
    • 麻痺した友人を助けたいなら、目しか動かせない場合は視線追跡技術に注力するだろう。
  • 脳信号を言語に翻訳できる技術はこれが初めてではないが、脳インプラントや大型MRI装置へのアクセスを必要としない唯一の技術である。

    • センサー技術が十分に向上して、帽子をかぶる必要すらなくなったとき、人々が公共の場で思考を読まれることについて合理的な期待を持つべきではないと言われる時代が来るのだろうかと思う。
  • この技術は自己省察にも役立つ可能性がある。

    • 自分の思考パターンを外部から分析できるため、教育手法の効果を見つけたり、集中力が最も高い時間と低い時間を客観的に把握したり、不安な思考が始まる時点とその原因を正確に知ることができる。
    • fMRIを脳スキャン型の嘘発見器として使うこともできるが、その正当性には多くの疑問がある。
  • DARPAの「Silent Talk」プロジェクトは14年前に始まり、神経信号の分析によって戦闘中に口頭での意思疎通なしにユーザー同士のコミュニケーションを可能にすることを目標としていた。

  • この技術は脳卒中患者に役立つ可能性があるが、フィルタリングされていない思考を出力してしまう可能性もあり、問題になりうる。

  • EEGを使って思考を予測するのは、ムンバイの雲を見てオースティンの雲を予測しようとするようなものだ。個々のニューロンの電気信号は大規模な振動の中に埋もれ、さらに脳と装置の間にある骨、筋肉、組織の層によっていっそうぼやける。ビットレートは毎秒1ビットで、ほとんどの用途にはまったく不十分である。

  • このモデルの基本バージョンにはコード上のバグがあり、ベンチマーク結果が水増しされていたため、現在問題を調査中である。

  • 非言語的な思考でも機能するのか気になる。たとえば、日常活動に関連する信号のデータセットに基づいて、犬の思考や夢を解読できるかもしれない。

  • あらゆる恐ろしい含意を脇に置くとしても、この技術は非常にクールなことを可能にする。すなわち、双方向の精神的コミュニケーションだ。

    • メッセージを思い浮かべて「送信」を思えば、イヤホンを通して返答を聞ける。音声クローン技術を使えば、送信者の声でメッセージを受け取ることもできる。外部の観察者には完全に静かで見えない。