- AI音声アシスタントは技術とのインタラクションを革新的に変えるが、従来の音声アシスタントとの会話は機械的でぎこちなく感じられることがある
- 人間の会話における繊細で感情的な側面を理解し、適応することが難しい
- 完全にオープンな音声アシスタントがこのように実装されたらどうなるだろうか?
- リアルタイムでユーザーの要求に応答し、自然な声と共感、感情知能を備える
- 以前の会話の長期的な文脈を理解し、複数人の会話や中断、確認、考え込んで止まる場面にも対応する
- コンシューマー向けハードウェア上で完全にローカル動作する
BUD-E (Buddy for Understanding and Digital Empathy) の開発
- LAIONはELLIS Institute Tübingen、Collabora、Tübingen AI Centerと協力してBUD-Eを開発
- 低レイテンシの基本音声アシスタントの開発から始まり、2024年1月時点で300〜500msのレイテンシを達成
- より大きなモデルを使うことで、300ms未満の応答時間が可能になると期待される
BUD-E 開発ロードマップ
- 基本モデルとの会話でも、これまで見てきたものよりはるかに自然
- ただし、依然として解決すべき問題や開発すべき機能は多い
- レイテンシの削減とシステム要件の最小化
- 自然な会話と応答の自然さの向上
- 数日、数か月、数年にわたる会話の追跡
- 音声アシスタントの機能性と能力の向上
- マルチモーダルおよび感情的文脈の理解向上
- ユーザーインターフェース、継続的インテグレーション、容易なパッケージングのためのインフラ構築
- 多言語およびマルチスピーカーへの拡張
対話型人工知能の未来を築くための協力
- BUD-Eの開発は、さまざまなコミュニティの集団的な努力を必要とする継続的なプロセスである
- オープンソース開発者、研究者、熱意ある人々に対し、BUD-Eの個別モジュールを改善し、その成長に貢献するよう呼びかけている
- 自然で直感的かつ共感的な会話ができるAI音声アシスタントを、ともに作り上げることを目指している
まだコメントはありません。