- もしスマホが私たちの話すことを常に録音してAIで処理したら、何が起こるのでしょうか? 私が先に試してみました
- 寝ている時以外、起きている間は常時録音(不適切な状況ではオフにすることもある)。PoCであり、まだ実運用は難しい
- 作ったきっかけはOpenAIのWhisperが公開されたこと
動作方式
- 2つのマイクで一日中話していることを録音し、一日の終わりにWhisperで処理してテキストに変換
- これを活用して、初歩的なレベルの"Ok Google"スタイルのデジタルアシスタントを作れることに気づいた
- 毎日抽出できる情報は2種類ある
- Active : 意識的にアシスタントへ指示するもの
- Passive : 自分が何かアクションする必要なく情報が抽出されるべき、それ以外のすべての情報
Active Functions
- 毎晩、非同期で処理されるべきものは
'KEYWORD COMMAND data END KEYWORD' 方式で話す
'Robert WEIGHT 60.1 end Robert' : Robertはアシスタントの名前で、endが終了キーワード
- "OK Google" を使わない理由 : 制限が多いこと、Googleに情報が渡るのが嫌なこと、話したらすぐ処理する同期方式だから
- もちろん非同期で処理されるため、その日の終わりまでは状況がわからないという欠点がある
結果を見る
- 体重計に乗ったあと
'Robert WEIGHT 62.8 end Robert'
- 寝て起きてからスリープトラッカー(Mi Band)を読む
'Robert SLEEP 7 hours 14 minutes end Robert'
- 電子機器がスマホと連携して情報は渡されるが、取り出す方法がないので、単なるAnalog APIのようにデジタルアシスタントを活用
- 食事のあと
'Robert LUNCH two toasts with a fried egg end Robert'
- ポッドキャストを聞いて
'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
- 給油して
'Robert SPENT 250,000 on fuel end Robert'
- 自分に向かって話すのは少し変な感じだが、スマホを持って何かをする必要がないという利点がある
ダッシュボード
- このように入力されたすべての情報を見るダッシュボードを作成
- My Journalを作って、その日に何をしたかを自動で記録
Passive Information - まだ作業中
- RELATIONSHIP THERMOMETER : 関係温度計
- SENTIMENT ANALYSIS : 感情分析
- TOTAL RECALL: 特定のトピックについて話した内容をすべて検索し、そのトピックについてある時点で自分が何を考えていたかを検索
暫定的な結論
- オーディオ + コンテキストが必要
- これによって得られる潜在力は、良い面でも悪い面でも非常に大きい
- 良い面 : 完璧な記憶、個人心理士/コーチ、自分の仮想クローン
- 悪い面 : 上のようなものが他人の手にあること
- ユートピアとディストピアの違いは、誰がその情報にアクセスできるかという点
3件のコメント
「ユートピアとディストピアの違いは、誰がその情報にアクセスできるかということだ」いい言葉ですね。
魅力的です。十分に現実化できそうです。
Vlog のように、時には模範的な日常を共有して分かち合うコンテンツも可能でしょう。
HNに著者本人が投稿してコメントも付けていますね https://news.ycombinator.com/item?id=33608437
使用したマイクのAliExpressリンクも含まれています(笑)
Whisper - OpenAIがオープンソースとして公開した多言語音声認識システム(ASR)