自分の話を24時間365日録音してAIで処理します。これが未来なのでしょうか？

xguru · 2022-11-17T10:04:02+09:00

もしスマホが私たちの話すことを常に録音してAIで処理したら、何が起こるのでしょうか？私が先に試してみました寝ている時以外、起きている間は常時録音（不適切な状況ではオフにすることもある）。PoCであり、まだ実運用は難しい作ったきっかけはOpenAIのWhisperが公開されたこと動作方式 2つのマイクで一日中話していることを録音し、一日の終わりにWhisperで処理してテキストに変換これを活用して、初歩的なレベルの"Ok Google"スタイルのデジタルアシスタントを作れることに気づいた毎日抽出できる情報は2種類ある Active : 意識的にアシスタントへ指示するもの Passive : 自分が何かアクションする必要なく情報が抽出されるべき、それ以外のすべての情報 Active Functions 毎晩、非同期で処理されるべきものは 'KEYWORD COMMAND data END KEYWORD' 方式で話す 'Robert WEIGHT 60.1 end Robert' : Robertはアシスタントの名前で、endが終了キーワード "OK Google" を使わない理由 : 制限が多いこと、Googleに情報が渡るのが嫌なこと、話したらすぐ処理する同期方式だからもちろん非同期で処理されるため、その日の終わりまでは状況がわからないという欠点がある結果を見る体重計に乗ったあと 'Robert WEIGHT 62.8 end Robert' 寝て起きてからスリープトラッカー（Mi Band）を読む 'Robert SLEEP 7 hours 14 minutes end Robert' 電子機器がスマホと連携して情報は渡されるが、取り出す方法がないので、単なるAnalog APIのようにデジタルアシスタントを活用食事のあと 'Robert LUNCH two toasts with a fried egg end Robert' 毎日食べたものについて外部APIでカロリー計算ポッドキャストを聞いて 'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert' メモやアイデアをすべて保存給油して 'Robert SPENT 250,000 on fuel end Robert' 毎日お金を使った内訳を保存自分に向かって話すのは少し変な感じだが、スマホを持って何かをする必要がないという利点があるダッシュボードこのように入力されたすべての情報を見るダッシュボードを作成 My Journalを作って、その日に何をしたかを自動で記録 Passive Information - まだ作業中 RELATIONSHIP THERMOMETER : 関係温度計 SENTIMENT ANALYSIS : 感情分析 TOTAL RECALL: 特定のトピックについて話した内容をすべて検索し、そのトピックについてある時点で自分が何を考えていたかを検索暫定的な結論オーディオ + コンテキストが必要これによって得られる潜在力は、良い面でも悪い面でも非常に大きい良い面 : 完璧な記憶、個人心理士／コーチ、自分の仮想クローン悪い面 : 上のようなものが他人の手にあることユートピアとディストピアの違いは、誰がその情報にアクセスできるかという点

(roberdam.com)

19 ポイント投稿者 xguru 2022-11-17 | 3件のコメント | WhatsAppで共有

もしスマホが私たちの話すことを常に録音してAIで処理したら、何が起こるのでしょうか？私が先に試してみました
寝ている時以外、起きている間は常時録音（不適切な状況ではオフにすることもある）。PoCであり、まだ実運用は難しい
作ったきっかけはOpenAIのWhisperが公開されたこと

動作方式

2つのマイクで一日中話していることを録音し、一日の終わりにWhisperで処理してテキストに変換
これを活用して、初歩的なレベルの"Ok Google"スタイルのデジタルアシスタントを作れることに気づいた
毎日抽出できる情報は2種類ある
- Active : 意識的にアシスタントへ指示するもの
- Passive : 自分が何かアクションする必要なく情報が抽出されるべき、それ以外のすべての情報

Active Functions

毎晩、非同期で処理されるべきものは 'KEYWORD COMMAND data END KEYWORD' 方式で話す
- 'Robert WEIGHT 60.1 end Robert' : Robertはアシスタントの名前で、endが終了キーワード
- "OK Google" を使わない理由 : 制限が多いこと、Googleに情報が渡るのが嫌なこと、話したらすぐ処理する同期方式だから
- もちろん非同期で処理されるため、その日の終わりまでは状況がわからないという欠点がある

結果を見る

体重計に乗ったあと 'Robert WEIGHT 62.8 end Robert'
寝て起きてからスリープトラッカー（Mi Band）を読む 'Robert SLEEP 7 hours 14 minutes end Robert'
- 電子機器がスマホと連携して情報は渡されるが、取り出す方法がないので、単なるAnalog APIのようにデジタルアシスタントを活用
食事のあと 'Robert LUNCH two toasts with a fried egg end Robert'
- 毎日食べたものについて外部APIでカロリー計算
ポッドキャストを聞いて 'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
- メモやアイデアをすべて保存
給油して 'Robert SPENT 250,000 on fuel end Robert'
- 毎日お金を使った内訳を保存
自分に向かって話すのは少し変な感じだが、スマホを持って何かをする必要がないという利点がある

ダッシュボード

このように入力されたすべての情報を見るダッシュボードを作成
My Journalを作って、その日に何をしたかを自動で記録

Passive Information - まだ作業中

RELATIONSHIP THERMOMETER : 関係温度計
SENTIMENT ANALYSIS : 感情分析
TOTAL RECALL: 特定のトピックについて話した内容をすべて検索し、そのトピックについてある時点で自分が何を考えていたかを検索

暫定的な結論

オーディオ + コンテキストが必要
これによって得られる潜在力は、良い面でも悪い面でも非常に大きい
- 良い面 : 完璧な記憶、個人心理士／コーチ、自分の仮想クローン
- 悪い面 : 上のようなものが他人の手にあること
ユートピアとディストピアの違いは、誰がその情報にアクセスできるかという点

3件のコメント

budlebee 2022-11-17

「ユートピアとディストピアの違いは、誰がその情報にアクセスできるかということだ」いい言葉ですね。

nicewook 2022-11-17

魅力的です。十分に現実化できそうです。
Vlog のように、時には模範的な日常を共有して分かち合うコンテンツも可能でしょう。

xguru 2022-11-17

HNに著者本人が投稿してコメントも付けていますね https://news.ycombinator.com/item?id=33608437
使用したマイクのAliExpressリンクも含まれています（笑）

Whisper - OpenAIがオープンソースとして公開した多言語音声認識システム（ASR）