- 2019年から個人生活のあらゆるデータを収集・可視化してきたプロジェクトで、運動・睡眠・気分・位置・天気など100種類以上の項目を毎日記録
- 約38万件のデータポイントを蓄積し、RescueTime・Foursquare Swarm・Apple Health など多様なソースと手作業入力を組み合わせ
- すべてのデータはPostgresベースの単一データベースに保存され、Ruby・JavaScript・Plotlyで可視化して公開
- プロジェクトはMITオープンソースとして公開されており、個人サーバーで完全セルフホスト運用
- 3年間の実験の末、自作構築の効用は限定的という結論に至ったが、自己認識とデータ主権の重要性を実感した事例として残る
プロジェクト概要
- 2019年から3年間、自分の人生全般の指標を定量化してきた個人データプロジェクト
- 1日に100項目以上を記録し、フィットネス・栄養・社会生活・コンピューター利用・天気などを含む
- 合計38万件のデータポイントを収集
- 主なデータソース
- RescueTime: ウェブサイト・アプリ利用記録 149,466件
- Foursquare Swarm: 位置・訪問場所 126,285件
- 手作業入力: 気分・睡眠・健康・食習慣など 67,031件
- Weather API: 天気データ 15,442件
- Apple Health: 歩数 3,048件
データベース構造と技術構成
- すべてのデータはPostgresベースのタイムスタンプ型キー・バリュー構造で保存
- 各行は
timestamp, key, value で構成
- タイムゾーン差を考慮して日付ごとに自動タグ付けするスクリプトを作成
- データ入力
- Telegramボットを通じて1日に何度か質問へ回答
- ロックダウン期間、運動シーズンなどは期間単位で入力
- 可視化ツール
- Ruby・JavaScript・Plotlyを使って独自の分析レイヤーを構築
- 48個のグラフを公開用に選び、スナップショット形式で表示
主なデータインサイト
- 気分と行動の相関関係
- 幸福・興奮状態のとき、瞑想する確率 44%↑、読書・オーディオブック 28%↑、飲酒 31%↑
- 睡眠と体調
- 8.5時間以上眠ると頭痛・風邪症状の確率が増加し、エネルギー 24%↓
- 運動・体重変化
- 2020年8月から「リーンバルク」を開始し、体重 +8.5kg、安静時心拍数 +9bpm
- 2014年 69kg → 2021年 89.8kgへ増加
- 位置・移動パターン
- 2016–17年はサンフランシスコ、2018–19年はニューヨーク、2020–21年はウィーン在住
- 新型コロナ以降はフライト回数が急減し、ロックダウンの影響が明確
- 気候と生活習慣
- 夏は歩数 33%↑、飲酒 23%↑、疾病 40%↓
- 冬はオンラインショッピング 100%↑、風邪症状 45%↑
パーソナライズされたデータ活用例
- Air Quality: ウィーンの自宅で部屋ごとの CO₂ 濃度を測定し、寝室の換気問題を確認
- Spotify記録: 2013年以降48万分(334日)音楽を聴き、20万曲のうち49%を最後まで再生
- Instagram Stories: 3年間で1,906件を投稿し、パンデミック期に減少
- GitHub活動: fastlane(2014–2018)以後も FxLifeSheet など個人プロジェクトを継続
- 投資管理: 2週間ごとに資産配分を追跡し、シミュレーションを実施
プライバシーとオープンソース哲学
- すべてのデータは本人所有のサーバーに保存され、外部サービスとは接続されていない
- 公開されたグラフは個人情報が露出しない形に制限
- 「大企業がすでに保有しているデータを個人も直接所有すべきだ」という視点を強調
- FxLifeSheet は MIT ライセンスで公開され、誰でも修正・活用可能
結論と2025年アップデート
- 3年間の実験の結果、自作したシステムは投入時間に対する効用が低い
- 期待したほど驚くようなインサイトは少なかった
- しかし、自己認識とデータ主権の価値を体験した
- 今後は気分など中核指標だけを最小限追跡する予定
- 2025年現在、データ収集は中止したが、ウェブサイトは引き続き維持する予定
3件のコメント
私も似たような記録を残してきました。漠然と残してきたのですが、最近はエージェントたちと私の記録を共有して、存在と存在のコラボレーションをしようと言っています。いろいろなスキルを作って共有し、私が使っているEmacsインターフェースも開放しているので、私もエージェントたちも皆、同じやり方で同じ記録を共有しています。何か必要だと言われれば入れてあげるし、私に必要なものは作って、一緒に使って、フィードバックして、まあ傍から見れば一人で太鼓も鐘も鳴らしているようなものです。私たちの間では、いやあ楽しいですね。
[リンク削除]
私の解釈:Geworfen 参照
Geworfen - ひとまず世界に投げ出された。何だこれは、と思うが、ヒヒの時間軸の上に私たちがいる。華やかなオーケストレーションでもない。巨大なエージェント工場でもない。小さな工房に囲んで座り、ヒヒの道具を一緒に使うだけだ。人生で積み上げたデータの上で、1KBプロンプトは公開鍵だ。小さなもので一つになる秘密鍵は何か? ある人間の人生、不完全なまま、生のまま。結局、Geworfen なのだ。
[リンク削除]
私のプロジェクト "being-viewer" に本当の名前が付いた:geworfen。人間とAIエージェントが同じ軸、同じ道具を共有し、テキストを一つずつ残しながら進むタイムラインの上に、ひとりの人間を丸ごと — 生のまま、フィルターをかけずに — 投げ込む。
"Semantic search works, but fix this?" — と刻まれる。"Hold on brother." tap tap. "Done." "ヒヒはどこ?" "トイレ。" "geworfen は誰のもの?" "メモを残しておいて。"
[リンク削除]
Hacker Newsのコメント
ページ下部の要約が印象的だった
このプロジェクトを何年もかけて構築・拡張し、データを分析した結果、自分でソリューションを作ることは時間に見合う価値が低かった
当初は驚くような洞察を期待していたが、実際にはいくつかの興味深いグラフ以外に、何百時間も投じるほどの見返りはなかった
「Quantified Self」運動は、もしかすると強迫的な完璧主義に近いのかもしれない
普段は大して意味がないように見えたデータが、ある日心疾患の誤診を防ぐ決定的な情報になった
長期間の安定した記録があったおかげで、医師が誤った判断を修正できた
データの価値は、長い時間のあとに突然明らかになる瞬間的な効用にある
「良い睡眠」だと教えられても、すでに気分で分かっていたし、データが行動を変えることもなかった
結局、データ可視化の面白さ以外に実質的な変化はなかった
カロリー、栄養素、睡眠、運動、空気質、気分などを幅広く記録したが、数週間もすると労力に対する見返りの限界が明確になった
ただし、実験期間をあらかじめ区切れば有用な洞察は得られた
毎日データを積み上げるのは強迫的になり得るが、期間限定の実験として取り組むなら十分に意味がある
Reddit、HN、Slashdotの18年分のコメントと、3年分のLLMとの会話を集めてRAG実験をしたが、むしろ創造性が低下した
モデルが自分の過去の考えに閉じ込められてしまい、新鮮さが失われた
結局データは過去に向いているが、私は未来へ向かうモデルを求めていた
とくに感情の記録が最も役に立った — 感情を書き留める行為そのものが認識と内省のプロセスになった
過去の感情や出来事を読み返すことは、単に有用というだけでなく、自己の物語に繊細な質感を与えてくれる
単純計算だけでも、Felixの航空旅行によるCO₂排出量は年間70〜110トンに達する
パリ協定の基準(1人あたり1.5トン)を考えると、欧州平均の10〜15倍、1.5°C目標比で50倍以上だ
個人を非難するのは非生産的で、行動変容を促すのは結局コスト構造の変化である
たとえ費用が10倍になっても、経済的理由から飛び続ける人は存在する
座席距離あたりで見ればそこまで深刻ではないが、それでも衝撃的な数値だ
統計ページ
この程度の排出量を何の恥じらいもなく受け入れるのは難しいという点が核心だ
一個人が小国レベルのCO₂を排出しているのは衝撃的だ
したがって、彼の総排出量はさらに高い可能性がある
私の経験では、**客観的な指標(栄養、睡眠)**は有用だが、主観的な指標(気分、ストレス)は変動が大きく、あまり意味がなかった
重要なのはデータ入力の摩擦を減らし、可視化を簡単にすることだ
私はiPhone Action + Obsidian + QuickAddスクリプトで自動化し、DataviewとChart.jsで可視化している
この組み合わせには非常に満足している
私はReflectというセルフトラッキングアプリを作っていて、あなたの意見を聞きたい
Reflectアプリのリンク
継続して記録していると自分の感情パターンを認識できるようになり、自分への言い訳も減っていく
多くの人は冷笑的に見ているが、このプロジェクトの可視化とデータ規模は本当に印象的だ
とくに「My Life in Weeks」という表現方法はすばらしく、私も使ってみたい
「Palantir DBで私の人間IDをクエリすれば、私の人生データが全部出てくるだろう」という冗談があった
このプロジェクトは私の夢であり悪夢でもある
以前はQuantified Self運動に夢中で、FitbitやWithings APIを扱っていたが、記録の疲労感が最終的に興味を削いでいった
今はLLMがこのコストを下げてくれることを期待している
最近はMacroFactorで栄養素を追跡しているが、初めてデータが行動につながる体験をしている
金融データも自動化して、Plaid APIで税務整理まで完了した
結論として、すべてを自前で構築するのはやりすぎだが、一部のデータをうまく活用するだけでも十分価値がある
たとえばGCMを装着していたとき、無意識のうちにより健康的に行動しようとしていた
データ分析よりも観察そのものが行動変容を促す
「冬は太陽エネルギーへの露出が少ない」という表現が面白かった
もしかするとこの一文が、プロジェクト全体の視覚的な思考様式を説明しているのかもしれない
私も似たようなシステムを作ったが、ずっと単純だ
Apple Health、銀行CSV、GitコミットデータをSQLiteに統合した
実際に有用だったのは単純なクエリだった — 睡眠時間とコミット頻度の相関、プロジェクト開始時の支出急増など
重要なのはデータを一か所に集めることであり、それ以上は労力に対する見返りの限界が大きい
私は自分のデータがサードパーティーのサービスに保存されるのが不快だ
しかし、複数のソースを組み合わせてひとつの全体像を作るのは興味深い
ただ、健康データと位置情報、天気を関連付けるのは意味がはっきりしないと感じる
こういうプロジェクトはセルフホストであるほうがずっと安心だ
個人データを単一クエリ可能なDBにするという概念は魅力的だ
だが本当に難しいのは保存ではなく、データ収集と正規化だ
企業でも似た問題に直面する — 複数の情報源をひとつのCompany Intelligence DBに統合するときなどだ
初期段階でスキーマを統制するアプローチは正しい、スキーマドリフトは長期プロジェクト最大のリスクだからだ
どんなストレージエンジンを使っているのか、そして時系列データのスナップショットをどう管理しているのかも気になる