- 祖母の家で見つかった1,351枚の家族写真を整理し、記憶を構造化するためにMediaWikiベースの個人Wikiを構築
- Wiki形式で写真・人物・出来事をつなぎ、家族史と個人史を記事の形で再構成
- その後、Google Photos、位置履歴、金融取引、音楽認識データなどさまざまなデジタルの痕跡を統合し、Claude Codeと言語モデルで自動ページ生成を実験
- この過程でモデルが記憶の空白を復元し、会話・旅行・友情の流れをデータに基づく物語として再編
- 最終的にwhoami.wikiオープンソースプロジェクトへと発展し、個人が自分のデータを百科事典のように探索し所有できる仕組みを提示
個人百科事典プロジェクトの始まり
- パンデミック後初めて祖母の家を訪れ、1,351枚の古い写真を発見して整理を始めた
- 写真には祖父母の若い頃から自分の中学生時代までが含まれていた
- 初期の分類はフィルムの種類や写真の比率など物理的属性を基準に進めた
- 写真を整理する中で記憶の断片的な物語がよみがえったが、順序や文脈は不明確だった
- EXIFメタデータがない時代の写真のため、時系列の把握が難しかった
- 祖母と一緒に写真を並べ替えながら、結婚式当時の記憶を口述で記録した
- 人物名や出来事をメモし、一部は若い頃の親族だと確認できた
- 記録を整理してMediaWikiをローカルで実行し、実際のWikipedia形式で編集した
- インフォボックス、本文、写真キャプション、人物リンクなどを含む構造化ページを作成
- 関連する法改正、儀式、場所などは実際のWikipediaページに接続した
Wikiソフトウェアによる記憶の再構成
- わずか2日で写真の歴史的背景を完成した記事の形に整理した
- Wikiソフトウェアが知識とメディアを保存する強力な道具であることを実感した
- その後数か月かけて、家族写真全体へとWikiページを拡張した
- r/genealogyコミュニティの助言を受けて口述史の記録方法を改善
- 音声文字起こしと言語モデルを活用して編集効率を高めた
- Wiki形式のおかげで出来事と人物のつながりを簡単に把握できた
- たとえば、祖父母の結婚式で歌っていた歌手が、自分を取り上げた看護師でもあったことを発見した
デジタルデータと言語モデルの結合
- その後、Google Photosのデジタル写真へと拡張した
- EXIFメタデータにより日付、時刻、位置情報を活用できた
- 2012年の家族旅行写真625枚を対象に、Claude CodeへWikiページ生成を依頼した
- ImageMagickで作成したコンタクトシートを参考に画像を探索
- モデルは視覚情報とタイムスタンプだけで場所と活動を再構成した
- 交通手段、訪問先、人物識別などの詳細な描写も含まれていた
- 作成された下書きに自分の逸話リストを追加して物語を完成させた
複合データ統合の実験
- 2022年のメキシコシティ旅行データを対象に拡張した
- 291枚の写真、343本の動画、Google Mapsの位置履歴、Uberの移動、銀行取引、Shazamの記録を統合
- Claude Codeが行った主な作業
- 銀行取引と位置データを照合し、訪れたレストランを確認
- チケット決済履歴からサッカーの試合のチーム名と大会名を特定
- Uberの移動記録から移動時間と場所を把握
- Shazamの記録から場所ごとの音楽ジャンルを記述
- 夕食中のギター演奏シーンを動画フレームから見つけてページに挿入
- MediaWikiの議論ページ、カテゴリ、編集履歴機能をそのまま活用
- 新しいデータが追加されるたびに実際のWiki編集者のように編集履歴が蓄積された
個人データの百科事典化
- 時間がたつにつれ、モデルが記憶の空白を埋める役割へと変化した
- モデルが複数のデータソースを照合し、忘れていた事実を復元した
- Facebook、Instagram、WhatsAppのアーカイブにある約10万件のメッセージと音声ノートを分析
- 友人たちとの会話から友情の流れと人生の出来事を抽出してページ化
- 友人たちはそのページを読み、すべてを読みふけるほど没入した
- この過程を通じて、単なる家族史プロジェクトではなく**個人百科事典(personal encyclopedia)**の構築へと発展した
- データに基づく構造的かつ相互接続された自己記録システムが完成
whoami.wikiプロジェクト公開
- こうした経験をもとに、whoami.wiki をオープンソースとして公開
- MediaWikiベースで、個人データからWikiページを自動生成
- ユーザーは自分のデータエクスポートを提供し、言語モデルが下書きを作成
- ローカル実行、データ所有権の維持、モデル独立性の保証
- 個人の結婚式、友人、旅行などあらゆるテーマを公共Wikiと同じ形式で記録できる
- 完成したページを探索する体験は初期のFacebookタイムラインを思わせる楽しさを提供する
- 技術より重要なのは人と記憶の再発見
- 祖母の人生を記録しながら強さと回復力を新たに認識した
- 友人たちとの関係を振り返り、感謝とつながりの感覚を取り戻した
- プロジェクトはまだ初期段階で、誰でもインストール文書を通じて直接始められる
- データはユーザーの所有のまま残り、どのモデルでも読める構造
- 協力者からのフィードバックを受けて継続的に改善中
1件のコメント
Hacker Newsの意見
このプロジェクトは本当に素晴らしく、家族の歴史を保存する興味深い方法だと思った
ただ、AIが関わる部分では感情的に複雑な気持ちにもなった
職人の手仕事が工場に押し流されていくようなほろ苦さがあり、同時にAIが銀行明細、チケット、音楽の記録まで横断分析する様子には少しディストピア的なものも感じた
それでも全体としては非常に印象的な試みだった
私も最初はすべての編集を自分で行い、歴史家のように資料をつないでいた
その後エージェント実験を始めてから作業速度はずっと上がったが、それでも何を残し何を消すか考える「Wiki寄稿者」のような時間を過ごしていた
同時に、こうした経験を通じて個人データ保護の重要性を痛感した。私たちはデジタルの痕跡を残しすぎている
Steve Jobsの言う「心の自転車」のように、技術が人間の仕事を助ける道具として機能していた
久しぶりに、技術が人間的な創作を支える姿を見て昔のときめきを思い出した
LLMが情報を整理するのは道徳的に問題ないが、大企業のモデルが個人の物語を代わりに語るのは居心地が悪い
書き手は面白い部分を、AIは退屈なデータの接続を担当していて、こういう役割分担が理想的だと思う
私と妻は毎年新年に50枚ほどの紙を綴じて小さなノートを作る
くたびれた布で製本し、旅先のマッチ箱のような思い出の品で飾る
1年間で学んだこと、けんかと仲直り、料理のレシピ、考えたことなどを書き留め、その年の記録物として残している
AIツールではなく手書きにする理由は、その過程自体が意味があり楽しい儀式だからだ
子どもたちがあとで読むことを思うと、なおさら美しく感じられる
昔の使い込まれたレシピ本のように、絵の具が飛んだ跡のある本のほうが魅力的だ
私も実際の印刷された本としてこういう作業を始めた
何千枚もの写真をScribusで編集して、年ごとに本を作っている
死んだあとも自分の痕跡が物理的に残るのがいい
前のページにSDカードを貼り付けて、動画も一緒に残す予定だ
さらに中古のCanon Selphyプリンターを手に入れて家で写真を印刷している。色味は完璧ではないが、壁に飾ると満足感がある
360度ステープラーは素早い製本に最高だ
18歳になったら読めるようにするデジタル遺産プロジェクトだ
関連記事はこちら
私は家系図研究が好きだ。10世代前(約250年前)までアルゼンチンに来た祖先をたどった
ヨーロッパ側は戦争や文書の散逸で難しいことが多い
最近は家族の年長者たちから音声メッセージで昔話を受け取り、整理している
父が作った家系図と一緒にWiki形式でまとめると良さそうだ
毎年、妻が私たちの共有アカウントの写真を選んで50ページの本にまとめている
これまで12年分の年次記録ができ、手でめくれる思い出になっている
彼女はこの作業を他の人のためにもやっていて、個人的なタッチのおかげでとても好評だ
プロジェクト自体は素晴らしいが、LLM APIを使うときはプライバシーが重要だ
私は米国企業のモデルに自分の写真を預けたくない
家族インタビューとLLMワークフローの組み合わせは本当に良い活用例だ
ただ、Google Mapsの位置履歴、Uber、銀行取引、Shazamまで出すのは一線を越えた感じがする
最近は「データは自分のデバイス内にある」というAIプロジェクトが多いが、実際にはデータの移動経路が不明瞭だ
ユーザーはそのトレードオフを十分理解していないように思う
「デフォルトで非公開」だとしても、実際にはAI企業のサーバーにデータがアップロードされる
ローカルLLMがサポートされていないなら、プライバシーに関する文言はもっと明確であるべきだ
Google Maps、Uber、銀行、ShazamのデータをAIに渡したという部分で不快感を覚えた
プロジェクト自体は素晴らしいが、最も機密性の高いデータをサービスに預けるのは危険だ
いつか漏えいする可能性は常にある
家族の物語を残すことには関心があるが、自己分析には関心がない
アイデアは良いが、どこまで共有するかが問題だ
一人で見るなら何でも記録できるが、家族と一緒に見るならセンシティブな話が出てくる
家族の暗い過去や対立まで記録するのはプライバシー侵害になり得る
戦争、刑務所、相続問題などはそれぞれ異なる記憶と感情を抱えている
こうしたものをAIがつなぎ合わせると、客観性の幻想だけが残り、家族間の傷を再び開くことにもなりかねない
結局、記憶は自然に忘れられていくライフサイクルを持つのが健全だと思う
技術に没頭した人たちは、こうした人間的な複雑さをしばしば見落とす