- Webの創始者 ティム・バーナーズ=リー が提唱した ユーザー中心のデータ保存 という概念が現実化しつつある
- 彼の初期構想である Solidプロトコル は、個人がデータを直接所有し、アプリケーションはユーザーの許可を得てアクセスする構造を目指している
- 最近では BlueskyのATプロトコル も同じ方向へ発展し、個人サーバー(PDS)にデータを保存する 分散型ソーシャルWeb を実装しつつある
- このような個人データ保存は、技術的実装を超えて、データ協同組合(Data Coop) の形で市民が所有し運営する構造へと拡張している
- 結局これは Webを再び個人の空間へ取り戻す動き であり、プラットフォーム依存のインターネット構造を根本から再構成しようとする試みと見ることができる
ティム・バーナーズ=リーのビジョン: Socially Aware Cloud Storage
- 2009年にバーナーズ=リーが提案した 「Socially Aware Cloud Storage」 は、アプリケーションが 独立した保存レイヤーの上で動作 するよう設計されたWeb仕様である
- ユーザーはURIベースのグローバル識別子で管理され、アクセス制御が標準化された形で行われる
- データ保存所はアプリケーションから分離され、汎用的で置き換え可能な資源 として定義される
Solidプロトコルの登場と発展
- 2015年、ティム・バーナーズ=リーは Solidプロトコル の開発資金を確保し、MITで研究を進めた
- Solidの目標は、データ所有権をユーザーに取り戻し、アプリ間の自由な乗り換えを可能にする Webアーキテクチャ を構築すること
- ユーザーはデータを1か所で管理し、アプリはユーザーの許可のもとでデータを要求しなければならない
- Solidは正式な W3C Web仕様 へと発展したが、まだ 大衆的採用 には至っていない
- バーナーズ=リーが共同設立した Inrupt は、企業市場を中心に事業化を進めている
ATプロトコルと個人データサーバー(PDS)
- Bluesky チームが開発した ATプロトコル(Atproto) は、現在3,000万人以上が利用するオープンなソーシャルネットワークである
- Solidとは技術的構造は異なるが、ユーザー主権のデータ保存 という哲学は同じである
- ATプロトコルでは、個人のデータは Personal Data Server(PDS) に保存され、これはSolidの「Pod」概念に似ている
- ユーザーは自分のドメインを インターネットハンドル として使い、ソーシャルネットワーク間で独立したアイデンティティを維持できる
- 例:
@alice.com のように個人ドメインをハンドルとして使う構造
データ協同組合(Data Co-op)の台頭
- 大多数の一般ユーザーは依然として個人PCより クラウドベースの機関型ストレージ を好む
- 既存の銀行の信用組合モデルのように、会員が共同所有するデータバンク 構造への転換が議論されている
- これは クレジットユニオン(Credit Union) モデルをデータに適用したもので、会員中心の透明な運営が核心である
- 実際に
social.coop, data.coop, cosocial.ca のような協同組合型データプラットフォームがFediverseエコシステムで活発に運営されている
- 新しいプロジェクト Northsky もATネットワーク基盤の共同データ機関として準備中である
- このような組織は法的に協同組合である必要はなく、民主的で透明なデータ管理 を行うあらゆる形態を含む
データ主権の新しいパラダイム
- データが企業ではなく 市民が統制する機関 に保存される場合、データ所有 をめぐる議論の焦点が移る
- 「私たちはどんなデータをダウンロードできるのか」ではなく、「プラットフォームは私たちのサーバーからどんなデータをコピーできるのか」へと変わる
- SolidとATのあいだの技術的交流も拡大しており、ActivityPub のような標準との相互運用性の議論も活発である
- 個人データ保存 はいまや特定のプロトコルを超えた概念へと広がっており、データ形式は 変換可能で、プロトコルは相互に置き換え可能 である
- 核心は、個人が自分のデータを統制することで、プラットフォーム崩壊時にも自分のデジタルアイデンティティを復元できる自由 を確保することにある
結論: Webを再び個人の空間へ
- 個人データ保存は技術ではなく インターネット哲学への回帰 である
- プラットフォーム中心のWebから離れ、個人とコミュニティが データを直接所有し運営する 構造へ移行しつつある
- Solid、AT、ActivityPubのさまざまな試みはすべて同じ目標へ収束している — Webを再び個人のものに取り戻すこと
参考リンク
1件のコメント
Hacker News の意見
私は Blobcache という FOSS プロジェクトに参加している
https://github.com/blobcache/blobcache
サーバーがアプリケーションの状態を保存することと、サーバーがそれに対する変更権限やデータ読み取り権限を持つことは、まったく別の話だと思う
将来は、サーバーは単に私のデータを安全に保管する役割だけを担い、クライアントがより賢くなる方向に進むべきだと考えている
アプリを使うとき、E2E(エンドツーエンド)で暗号化された状態をサーバーから受け取り、それを変更して、新しい暗号化データをサーバーに再保存する構造を望んでいる
サーバーはデータの耐久性だけに責任を持つべきで、本当にその役割をきちんと果たしているかどうかまで信頼する必要はない
Blobcache は、「愚かな」保存サーバーと「賢い」クライアントが E2EE 状態でトランザクションできるようにする API を提供している
古いハードウェアに Blobcache と Tailscale のような VPN を入れれば、ほかのデバイスのデータを簡単に移せる
設定方法は SSH に似ていて、設定ファイルにキーを追加するだけでアクセス権が得られる
ストレージ活用で生じるたいていの不便がなくなる
家全体のホームディレクトリ向けの Git スタイルな E2EE バージョン管理ツールを Blobcache で作っている
https://github.com/gotvc/got
Peergos でアプリが E2EE データを使う方式は Blobcache と非常によく似ている
互いに協力できると良さそうなので、連絡してみたい
https://peergos.org/posts/a-better-web
ユーザー別ストレージとして https://remotestorage.io/ もあるので、参考にするとよいかもしれない
私が読んだ範囲では、こうした提案は進化論的テストを通過できていないと思う
大規模にアイデアを実行するには、遠い目標を描くよりも段階的に現状を改善していく必要がある
今の状況はすでにかなり高い局所最適に近づいていて、新しい情報統制の方法を掲げる人たちは、コストや労力が非常に大きい方法しか示せていない
全工程を知る必要はないが、少なくとも最初の二つの試みは現状より良い方向であるべきだと思う
結局、飛びたいならまず羽毛から進化させるべきだという意見だ
現実的に発展可能な方向は次のようなものだと思う
初期導入店舗には PCI/PII 保存負担が減るため、導入の動機が生まれる
各段階ごとに今の体制より改善されているように感じる
一度に大きな変化ではなく、各段階で体感できる改善が必要だという意見に同意する
一般的な利用者の視点から見て、「自分のデータを所有する」というだけで本当に UX が良くなったと感じるだろうか?
広告が減り、利用者を最優先に考える製品と組み合わされれば可能性はあると思う
あまりお金にならない作業がたくさん必要なので心配ではあるが、それでも希望は持っている
現在の BlueSky ユーザーの 99.9% は BlueSky サービスだけを使っているが、BlueSky には各ユーザーごとに Personal Data Service(PDS)がある
いつでも BlueSky から自分のデータを取り出して別の場所に移せるし、最近では再び BlueSky に戻すこともできるようになった
それぞれの PDS には好きなデータを保存でき、たとえば https://tangled.org の git データ、https://teal.fm の音楽試聴記録、https://leaflet.pub のブログなど、多様なデータを置ける
自分で PDS を運用したり、コミュニティ単位でホスティングしたりする事例が急速に増えている
PDS データを集計・連携するリレーサーバーも発展しており、ネットワーク接続を完全に提供する集約レイヤーの運用はもう少し難しいが、徐々に良くなっている
従来構造と比べれば確かに革新と言えるもので、開発者たちの情熱が目に見える形で表れており、大きな力を感じる
アーキテクチャ分離のおかげでさまざまな分野で発展が可能で、基盤が堅牢なので拡張性も高い
進化論的な実験が実際に行われている感じがして、とても期待している
個人データストレージという概念は本当に好きで、これがデフォルトになってほしい
ただし、技術的にそもそも解決不可能かもしれない問題がある
たとえば、この記事では「スキーマ(schema)」への言及がないが、スキーマこそが本当のデータ移植性を妨げる大きな要因だ
単純な CRUD アプリですらフィールド形式を変えるのがどれほど難しいかを自分で経験した
Google や Facebook から自分のデータをエクスポートできても、そのデータが元のアプリでどう表示されどう使われていたかを再現するには、元の UI 全体を複製するレベルで難しく、元のサービスのスキーマが変わればレンダリングや連携の問題、ひいてはデータ消失まで起こりうる
独立したデータサイロでは自由に形式変更ができるが、複数の保存先が互いに独立してデータスキーマを変更すると、最終的には同期がほぼ不可能になり、データ損失のリスクが高い
また、スキーマごとの権限付与と本人確認も厄介な問題だ
たとえば A に特定フィールドだけ見せるよう制限しなければならないのに、複数サーバー間の同期過程で一部サーバーは userA が誰か分からず、データが存在しないかのように扱われる
信頼・アイデンティティ・監査手続きが分散したシステムでは、きめ細かなアクセス制御は本当に難しい問題になる
最近の Hacker News の上位記事を見ると、「ウェブをもう一度自分たちの手に取り戻そう」あるいは「90年代のようにセルフホスティングやフェデレーションなどを復活させよう」という話がよく出てくる
現実では何も変わらず、むしろ悪化しているように感じるし、90年代のインターネットやモバイル登場以前の空気感を知らない世代も増え続けている
今では何かに申し込むたびに、世界中の無数の DB に不要な個人情報のコピーだけが量産され、結局あとでハッキング、誤用、販売、放置が繰り返される
解決策があるのかどうかさえ分からず、ときには地球の反対側を回るほうが簡単なのではと思えるほどだ
ヨーロッパではこうした個人情報の問題は、実質的にはほぼ解決されたレベルだ
法律が実際に効果を持っているので、まともな企業は違法なデータ保管や販売をそう簡単にはできない
ただ、人々はクッキーバナーのような表面的な部分だけを見て、本当の成果を十分に感じ取れていないようだ
実際には市民の生活の質を高めるデジタル世界の変化を、ヨーロッパが主導している
たとえば手数料無料の即時銀行振込のような公共財もある
もし実際に違う時代を経験した私たちまで、「何も変わらない」という理由で諦めてしまえば、本当に変化は起きないだろうと思う
実際に見れば、今はオープンソースやセルフホスティングの代替を構築するのが歴史上もっとも簡単な時代だ
90年代にオンラインにいた特徴的な人たちは今もまだ存在していて、彼らは昔ながらのスタイルでオンライン活動を続けている
今のインターネットがはるかに単純でアクセスしやすくなった結果、面白さや魔法のような感覚を求めない大多数の一般人が簡単に使えるようになっただけだ
現在のオンライン環境をいつも悪いものだとばかりこき下ろす態度は、残っている価値あるサービスやコミュニティまで貶めることになるので残念だ
既存サービスは洗練されていたり格好よかったりはしないが、それでもなお存在し、役割を果たしている
個人情報が無秩序に複製されて放置・ハッキング・販売されるのをどうしたらいいか分からない、という悩みについては、
データはむしろ所有者にとって「危険な負債」と認識されるようになってこそ改善の可能性があると思う
たとえば「Megabank、データ流出で破産、幹部は収監」といった事件が当たり前になって初めて、データ管理に対する態度は根本から変わるだろう
今のように「またデータ流出、今回は LifeLock 無料!」で済まされていては、認識は変わりにくい
例に挙げられていた事例が実際には単なる幻想ではない理由は、Bluesky や AT-net などが現実に稼働しているネットワークであり、現実世界に影響を与えるほどなので、複数の権威主義国家から脅威と見なされているからだ
この問題に対して私がもっとも説得力があり妥当だと思う解決策は、Tim Berners Lee(ウェブの創始者)が作った Solid という標準だ
[https://en.wikipedia.org/wiki/Solid_(web_decentralization_project)](https://en.wikipedia.org/wiki/Solid_(web_decentralization_pr...)
これほどならインターネットのデータ構造を変える資格は十分にあると思うし、Solid の技術自体もかなり堅牢だ
残念なのは、Solid が広く普及していないことだ
おそらく既存のウェブ環境が大きすぎるうえ、既存技術スタックの大半が「本当のデータ所有権」を前提に組まれていないためだろう
単にライブラリをいくつか差し替えるだけではなく、根本的に開発とデータ処理の方法を考え直さなければならないため、導入には参入障壁がある
Solid チームはこうした問題をきちんと理解し、新しいプロジェクトへの導入が徐々に容易になるよう、ツールやライブラリをうまく整備してきている
だから Solid の未来と拡張性にはかなり期待している
「複数の企業やサイトなどに分散保存されるのではなく、自分のデータが一か所にあり自分の管理下にある」という主張には同意しない
現実には、どこかのサイトにデータを載せた瞬間に、相手は勝手にコピーしたり売ったりできて、それを防ぐちゃんとした方法はない
結局のところ、データ移動性と相互運用性、そしてブロックやスパム管理の責任をサイトではなく利用者に押しつけているだけだと思う
プライバシーや「誰に自分の情報を共有するかを自分で制御する」という根本問題は解決されていないように見える
サイト A にだけ自分のデータを提供し、データブローカー B には提供しないつもりでも、A がそのデータを B に売れない理由はない
実際には今とまったく変わらない状況だ
データを一か所にだけ置きたければ、外部サイトやサービスと一切データを共有しないしかないが、それは現実的ではない
防ぐ方法がないのはその通りだが、少なくとも第三者が持っていくのは「コピー」だ
私のデータの所有権は依然として私にあり、一か所から直接アクセス、共有、バックアップ、分析がしやすくなる
データ自体をロックインから解放するうえで大きな効果がある
第三者が私のデータを売ったかどうかを見分けて訴訟することも不可能ではないし、データ形式の非独占化も義務化される
今のシステムよりははるかに良いと感じる
もし自分のデータの原本と所有権を明確に主張できるなら、再販売を禁じられると思う
ヨーロッパ(EU)では実際に企業に対して「個人情報の削除」を求める権利があり、
こうした権利はデータが「自分のもの」だとはっきり定義できるほど主張しやすくなる
最新のデータは過去のデータよりはるかに価値が高い
自分が誰に、どんな目的で、どんなデータを提供するかを直接管理でき、必要なときだけアクセス権をオンオフすることもできる
データの再販売は原則として違法とみなされるべきだ
弁護士や医師が私の情報を売っては絶対にいけないという常識があるように、個人データを扱うすべての者に同じ法律が適用されるべきだと思う
すべてをセルフホスティングしたいという欲求はずっと存在してきた
しかし企業にとっては中央集権化のほうが簡単で、そこでデータを収益化までできるため、このトレンドが広がってきた
実際には、ユーザー自身がホスティングするより Facebook、instagram、gmail などの大規模サービスを使うほうがはるかに簡単で、みんながそこにいるから自分もそこにいたほうが便利だ
まだ一般ユーザーにとって十分に使いやすい分散型ソリューションが出てきておらず、実質的なインセンティブも弱いと思う
根本的にその使いやすさを解決できない限り、トレンドは変わりにくいだろう
Plex を使っていて、人々には私たちが思う以上にセルフホスティング欲求があると感じるが、その考えを明確に言語化するのは難しい
Plex は完全なセルフホスティングソリューションではないが、Netflix のようなサービスよりはずっと近く、IT スキルがそれほど高くない人たちでも最近は Plex サーバーを自分で立ててみようとする姿が増えている
単に無料で映画を見たいからではなく、子どものために始めるケースが多い
自分でコンテンツをキュレーションしながら、子どもが何を見るかをコントロールできるので、かなり安心できる
子どもの頃に親がテレビのチャンネルを制限してくれて安心した、あの感覚に近い
今日のインターネットはあまりに無秩序で危険が多いと感じるため、自分の手で少しでも主導権を取り戻したい親が増えている
こうした考えが、いつかもっと有用な流れにつながるかもしれないと期待している
Opera Unite に言及してくれてうれしい
誰でも特別な知識なしに、ブラウザだけで簡単な静的サイトを簡単に作れた革新的なアイデアだった
これが成功して、人々が自分のコンテンツを自律的に共有する文化が根付いていたなら、今のような商業化と操作が蔓延する SNS の代わりに、もっと健全なインターネットになっていただろう
PDS(個人データサービス)という概念はとても気に入っている
ただしコミュニティは、コンテンツファーム、スパム、元の出所の明確性といった問題をもっと高い優先順位で扱うべきだと思う
こうした保護策がなければ、悪意ある行為者が federation 構造を簡単に崩壊させられてしまう
これはメール(SMTP)ネットワークを見れば、その深刻さがよく分かる
垂直統合されたアプリのほうが運用コストははるかに安い
Instagram は写真の一部しか保存しないが、収益性は非常に高い
一方で iCloud のようなアカウントサービスは Web API もほとんどなく、実質的に Apple デバイス専用なのに、人々は喜んで費用を払っている(せいぜい、より大きい iPhone の購入を防ぐ程度の効果しかないのに)
それでも Web ファイルシステム上で独立して動作するアプリが多くない理由は、
結局、汎用ソリューションは実際に使うと本当に遅かったり、速度やコストの問題で実用が難しかったりすることが多い
そのうえストレージ費用まで二重に払っているなら、帯域幅コストまで追加で負担しようとするユーザーはごく少ない
「データが企業ではなく、人間中心の組織に保存されるとデータ所有の議論が変わる」という主張には賛同しにくい
企業もまた人によって運営される組織だ
株主が取締役会を通じて統制する構造であって、宇宙人が運営しているわけでも、システム自体が自律的に動いているわけでもない
おそらく、サービスの利用者が直接運営に投票できない営利企業に反対している、という意味だったのかもしれない
「企業」という言葉はしばしば「悪の勢力」のように使われるが、結局は少数の特定の人々が所有する組織にすぎない
そして例として挙げられていた「@alice.com」のように .com を使うのも、皮肉にも商業的領域を代表していることを考えると興味深い
https://en.wikipedia.org/wiki/Institution#Examples
https://en.wikipedia.org/wiki/.com
たいていは非商用のウェブサイトでも、まず .com アドレスを試すことが多い