完全準同型暗号と真のプライベートインターネットの始まり

(bozmen.io)

13 ポイント投稿者 GN⁺ 2025-07-19 | 1件のコメント | WhatsAppで共有

完全準同型暗号（FHE） は、データを復号せずに暗号文のまま演算を実行できる技術
現在のFHEには依然として 実用性の低さ、1,000倍〜10,000倍の演算速度低下、40倍〜1,000倍の保存容量増加といった限界がある
しかし近年、FHEアルゴリズムは 毎年8倍の速度向上を達成しており、まもなくクラウドコンピューティング、LLM推論、ブロックチェーンのスマートコントラクトなどで実用領域に入る可能性がある
FHEが普及すれば、コンピューティング環境全体でデータプライバシーがデフォルトになる産業上の変化を促進するだろう
格子ベース暗号、LWE、ブートストラッピング などの中核概念、FHEアルゴリズムの発展史、実装例、性能改善の推移などを総合的に扱う

序論: 完全準同型暗号とは何か

完全準同型暗号（Fully Homomorphic Encryption, FHE）は、復号なしで暗号文の状態のまま任意の演算を可能にし、実際に 暗号化されたデータに対してそのまま演算 を行える方式
つまりサーバーは平文を知らないままでも、問い合わせと結果を計算して返すことができる
この技術は今日、複数の実世界のシステムに実際に導入されつつある

FHEの可能性と限界: 「FHEのムーアの法則」

FHEはネットワーク上でデータを継続的に暗号化状態のまま維持できるため、データ漏えいリスクを根本から遮断する 完全なプライバシー を実現できる
それでもなお現在の実用化に制約が多い理由は、暗号文演算が平文演算に比べて1,000〜10,000倍遅く、保存容量もおよそ40〜1,000倍に増えるなどの 著しい性能低下 があるため
これは1990年代のインターネット黎明期に似ている
しかし近年のFHEは毎年8倍ずつ高速化しており、まもなくさまざまな実用分野に入ると見込まれている

臨界点: 間近に迫るFHEの実用化

このような飛躍的な速度向上が続けば、今後は次のような分野でFHEが実用化される可能性がある
- 暗号化されたクラウドコンピューティング
- 暗号化されたLLM推論
- 秘密保持が可能なブロックチェーンのスマートコントラクト
こうした変化は、ユーザーデータ収集を基盤とするインターネットのビジネスモデルを根本から揺るがす可能性がある
FHEによって、「監視がデフォルト」のインターネットから「プライバシーがデフォルト」のインターネットへの 本質的な転換 が期待される

データセキュリティのアキレス腱とFHEの解決策

データは3つの状態（保存、転送、使用）のうち、「使用中」の状態で復号されるため、しばしばセキュリティ上の脆弱点となる
クラウド、内部関係者、ハッカー、脆弱なCPUなど、誰でもメモリ内の 平文データ にアクセスできる可能性がある
大規模なデータ漏えい事故の多くも、「使用中」または「保存中」に発生する
FHEはデータをライフサイクル全体にわたって暗号化状態に保つことで、こうした脆弱性を根本的に解消する

完全なプライバシーコンピューティングの定義

理想的な環境では、データは保存時、転送時、使用時（演算時）のすべてで 暗号化 を維持する
たとえばサーバーは平文の問い合わせをまったく見ることができず、暗号化された問い合わせを受け取り、暗号化された結果だけを返す
その結果を復号できるのは利用者だけである

FHEの動作原理: 数学的構造と概念

「準同型」とは、同じ構造を保存する数学的変換（例: フーリエ変換に似たもの）に基づく
FHEは平文空間と暗号文空間を双方向に変換し、暗号文演算結果を復号したものがそのまま平文演算結果と一致する ようにする
このような変換には主に 格子ベース暗号 と LWE（Learning With Errors） が使われる
- 格子ベース暗号は非常に高次元のベクトル問題に基づき、量子コンピュータでさえ解くのが難しいとされている（耐量子性）
- LWEはノイズが混ざった線形システムを逆算する問題であり、現実的には解読不可能である

ノイズ管理とブートストラッピング

FHEでは演算を重ねるほど暗号文内の ノイズ が増加する
加算では線形的に、乗算では指数的に大きくなり、最終的には復号不能になる問題がある
これを解決する中核技術が ブートストラッピング であり、暗号文を「新しい公開鍵」で再暗号化しながらノイズを一定水準までリセットする手法である
この過程がFHEシステムの性能ボトルネックだが、毎年急速に改善されている

FHEのそのほかの主要構成要素

再線形化（relinearization）: 乗算後に鍵の次数が2次に増える問題を解決し、再び1次に戻す過程
モジュラススイッチング（modulus switching）: ノイズ管理のために暗号文の法を縮小する手法

このほかにも、アルゴリズムの進歩に伴って多様なテクニックが継続的に提案されている

準同型暗号（HE）体系の分類とPythonの例

部分準同型暗号（Partial HE）: 1種類の演算のみをサポート（e.g. Paillier暗号は加算のみをサポート）
制限付き準同型暗号（Somewhat HE）: 加算と乗算の両方をサポート。ただし乗算の繰り返し回数に制限がある
完全準同型暗号（FHE）: 加算と乗算の両方を無制限にサポート。チューリング完全性を保証

Pythonで実装された Paillier暗号 の例を通じて、部分準同型性を直感的に体験できる

FHE発展の歴史と「FHEのムーアの法則」

1978年: 初めて「プライバシー準同型写像」の概念が登場
2009年: Craig GentryがFHEを初めて実現（博士論文）
2011年: 初の実装、1ビットあたり30分を要した（非常に低速）
2013年以降: ブートストラッピングが数ms水準まで短縮
2017年: CKKSなど浮動小数点近似のサポートにより、ML/AIへ本格導入

FHEアルゴリズムは 2011年から毎年8倍ずつ改善 され、初期の10¹⁰倍オーバーヘッドから最近では10³〜10⁴倍水準にまで到達している
最新の論文ではFHEの乗算スループットを1,000倍、レイテンシを10倍削減しており、ハードウェアアクセラレーションと組み合わせれば、さらに1,000倍以上の速度改善余地がある

暗号化がデフォルトになる未来

大規模なデータ漏えい事故は避けがたい現実である
FHEを使って サーバーが復号鍵なしでも暗号化データに対して演算だけ を行えるようになれば、プライバシー保護の新たな基準になるだろう
まだすべての領域で完全に実用的というわけではないが、毎年驚くべき速度で改善されている
利用者のプライバシー要求と関連規制の強化が相まって、最終的にはFHEが大半のクラウドコンピューティングの標準になると見込まれている
未来のインターネットコンピューティングは 常に暗号化された状態 へと進化していく

2010年代: HTTPSがデフォルト
これから: FHEがデフォルト となる時代の到来が予想される

参考文献と追加資料

FHE Reference Library: 学術資料を包括的に整理
Craig Gentry 2009 博士論文: FHEの出発点
Vitalik Buterin: FHE詳細分析
コミュニティ: FHE.org （開発者中心のハブ）
GitHub: awesome-he: 準同型暗号関連プロジェクト集

1件のコメント

GN⁺ 2025-07-19

Hacker Newsの意見

FHE と cryptography がかなり好きな立場を前提に話す。FHE は徐々に高速化しているものの、ブートストラッピングに依存する限り平文の演算速度には追いつけないという話。ブートストラッピングによる約1000倍以上のオーバーヘッドは根本的に避けられず、これ以上速くするのは不可能だと分かってきたことで、ハードウェアアクセラレーションの話が出始めた。ただ、今は LLM に計算資源がほぼすべて注ぎ込まれている時期なので簡単ではない。FHE で計算するときにトークン単価が何倍に跳ね上がるかを考えると、1000倍未満でない限り現実的な可能性はほとんどない。プライバシー保護が目的なら、confidential computing 方式が現時点では唯一実用的な代替手段。ハードウェアを信頼しなければならない点は気に入らないが、それが今ある中で最善だ
- FHE を任意の演算に使いにくい本当の、もっと根本的な理由がある。ある種の演算は平文より暗号文のほうで異常に複雑性が増えるからだ。データベース検索では、平文なら O(log n) だが、暗号化されたキーで検索すると O(n) になる。だから完全準同型の Google 検索は基本的に実現不可能。しかし完全準同型 DNN 推論は事情が違うかもしれない
- ブートストラッピングがなくても、FHE が平文演算と同じ速さになることはない。暗号文は平文より1000倍ほど大きい。つまり、メモリ帯域幅も演算量もはるかに多く必要になる。この差は埋められない
- 計算コストが1000倍に跳ね上がっても、検証可能なプライバシーを本当に求める特定の需要層がいるのではないかとも思う。Dropbox ほどの規模ではなくても、ある程度の市場はあると想像する
- 昔は何でも PCIE 拡張カードだった時代を振り返る。GPU もそうだったし、数値演算コプロセッサのような特殊アクセラレータも別にあった。今は汎用ハードウェアに統合されてより安く便利になったが、特定機能に最適化されたシリコンチップほどにはできない。だから AI/ML 用の専用カードを GPU ベースとは別に使うべきだと主張する。アーキテクチャに一部重なりはあるが、GPU ベースの AI カードは多くの面で不利を抱えている。本当の AI アクセラレータは最新の SXM ソケットに入る専用ハードウェアだと思う。ただし SXM ソケットはサーバーにしかなく、価格も安くない
- LLM ブームは認めるが、FHE を使えそうな他の用途が本当にないのか気になる。たとえば、高速性が不要なトレーディングアルゴリズムを FHE でサーバー上にホストしてセキュリティを保証する、といった使い方も考えられそうだ
FHE が重要なのは、今の企業が政府からの圧力によって特定ターゲットの暗号を強制的に破らされる場合があるからだ。FHE は企業が「我々は平文を絶対に見られない」と胸を張って言えるようにしてくれる。ネットワークキャリアの役割では E2E encryption などで一部は可能だが、平文状態でデータを処理するときにはまだ不可能。プライバシー保護は基本的人権だと思う。政府の権限は、民主的な活動（投票、芸術、報道、表現など）に対してはごく限定的にしか作用すべきでない
FHE で任意演算が可能でも、たいていのサービスは特定のデータを提供するから使われている。Google が自分のクエリに対して安全性を保証するには、検索インデックス全体を暗号化しなければならないが、現実的ではない。ビジネス的にも、ごく少数の高信頼・高リスク分野を除けば、FHE 型サービスを採用するインセンティブはほとんどないと思う
- 私の知る限り、機微なデータだけ暗号化すればよい（例: 自分の銀行取引データ）。計算したい関数自体を暗号化する必要はなく、公開データと組み合わせて使える
- 結局のところ大企業にとっては、ユーザーのデータやクエリを直接見られること自体が収益源になるので、FHE を習慣的に採用する動機がない。銀行など金融分野では面白いかもしれないが、それ以外でいつ採用されるかは未知数だ
- インセンティブの話はその通り。ただし最初の部分は違う。平文データベースに対するプライベートな参照（lookup）は、すでに数年前から可能だ。ただし、平文 DB を事前にかなり複雑に前処理するか、最悪の場合は DB 全体を線形スキャンする必要がある
- 完全非公開検索エンジンの FHE 実装例として spiralwiki.com を紹介する。サーバーはユーザーがどの Wikipedia 記事を読んでいるのかをまったく知ることができない方式だ spiralwiki.com
「クライアントの立場」では、FHE のようにデータを完全に保護してくれるサービスにお金を払いたい人はいるだろうが、実際には非常に高額になり、加入者はごく少数だろう。現状比で数十倍の計算コストがかかる前提で考えると、プライバシー重視の Google 代替サービスが年100ドルで可能だとしても、多くの加入者を集めるのは難しい。コストが上がるほど加入者はさらに減る。Tor のように完璧ではなくてもかなりの保護を無料で提供する代替手段もある。HE（準同型暗号）が役に立たないのではなく、費用を負担して使うのはごく一部だということだ
- 今 FHE 版 Google を作ったとしても、遅すぎて高すぎるので誰も使わないだろう。鍵になるのは、今後コンピューティング速度がどう発展するかだ。もし FHE が平文比で1000倍遅くても、ハードウェアが1000倍速くなれば同程度の水準になり得る。未来予測は難しいが、FHE にしか提供できないプライバシーという価値を考えると、長期的にはデフォルトになる可能性もある（10年以内ではないとしても、50年後ならあり得るかもしれない）。過去50年でハードウェア性能が大きく向上したように。もちろん、暗号文サイズやモデル全体の再暗号化の必要性など問題もある。まだ実用的な適用範囲は狭いが、今後徐々に広がっていくと信じている。いつかは検索エンジンや LLM の分野も含むようになるだろう
インターネットが「デフォルトで監視」から「デフォルトでプライバシー」へ変わり得る、という考えが言及される。自分もかなり前からデジタル署名を作るなどしてプライバシー技術を広めてきた。しかし Hacker News や Facebook が皆のアイデンティティを握っている現実を見なければならない。それがあまりに簡単で儲かるからだ。FHE もまた「人々は望むが、実際にはすぐ広く使われない技術」だ。運用オーバーヘッドと複雑性の負担のため、多くの場合は既存方式で十分うまく動くと見なされる
- メールの末尾にデジタル署名のようなものを付けても、「それ何？」という反応しか得られなかった。一般ユーザーにクライアント側暗号化への参加を説得した経験があるのか気になる
- FHE と AI が結び付くとき、複雑性の負担を AI が一部肩代わりして、本当に広く使われるキラーな組み合わせになるかもしれないという意見だ
実際には、企業が FHE サービスのように計算を100万倍使い、デバッグも難しく、利用パターン分析もできないソリューションを採用する理由はないだろうと思う
Google の例から話を始めるのは誤解を招きかねない。普通「Google」といえば「ウェブ検索」を連想するが、文書で説明される FHE は入力値全体がひとつのキーで暗号化されなければならない点で、検索サービスとは文脈が合わないかもしれない。Google の検索インデックスは数 TB に達するが、これを全部特定のキーで暗号化するのは不可能だと思う。つまり、ユーザーが入力全体を制御するときだけ FHE は役に立つ。Google への言及は混乱を招く
- Apple の CallerID のようなケースでは、データベース全体をユーザーごとに暗号化することが必須というわけではなさそうだ Appleの準同型暗号研究 / Appleのプライバシー保護検索
- 準同型暗号型サービスでは、そもそも暗号鍵を事前に知っておく必要がない。それが核心だ。非常に単純な暗号化の例として、鍵が未指定の状態でも暗号文同士の加算結果を得られる構造を紹介する。より強力な暗号で、より複雑な演算までサポートできれば、非常に多様な機能を実装できる
- Google といえば検索だけでなく、Gmail、Google docs など個人情報に関わるサービスも多い。検索しか思い浮かべない人は、おそらく関連記事自体を読まないだろう
FHE が汎用コンピューティングやインターネットサービスにすぐ導入されるのは簡単ではないと思う。少なくともムーアの法則がさらに何世代も進まないと難しそうだ。しかし、すでに FHE が輝き始めている分野として、複雑性は低い一方でセキュリティと信頼性が非常に重要なスマートコントラクト、金融、医療があるかもしれない。最近は Moore's law やソフトウェア最適化のおかげで、曲線が実用性の方向へ傾き始めたと見ている。Zama のハードウェア/Devtools の取り組みが例として挙げられている
E2EE git はすでに開発されている。自分は作成者に、サーバー側で protected ブランチや force push 防止のような要件を解決できるか尋ねたが、クライアントが悪意を持っている場合に有効な対策はなかった。これがいつか E2EE Github に発展するのかも気になる関連 Hacker News リンク
FHE の速度向上が今後も続くという言説を聞くと、平均速度に関する古い数学の問題を思い出す。たとえば、上り坂1マイルを時速15マイルで進んだあと、下り坂1マイルをどれだけ速く進めば、全2マイルの平均速度が時速30マイルになるか。過去の改善速度は将来の可能性を保証しない。これは物理的限界ではなく、アルゴリズム上の限界だ
- 下り坂が崖だったらどうだろう？車の終端速度が 200〜300mph 程度だとすると、1マイルを自由落下で15秒で通過することも計算上は可能かもしれない。全2マイルを平均30mphで進むには4分かかるので、残り時間に合わせて上り坂の速度も適切に調整することになるが、実際にはさまざまな変数のため実現不可能だ
- 厳密に計算すると、下り坂で 41mph 出せば全体平均は 30mph になる。問題文そのものに数値の丸めや測定誤差が入っていると仮定すれば、こういう結果になる