- Apple Intelligenceはオンデバイス処理とPrivate Cloud Computeという強力な基盤を備えているが、実際の製品体験は創作を助ける「精神のための自転車」というより、技術デモ的な改善に近い
- Appleが予告したSiriの個人的文脈の理解は、「妻が数日前に送ってきたポッドキャストを再生して」のような使い勝手を約束したが、広告で繰り返された中核機能はまだリリースされていない
- Private Cloud Computeは、ユーザーデータの削除、ノード検証、公開OSイメージ、セキュリティ中核コードの公開により、遠隔検証可能な信頼コンピュートの珍しい事例になったが、その上で動く機能群は期待に追いついていない
- 実際の機能のうちMath Notesは、Notes内で変数ベースの計算をその場で処理でき、最も満足度が高いが、Writing Tools・通知要約・Clean Up・Image Playgroundは有用性、正確性、創作の制御性で弱さを見せる
- 生成AIは独立した製品というより、より大きな製品の実装の詳細に近く、Apple Intelligenceは同じデバイス上でOllamaを使って直接統合する方法よりも有用性が低く感じられる
「精神のための自転車」だったAppleの製品哲学
- Steve Jobsは1981年、コンピューターを人間の精神のための自転車にたとえ、少ないエネルギーでより大きな創造性を発揮させる道具だと見なした
- MacintoshとMacWriteは、タイプライターや手書きと違い、印刷前に画面上で文書を見ながらBackspaceで修正できるようにした
- ワードプロセッサは文書作成の方法を大きく変え、Apple製品は単なる計算機ではなく、創作を可能にする身体の拡張のように働くべきだという基準を打ち立てた
- この基準においてAppleは、「コンピューター仕事をするコンピューター」よりも創作ツールを売る会社として区別される
Apple Intelligenceが約束したビジョン
- Appleは2024年6月にApple Intelligenceを発表し、スマートフォンをより賢くする機能群として紹介した
- Siriが「妻が数日前に送ってきたポッドキャストを再生して」のような依頼を処理する例は、関係性、リンク、アプリの文脈をつなぐ個人的文脈検索の可能性を示した
- このビジョンが実現すれば、ユーザーは複数のアプリに散らばったデジタル生活を自然言語で検索し、スマートフォンが代わりに作業を実行できるようになる
- Appleは、Spotifyが音楽を、AWS APIがコンピュートを蛇口のように提供するように、あらゆるAppleデバイスが知能(intelligence) にアクセスする構想を掲げた
- この方向性は、コンピューターがユーザーと一緒に働いて望むことを実現する「精神のための自転車」というビジョンに近い
現代のアプリがユーザーを自分のデータから遠ざける仕組み
- 現代のアプリの大きな問題は、多くのアプリがWebサービスの薄い殻のように動作している点にある
- InstagramやBlueskyのようなアプリは、サーバーにリクエストを送り、返ってきた応答を受け取ってコンテンツを表示する
- 電波がなければ、投稿の予約、以前見た投稿の確認、たった今投稿したコンテンツの確認すら難しくなることがある
- 例外としてSignalとAppleのアプリが挙げられ、それ以外の多くのアプリはユーザーを自分自身のデータから少しずつ遠ざけている
- Ed Zitronの文章は、プラットフォームが成長と収益化のために広告トラッカー、動画広告、通知要求などでユーザー体験をむしばんでいると批判している
- 市場はチャットやソーシャルメディアに直接お金を払いたがらず、こうしたサービスを運営するコストは非常に大きいため、ユーザーデータが収益化の対象として見られやすい
Private Cloud Computeという強固な基盤
- Apple Intelligenceは可能な場合はデバイス上で実行され、Appleは大規模言語モデルやAIモデルをデバイス上で動かすための研究も進めている
- デバイス上、またはユーザーが見えるハードウェア上で処理される計算は、外部へのリクエストを含む方式よりもプライバシーの面ではるかに強い
- AppleはWWDCで、Private Cloud Computeがネットワークリクエストに対してもローカルデバイス上の計算と同等かそれ以上のプライバシー保証を提供すると主張した
- Private Cloud Computeは、通常のWebサービス運用の観点から見ると非常に厳しい条件を同時に満たさなければならない
- ユーザーデータはリクエスト処理にのみ使われ、その後削除される
- ロードバランシング基盤は、誰がリクエストしたかも、どのサーバーに送られるかも把握しない
- 研究者はシステムを検査・検証し、ノートPC上でシミュレーションできる
- AppleのSRE担当者はPrivate Cloud Computeノードへの特権アクセス権を持たず、ログはコンパイラレベルで最小化される
- 攻撃者は特定ユーザーのリクエストを処理するノードを安定して特定できない
公開されたセキュリティモデルと閉鎖性の両面
- Appleの技術文書は、AI製品チームが一貫したセキュリティモデルを公開した珍しい事例として挙げられる
- ハードウェア組み立て工程では、未承認のハードウェアがサーバーボードに追加される脅威を防ぐため、各段階でX線撮影を行い、基準画像と比較する
- ユーザーはPrivate Cloud Computeノードのローカルコピーを構成して攻撃実験を行うことができ、Appleは脆弱性を見つけると報奨金を支払う
- ハードウェア認証にはApple社内の相互に無関係な複数部門の人員が関与する
- Private Cloud Computeノードは電源が外されると自己認証を解除し、サーバー筐体の侵入スイッチが主電源と接続されているため、サーバーを開けると電源が切れてノード認証が解除される
- デバイスがPrivate Cloud Computeにリクエストすると、使用されたノードIDが記録され、ユーザーは自分のデバイスが使用したノードがなお認証状態にあるか確認できる
- 本番OSイメージは公開ダウンロード可能で、暗号化されていない
- OSの重要パッケージはコードとデータに分離され、データパッケージにコードを混在させたり、その逆を行ったりできない
- AppleはPrivate Cloud Computeのセキュリティ中核部分のソースコードをGitHubで公開している
- このシステムは遠隔検証可能な信頼コンピュートの聖杯に近いが、コンシューマー向けOSとして提供されるなら、root権限、コンパイラ、デバッガなしで定められたソフトウェアしか実行できない、非常に閉じたシステムにもなる
2024年末に実際に登場した機能
- Apple Intelligenceの最初の機能群は2024年10月末にリリースされた
- 提供された機能は、Writing Tools、通知・Webページ・メールの要約、写真内のオブジェクト除去機能であるClean Up、写真内容ベースの検索、Siriによるデバイス内文書検索、NotesアプリのMath Notesだった
- その後、Image Playgroundとメール分類が追加された
- 広告で繰り返される個人的文脈機能はまだリリースされていない
Math Notes: 最も成功した機能
- Math NotesはApple Intelligence機能の中で最も満足度の高い機能として挙げられる
- Notesアプリで次のような変数ベースの計算を入力すると、最後の等号の後に結果を自動で挿入する
Rent = 2300
FamilySize = 2
Rent / FamilySize =
- 上の例では
1150が挿入される
- 基本的な計算、変数の利用、収入と支出のおおまかな見積もりに役立つ
- Math Notesについては不満がないと評価している
Writing Tools: 創作を助けるより置き換える結果
- Writing Toolsは、文章作成の経験が豊富なユーザーにとってはほとんど役に立たず、すでに自分でより良く作れるものの少し劣る版を提供する程度にとどまる
- この機能は創作プロセスを拡張せず、既存のAIツールの悪い副作用である置き換えを感じさせる
- 結果は、レイヤーや細かな調整可能性もなく、「プロフェッショナルにする」「表に変換する」といった限られた選択肢の背後から、不透明なテキストの塊として出てくる
- 実際に段落の要約を依頼した際には、“Writing Tools Unavailable: Certain capabilities are unavailable at this time. Try again later.”というエラーが発生した
- 配信中の長い発言を文章の出発点になるアウトラインへ変える用途には役立つかもしれないが、文章そのものを代筆させる用途には向いていない
- 英語経験があまり多くない人にはより有用かもしれないが、筆者にとっての有用性は大きくない
通知・メッセージ・メール要約の問題
- 通知要約は、多数の通知を一度にざっと見やすくするという発想自体は良さそうに見える
- 実際の実装では失敗例が大きく目立つ
- 詐欺SMSが「住所情報不完全のため宅配配送遅延」のように要約され、すぐ行動が必要だと感じさせる可能性がある
- BBCは、通知要約によって拘束中の容疑者が自ら命を絶ったと人々に思わせた事例を報じた
- Apple Intelligenceを有効にしたまま通知要約だけを無効化すると、通知が最大5秒遅れることがある
- 要約機能の一部はiPhoneで動作せず、有用でもなかったため、通知遅延を避ける目的でMacBook上でのみ有効のまま残された
- 全体としてAppleらしい仕上げはあるが、半完成品のような印象を与える
Clean Up: 写真の現実性を変える道具
- Clean Upは、写真から不要な対象を除去する機能である
- 写真を現実のそのままの反映と見なし、色補正やトリミングのような表現の変更と、画像の内容そのものを変える作業を区別する立場からは受け入れがたい
- スターリンの写真からNikolai Yezhovが削除された歴史的編集事例が、Clean Upの性格を説明する例として使われる
- このツールは、実際にあった瞬間ではなく、ユーザーが望んでいた瞬間のような画像を作れてしまう
- こうした哲学的理由からClean Upは使わず、これ以上詳しくは評価しない
Image Playground: Apple製品らしくない結果
- Image Playgroundは、テキストプロンプトや人物写真などを使って画像を生成する機能である
- Stable Diffusion 1.5とComfyUI、11〜12個のモデルを混ぜた複雑な拡散フローで作った画像が、高い基準の例として提示される
- Image Playgroundで作ったEast Berlin TV towerの夕景画像は、スマートフォン画面でざっと見るなら通用するかもしれないが、空の時間帯が混ざり、窓やデッキの直線も不自然だ
- 良い例はかなり選別された結果であり、多くは“taco smoking beer at a party”のように形と意味が大きくずれることがある
- 自分の写真を使うと、人物の比率や目などに不快な結果が出ることがある
- Appleがこうした結果物を製品として出したことは、Appleに期待されてきた品質と細やかさの反対のように感じられる
- Genmojiも同様に魂のない空虚な結果を生むと評価されるが、チャットメッセージから品質を保ったまま抽出しにくいため、詳しくは扱わない
- open-weightsモデルを使う他社のほうがより良い結果を作れる可能性があり、Apple側には開発者がモデルを創造的に活用するためのIntelligenceKitのようなツールがないことが惜しまれる
生成AIは製品ではなく実装の詳細
- 生成AIはそれ自体が製品というより、より大きな製品の中で使われる実装の詳細に近い
- ベルリンのテレビ塔の絵を1〜2秒で生成できても、ユーザーは空の色補正のようなレイヤー編集や創作上の制御を得られず、単一の最終出力を受け取るだけだ
- こうした機能は低労力のソーシャルメディア投稿には使えるが、製品というより技術デモに近く、2025年時点では2022年に出ていれば驚きだった程度だと評価されている
- 生成AIが実際に有用な領域は、もっと地味な作業にある
- 瞑想体験に現れる説明しにくい感覚を生成AIで分類する研究事例にも触れられており、6月までに関連ニュースと論文の公開予定がある
最終評価: 強い基盤の上の弱い製品
- Apple Intelligenceは、実装の観点から見て失敗した製品だと評価される
- 基盤は非常に強い
- 可能な限りあらゆるデータはデバイス上で処理される
- デバイスで処理できない作業はPrivate Cloud Computeの強力なセキュリティ慣行を使う
- 可能な限り非公開かつ暗号化された処理を目指している
- 問題は、遠隔検証可能な信頼コンピュートの聖杯に近い基盤を作りながら、最終的なユーザー体験が同じデバイス上でOllamaを使って直接統合するよりも劣って感じられる点にある
- Ollamaを使えばApple Intelligenceよりはるかに優れたモデルを選べ、同じデバイス上で動くためプライバシーも保たれる
- オープンソースコミュニティは限られたハードウェアで最大限の性能を引き出さなければならないため、枯れた技術の水平思考によって成果物を作り、修正なしで本番投入できる
- Apple Intelligenceは「精神のための自転車」ではなく、技術デモのような周辺的改善を提供し、無限に思えた潜在力を浪費したような結果になった
- 例外はMath Notesで、ほかのノートアプリにもあってほしいほど強く肯定的に評価されている
まだコメントはありません。