Apple、Google Geminiモデルを中核に構築した新しいAIアーキテクチャを公開
(macrumors.com)- Apple Intelligenceが、Googleと共同開発したApple Foundation Modelsを基盤とする新しいアーキテクチャへ刷新
- 新モデルはGemini系の技術を土台としており、デバイス上での実行とPrivate Cloud Computeサーバー上での実行の両方に合わせて調整
- アップグレードされたモデルは、画像理解・生成、リアルな画像生成、高度な写真編集、視覚的質問応答をサポート
- 一部のデバイスには、音声生成、ディクテーション精度の改善、より強力な自然言語理解を提供する高性能モデルが提供されるが、対象デバイスは明示されていない
- Appleは、ユーザーデータはその場のリクエスト実行にのみ使われ、Appleや第三者がアクセスできず、外部の専門家がプライバシー保護の保証をいつでも検証できると説明
Apple Intelligenceアーキテクチャ刷新
- AppleはApple Intelligenceプラットフォームの大規模な刷新を発表し、Gemini系の技術を使ってGoogleと共同開発した基盤モデルベースの新しいアーキテクチャを公開
- 新アーキテクチャの中心はGoogleと共同開発したApple Foundation Modelsで、Appleはこのモデルがデバイス上の処理とPrivate Cloud Computeサーバー上での実行の両方に合わせて調整されていると説明
- AppleはGoogleとの協業を「深い」協業と表現し、Apple Intelligenceに「大規模なアップグレード」をもたらすと述べた
- 新モデルは、最新の理解・推論機能と、画像理解および生成を含むマルチモーダル対応を提供
新モデルの機能
- アップグレードされたモデルは、リアルな画像生成、高度な写真編集、視覚的質問応答を含む新たなユースケースをサポート
- 一部のデバイスは追加機能を備えた高性能モデル版を受け取る
- 高性能モデル版は、音声生成、ディクテーション精度の改善、より強力な自然言語理解を提供
- Appleは、どのデバイスが高性能モデルの対象かを明示していない
システムオーケストレーター
- 刷新されたアーキテクチャの中心には、新しいシステムオーケストレーターが配置される
- システムオーケストレーターは、Appleプラットフォーム全体でApple Intelligence機能を安全に調整する
- Appleは、オーケストレーターがアクティブなアプリとユーザーの現在の作業に応じて応答をパーソナライズできると説明
- この構造により、Appleが「真のシステム全体の知能」と表現する機能が可能になる
プライバシー保護へのアプローチ
- Appleは、競合他社がユーザーを考慮せずに「先走っている」と表現し、自社のアプローチと対比
- Apple Intelligenceは、デバイス上の処理とPrivate Cloud Computeに依存
- ユーザーデータはその場のリクエスト実行にのみ使用され、Appleや第三者がアクセスできないという約束が維持される
- Appleは、外部の専門家がこうしたプライバシー保護の保証を「いつでも」検証できると付け加えた
1件のコメント
Hacker Newsの意見
AIに追いつくやり方がかなりAppleらしいと思う。外部ツールをプライバシー保護アーキテクチャで包み、OSに組み込み、オーケストレーション層を製品化する形だ
Private Cloud Computeとオンデバイスのルーティングによって、サードパーティモデルの機能が、ユーザーのコンテキストを漏らさずにファーストパーティシステムのように感じられるかどうかが興味深い
AppleがGoogle-Apple間の境界をうまく処理できれば洗練された動きになるが、そうでなければGeminiの上にプライバシー保護をきれいに塗ったApple Intelligenceのフロントエンドのように感じられるだろう
今のサードパーティ製チャットボットではそうした統合はできないし、仮にできたとしても、そのレベルのアクセス権限を他社に任せるのは難しい
強力なプライバシー保証がある方が望ましいが、それでも悪くない方向性だ
小型モデルを含めてさまざまな要素を検討しただろうが、コストも大きな悩みだったはずで、Googleはこれほど多くの無料AI推論を提供している唯一の事業者のように感じる
この変化は、消費者や従業員がAIサービスのコストをいつどのように支払うのかをさらに曖昧にするだろう。たとえば発表ではコーディングではない消費者向け作業を見せていたが、5つのファイルを選んでSiriにPythonスクリプトや小さなアプリを書かせることはできるのだろうか? 企業はSiriのAI機能を単に無効化するのか、それとも独自のAI監査体制や提供事業者へルーティングできるのか?
Apple Intelligenceを実際に何が動かしているのか、もっと知りたい。独自プロンプトの裏でGeminiフラッグシップモデルを使っているのか、微調整なのか、Geminiベースで独自モデルを事前学習したのかが気になる
GeminiベースのモデルとApple Foundation Modelsの間に意味のある違いがあるのかも知りたい。その違いがオンデバイスモデルとホスティングモデルで変わるのか、一部のモデルはAppleのPrivate Cloud Computeで動き、一部はGoogleの機材で動くのかも曖昧だ
その後の“keynote tech-talk”でかなり詳しく説明している: [0]
Appleによればモデルは5つある。オンデバイスにはAFM Core、つまり高密度構造の標準的な次世代オンデバイスモデルと、疎構造でネイティブなマルチモーダルに対応し、画像理解と表現力のある音声を可能にするAFM Core Advancedがある
Private Cloud Computeには、レイテンシとコストに最適化されたサーバー向け主力モデルのAFM Cloud、画像生成・編集用のAFM Cloud Image、複雑な推論とエージェント作業向けの最上位モデルAFM Cloud Proがある。Cloud ProはGemini最前線モデル級の品質で、AppleのPCCプライバシー保証の下、Google CloudのNVIDIA GPU上で動作する
Cloud Proを除くすべてはApple Silicon上で動くカスタムモデルで、Google Geminiによって「精製」されたという。Cloud Proについては「Gemini frontier modelsに近い品質の最も強力なモデル」とされているので、行間を読むとGeminiを包んだ形に見える
[0]: https://9to5mac.com/2026/06/…
https://machinelearning.apple.com/research/introducing-apple...
Macがあれば、これを自分で触ってみることができる
https://apfel.franzai.com/
12GB RAMのデバイスでのみ動く、より強力な版は、まだ公開されていない、似ているが少し大きいモデルだと思われる
Googleは以前、自社データセンターでハードウェアを貸し出して完全なGeminiを動かせるようにすると発表したことがある。企業がデータをGoogleデータセンターに送ることなく学習やアクセスを行えるようにするNVIDIAベースの方式だ。Private ComputeもAppleがそのような機材を大量に借りる形なのかもしれない
「Appleはこの機能を実行するためにデータを見る必要があるが、見ようと思ってもそのデータを見る方法はない」という類いの約束は不可能に見える
iOSをオープンソースで公開し、ユーザーがデバイスを制御できるようにし、推論を自分でホストして、ネットワークトラフィックがないことを確認できる必要がある。言葉どおりなら、ユーザーが自分でホストしても欠点はないはずだ
本質的には、Google AssistantやSiriが何年も前からやってきたことを、依然としてやっているように見える
ここで何が新たに得られるのか、よく分からない
同様に、Google Translateの何百万行もの手作業コードは、はるかにうまく翻訳する大規模言語モデルに完全に置き換えられた
大規模言語モデルベースのAIアシスタントは、従来のSiriが土台としていた「if-then-else」式のロジックプログラミングとはまったく異なる技術スタックであり、能力も大きく異なる
AppleがAnthropicやOpenAIではなくGoogleを提供元に選び、自ら不利な選択をしているように見えるのは奇妙だ
こうなると、Androidスマートフォンのアシスタントと差別化するのがさらに難しくなるのではないか。もっと皮肉に見れば、Googleがその気になれば、Appleに劣化版のGeminiを提供して自分たちを優位にできるのではないか。
消費者の立場では、どのスマートフォンプラットフォームを選んでも基盤は同じになり、アシスタントをまったく使わない以外に避ける方法がないので、あまりうれしくない
GoogleはAnthropicやOpenAIよりも、エッジデバイスで大規模言語モデルを動かす取り組みを多くやってきた
ソースによれば、新しいアーキテクチャはGoogleと共同開発したApple Foundation Modelsを中心としており、オンデバイスとサーバーの両方でAppleのPrivate Cloud Computeインフラを通じて動作するよう調整されているという
これは、GoogleとAppleがAppleハードウェア向けに最適化したカスタムモデル、おそらくオンデバイスモデルを学習したことを意味するのかもしれない
Geminiを実装の詳細にしてしまえば、最終的なユーザーがそれを知る必要も気にする必要もなく、後でAnthropicやOpenAIに切り替える余地を残せる。だから将来の交渉に向けたテコを作っているのだと思う
そしてAppleは、1年前にOpenAIと結んだ合意のせいで、確かにいくらか橋を焼いてしまっていたはずだ
何年もClaudeの有料契約者だったが、最近はAndroid Pixel 9の無料Geminiアプリのほうをより頻繁に使っている。回答の一部として検索をうまくやってくれるので、とても良い
モデルが新鮮で最新に感じられる。Appleがその検索機能まで統合できるかどうかは、まだ未解決の問題だ
間違っているかもしれないが、これはAppleのプライバシー保護の主張にかなり大きな打撃を与えるように見える
Appleは、外部の専門家がこうしたプライバシー保護の保証を「いつでも」検証できるとも付け加えた
Googleが大口の有料顧客のプライバシーを保護しないと思っているのか?
何年も有料のGoogle製品を問題なく使ってきたし、プライバシー保護の保証も明確だった
多くの人が、GoogleがエッジAIの面ではるかに先行していることを見落としている
GPTブーム以前からずっとこの話をしてきたし、Pixelスマートフォンには以前からリアルタイム字幕、つまり端末内の音声文字起こし機能があった
この動きは、初期のiPhoneにGoogle Mapsが搭載されていたことを思い起こさせる。
Googleと競争しながらも、そのインフラを使う構図だ。なぜOpenAIやAnthropicのような他の提供者を選ばなかったのだろうか?
ひょっとすると、OpenAIはAppleのサーバー上で自社モデルを動かすことを認めなかったのかもしれない
GoogleはバックエンドのWeb作業が得意で、AppleはGoogleのクラウドデータを受け取って優れたローカルアプリを作っていた。YouTubeアプリも同様だった。
Googleが公開前のiPhoneを見た後にAndroidの方向性を変え、もともとはBlackBerry風のハードウェアだったAndroidが現在の方向へ舵を切ったことで「熱核戦争」が始まった。Steve JobsがiPhoneをそのように見せたのも興味深い。Jobsによれば、Bill Gatesにも似たようなことがあり、それがWindows開発へとつながったからだ。
19年が過ぎた今、再び実利的にアプローチするときなのかもしれない。AppleがOS内でのこうしたAI統合をきちんと提供できなければ、ユーザーをAndroidに奪われるリスクがある。どうせモデルにコストを払うのなら、ユーザーにとって最良だと考えるものを選ぶのが正しい。既存のiPhoneユーザーを引き留められるし、同じ機能を望みつつ、より優れたプライバシー保護を求めるAndroidユーザーも取り込めるので、Appleにとっては得に見える。
この時点でGoogleではなくOpenAIに金を払うのは、ほとんど遺恨に近い。そうする理由がある可能性はあるが、この20年で経営陣はすべて入れ替わっているのだから、古い戦争を続けているようなものだ。ただし、まだ公開していないものをGoogleに見せる前には、やはり二度考えるべきだろう
Appleはすでにエコシステムを通じて皆を自社の懐に収めているのだから、台無しにしなければいい。ここでは競争要素よりも安定性を重視しているのだ
Googleの各部門は、それ自体がFortune 500企業のように動いており、自分たちの利害に従って行動する傾向がある
おそらくGoogleが最も良い条件を提示したのだろう。3位のプレイヤーなら、取扱量を増やすために利益率を犠牲にしがちだ
EUがAppleに対し、エンドユーザーが外部モデルを選べるように強制してくれたらいいのにと思う。
プライバシー優先のローカルモデルが、よく定義されたオープンプロトコルを通じてClaude、Grok、DeepSeekのような好きなモデルを呼び出せるなら素晴らしい。
これはまともなOSアーキテクチャのように聞こえる。リベート型のビジネスモデルはやめればいい
Appleにありとあらゆる恣意的なモデル対応を強制する? 滑稽なほどひどい考えだ