1 ポイント 投稿者 GN⁺ 4 시간 전 | 1件のコメント | WhatsAppで共有
  • Apple Intelligenceが、Googleと共同開発したApple Foundation Modelsを基盤とする新しいアーキテクチャへ刷新
  • 新モデルはGemini系の技術を土台としており、デバイス上での実行とPrivate Cloud Computeサーバー上での実行の両方に合わせて調整
  • アップグレードされたモデルは、画像理解・生成、リアルな画像生成、高度な写真編集、視覚的質問応答をサポート
  • 一部のデバイスには、音声生成、ディクテーション精度の改善、より強力な自然言語理解を提供する高性能モデルが提供されるが、対象デバイスは明示されていない
  • Appleは、ユーザーデータはその場のリクエスト実行にのみ使われ、Appleや第三者がアクセスできず、外部の専門家がプライバシー保護の保証をいつでも検証できると説明

Apple Intelligenceアーキテクチャ刷新

  • AppleはApple Intelligenceプラットフォームの大規模な刷新を発表し、Gemini系の技術を使ってGoogleと共同開発した基盤モデルベースの新しいアーキテクチャを公開
  • 新アーキテクチャの中心はGoogleと共同開発したApple Foundation Modelsで、Appleはこのモデルがデバイス上の処理とPrivate Cloud Computeサーバー上での実行の両方に合わせて調整されていると説明
  • AppleはGoogleとの協業を「深い」協業と表現し、Apple Intelligenceに「大規模なアップグレード」をもたらすと述べた
  • 新モデルは、最新の理解・推論機能と、画像理解および生成を含むマルチモーダル対応を提供

新モデルの機能

  • アップグレードされたモデルは、リアルな画像生成、高度な写真編集、視覚的質問応答を含む新たなユースケースをサポート
  • 一部のデバイスは追加機能を備えた高性能モデル版を受け取る
  • 高性能モデル版は、音声生成、ディクテーション精度の改善、より強力な自然言語理解を提供
  • Appleは、どのデバイスが高性能モデルの対象かを明示していない

システムオーケストレーター

  • 刷新されたアーキテクチャの中心には、新しいシステムオーケストレーターが配置される
  • システムオーケストレーターは、Appleプラットフォーム全体でApple Intelligence機能を安全に調整する
  • Appleは、オーケストレーターがアクティブなアプリとユーザーの現在の作業に応じて応答をパーソナライズできると説明
  • この構造により、Appleが「真のシステム全体の知能」と表現する機能が可能になる

プライバシー保護へのアプローチ

  • Appleは、競合他社がユーザーを考慮せずに「先走っている」と表現し、自社のアプローチと対比
  • Apple Intelligenceは、デバイス上の処理とPrivate Cloud Computeに依存
  • ユーザーデータはその場のリクエスト実行にのみ使用され、Appleや第三者がアクセスできないという約束が維持される
  • Appleは、外部の専門家がこうしたプライバシー保護の保証を「いつでも」検証できると付け加えた

1件のコメント

 
GN⁺ 4 시간 전
Hacker Newsの意見
  • AIに追いつくやり方がかなりAppleらしいと思う。外部ツールをプライバシー保護アーキテクチャで包み、OSに組み込み、オーケストレーション層を製品化する形だ
    Private Cloud Computeとオンデバイスのルーティングによって、サードパーティモデルの機能が、ユーザーのコンテキストを漏らさずにファーストパーティシステムのように感じられるかどうかが興味深い
    AppleがGoogle-Apple間の境界をうまく処理できれば洗練された動きになるが、そうでなければGeminiの上にプライバシー保護をきれいに塗ったApple Intelligenceのフロントエンドのように感じられるだろう

    • 実運用で意味のあるGoogle-Apple境界はあるのか? Appleが独自のGeminiモデルを蒸留して、自社データセンター、あるいは少なくともAppleが管理するデータセンターで動かす権利を買うのなら、Googleが運用統制権を持つインフラではないように思える
    • Androidは使っていないが、アプリの中に深く統合される部分をかなり見せていて、そこに本当の魔法があると思う
      今のサードパーティ製チャットボットではそうした統合はできないし、仮にできたとしても、そのレベルのアクセス権限を他社に任せるのは難しい
    • Gemini向けのプライバシー保護フロントエンドなら使ってみたい
      強力なプライバシー保証がある方が望ましいが、それでも悪くない方向性だ
    • 実際の使用感が気になる。前述のようにコンテキスト漏えいがあるのか、レイテンシが増えるのか、価格への影響があるのか、などだ
      小型モデルを含めてさまざまな要素を検討しただろうが、コストも大きな悩みだったはずで、Googleはこれほど多くの無料AI推論を提供している唯一の事業者のように感じる
      この変化は、消費者や従業員がAIサービスのコストをいつどのように支払うのかをさらに曖昧にするだろう。たとえば発表ではコーディングではない消費者向け作業を見せていたが、5つのファイルを選んでSiriにPythonスクリプトや小さなアプリを書かせることはできるのだろうか? 企業はSiriのAI機能を単に無効化するのか、それとも独自のAI監査体制や提供事業者へルーティングできるのか?
    • AppleがAIをプライバシー保護アーキテクチャで包むと言っても、CarPlayを使うにはSiriを有効にしなければならない
  • Apple Intelligenceを実際に何が動かしているのか、もっと知りたい。独自プロンプトの裏でGeminiフラッグシップモデルを使っているのか、微調整なのか、Geminiベースで独自モデルを事前学習したのかが気になる
    GeminiベースのモデルとApple Foundation Modelsの間に意味のある違いがあるのかも知りたい。その違いがオンデバイスモデルとホスティングモデルで変わるのか、一部のモデルはAppleのPrivate Cloud Computeで動き、一部はGoogleの機材で動くのかも曖昧だ
    その後の“keynote tech-talk”でかなり詳しく説明している: [0]
    Appleによればモデルは5つある。オンデバイスにはAFM Core、つまり高密度構造の標準的な次世代オンデバイスモデルと、疎構造でネイティブなマルチモーダルに対応し、画像理解と表現力のある音声を可能にするAFM Core Advancedがある
    Private Cloud Computeには、レイテンシとコストに最適化されたサーバー向け主力モデルのAFM Cloud、画像生成・編集用のAFM Cloud Image、複雑な推論とエージェント作業向けの最上位モデルAFM Cloud Proがある。Cloud ProはGemini最前線モデル級の品質で、AppleのPCCプライバシー保証の下、Google CloudのNVIDIA GPU上で動作する
    Cloud Proを除くすべてはApple Silicon上で動くカスタムモデルで、Google Geminiによって「精製」されたという。Cloud Proについては「Gemini frontier modelsに近い品質の最も強力なモデル」とされているので、行間を読むとGeminiを包んだ形に見える
    [0]: https://9to5mac.com/2026/06/…

    • 現在Apple Intelligenceを動かしているのは3B Apple Foundationモデル
      https://machinelearning.apple.com/research/introducing-apple...
      Macがあれば、これを自分で触ってみることができる
      https://apfel.franzai.com/
    • ローカルモデルは、いまGoogle Edge GalleryのiOS・Androidアプリで入手できるGemma e4bに近い可能性が高い
      12GB RAMのデバイスでのみ動く、より強力な版は、まだ公開されていない、似ているが少し大きいモデルだと思われる
      Googleは以前、自社データセンターでハードウェアを貸し出して完全なGeminiを動かせるようにすると発表したことがある。企業がデータをGoogleデータセンターに送ることなく学習やアクセスを行えるようにするNVIDIAベースの方式だ。Private ComputeもAppleがそのような機材を大量に借りる形なのかもしれない
    • 正しく読めているなら、選ばれたクラウド事業者が自社ハードウェア上でPCCスタックを動かし、コンピューティング提供者がプライバシー保証を守る責任を負う構造なのか? だとすると、潜在的なセキュリティ攻撃面はより広がりそうだ
    • Gemini、少なくとも公開無料版はハルシネーションが多すぎる。そのレベルならAppleにとって非常に悪い結果になりかねない
  • 「Appleはこの機能を実行するためにデータを見る必要があるが、見ようと思ってもそのデータを見る方法はない」という類いの約束は不可能に見える
    iOSをオープンソースで公開し、ユーザーがデバイスを制御できるようにし、推論を自分でホストして、ネットワークトラフィックがないことを確認できる必要がある。言葉どおりなら、ユーザーが自分でホストしても欠点はないはずだ

  • 本質的には、Google AssistantやSiriが何年も前からやってきたことを、依然としてやっているように見える
    ここで何が新たに得られるのか、よく分からない

    • テキスト入力をもとに画像を作るという理由だけで、Google Image SearchとGoogle Nano Bananaが「同じもの」だと見る場合にだけ、そう言える
      同様に、Google Translateの何百万行もの手作業コードは、はるかにうまく翻訳する大規模言語モデルに完全に置き換えられた
      大規模言語モデルベースのAIアシスタントは、従来のSiriが土台としていた「if-then-else」式のロジックプログラミングとはまったく異なる技術スタックであり、能力も大きく異なる
  • AppleがAnthropicやOpenAIではなくGoogleを提供元に選び、自ら不利な選択をしているように見えるのは奇妙だ
    こうなると、Androidスマートフォンのアシスタントと差別化するのがさらに難しくなるのではないか。もっと皮肉に見れば、Googleがその気になれば、Appleに劣化版のGeminiを提供して自分たちを優位にできるのではないか。
    消費者の立場では、どのスマートフォンプラットフォームを選んでも基盤は同じになり、アシスタントをまったく使わない以外に避ける方法がないので、あまりうれしくない

    • **99.9%**の「Apple Intelligence」タスクでは、Googleのモデルは他の最前線ラボのモデルと同じくらいうまくやると思う
      GoogleはAnthropicやOpenAIよりも、エッジデバイスで大規模言語モデルを動かす取り組みを多くやってきた
      ソースによれば、新しいアーキテクチャはGoogleと共同開発したApple Foundation Modelsを中心としており、オンデバイスとサーバーの両方でAppleのPrivate Cloud Computeインフラを通じて動作するよう調整されているという
      これは、GoogleとAppleがAppleハードウェア向けに最適化したカスタムモデル、おそらくオンデバイスモデルを学習したことを意味するのかもしれない
    • 別の見方をしている。Appleはモデルをコモディティとして扱うことにしたようだ
      Geminiを実装の詳細にしてしまえば、最終的なユーザーがそれを知る必要も気にする必要もなく、後でAnthropicやOpenAIに切り替える余地を残せる。だから将来の交渉に向けたテコを作っているのだと思う
    • 嵐が始まったとき、AnthropicやOpenAIよりGoogleのほうが長く持ちこたえると見て、安定性を選んだ可能性がある
    • AppleがGoogle検索エンジンをデフォルトにしているのと、そこまで違うだろうか?
    • Appleがこの決定を下した当時は、Google、Anthropic、OpenAIの間のモデル品質の差は今ほど大きくなかった
      そしてAppleは、1年前にOpenAIと結んだ合意のせいで、確かにいくらか橋を焼いてしまっていたはずだ
  • 何年もClaudeの有料契約者だったが、最近はAndroid Pixel 9の無料Geminiアプリのほうをより頻繁に使っている。回答の一部として検索をうまくやってくれるので、とても良い
    モデルが新鮮で最新に感じられる。Appleがその検索機能まで統合できるかどうかは、まだ未解決の問題だ

  • 間違っているかもしれないが、これはAppleのプライバシー保護の主張にかなり大きな打撃を与えるように見える

    • Apple Intelligenceはオンデバイス処理とPrivate Cloud Computeに依存しており、ユーザーデータは即時のリクエスト実行のためにのみ使われ、Appleや第三者がアクセスすることはできないと、あらためて強調していた
      Appleは、外部の専門家がこうしたプライバシー保護の保証を「いつでも」検証できるとも付け加えた
    • そうは見ない。Appleサーバー上で実行するか、将来的にはプライバシー保護の保証のもとでGoogleサーバー上で実行することになる
      Googleが大口の有料顧客のプライバシーを保護しないと思っているのか?
      何年も有料のGoogle製品を問題なく使ってきたし、プライバシー保護の保証も明確だった
  • 多くの人が、GoogleがエッジAIの面ではるかに先行していることを見落としている
    GPTブーム以前からずっとこの話をしてきたし、Pixelスマートフォンには以前からリアルタイム字幕、つまり端末内の音声文字起こし機能があった

    • Appleは2017年からNeural Engineを搭載したiPhoneを出荷してきた
    • Googleのオフライン、つまりオンデバイスAIの提供は、どれほど優れているのか?
  • この動きは、初期のiPhoneにGoogle Mapsが搭載されていたことを思い起こさせる。
    Googleと競争しながらも、そのインフラを使う構図だ。なぜOpenAIやAnthropicのような他の提供者を選ばなかったのだろうか?

    • 当初はSiri向けにOpenAIを選んでいて、その取引が破談になったのだから、OpenAIとの関係で何か問題が起きたのだろうと思う。
      ひょっとすると、OpenAIはAppleのサーバー上で自社モデルを動かすことを認めなかったのかもしれない
    • 公平に言えば、初期のiPhone当時は競争関係ではなかった。
      GoogleはバックエンドのWeb作業が得意で、AppleはGoogleのクラウドデータを受け取って優れたローカルアプリを作っていた。YouTubeアプリも同様だった。
      Googleが公開前のiPhoneを見た後にAndroidの方向性を変え、もともとはBlackBerry風のハードウェアだったAndroidが現在の方向へ舵を切ったことで「熱核戦争」が始まった。Steve JobsがiPhoneをそのように見せたのも興味深い。Jobsによれば、Bill Gatesにも似たようなことがあり、それがWindows開発へとつながったからだ。
      19年が過ぎた今、再び実利的にアプローチするときなのかもしれない。AppleがOS内でのこうしたAI統合をきちんと提供できなければ、ユーザーをAndroidに奪われるリスクがある。どうせモデルにコストを払うのなら、ユーザーにとって最良だと考えるものを選ぶのが正しい。既存のiPhoneユーザーを引き留められるし、同じ機能を望みつつ、より優れたプライバシー保護を求めるAndroidユーザーも取り込めるので、Appleにとっては得に見える。
      この時点でGoogleではなくOpenAIに金を払うのは、ほとんど遺恨に近い。そうする理由がある可能性はあるが、この20年で経営陣はすべて入れ替わっているのだから、古い戦争を続けているようなものだ。ただし、まだ公開していないものをGoogleに見せる前には、やはり二度考えるべきだろう
    • OpenAIやAnthropicは、Googleほど資金力があるわけではない。
      Appleはすでにエコシステムを通じて皆を自社の懐に収めているのだから、台無しにしなければいい。ここでは競争要素よりも安定性を重視しているのだ
    • Googleは一貫した水平統合企業というより、コングロマリットに近い。
      Googleの各部門は、それ自体がFortune 500企業のように動いており、自分たちの利害に従って行動する傾向がある
    • ほぼすべてのビッグテックは、ある領域では競争し、別の領域では協力している。
      おそらくGoogleが最も良い条件を提示したのだろう。3位のプレイヤーなら、取扱量を増やすために利益率を犠牲にしがちだ
  • EUがAppleに対し、エンドユーザーが外部モデルを選べるように強制してくれたらいいのにと思う。
    プライバシー優先のローカルモデルが、よく定義されたオープンプロトコルを通じてClaude、Grok、DeepSeekのような好きなモデルを呼び出せるなら素晴らしい。
    これはまともなOSアーキテクチャのように聞こえる。リベート型のビジネスモデルはやめればいい

    • AppleはこれをEUでは提供しない
    • そうならないほうがよいし、EU規制当局が非EU諸国の製品について製品設計を思いのままに指図できるという幻想に加担する必要もない。
      Appleにありとあらゆる恣意的なモデル対応を強制する? 滑稽なほどひどい考えだ