Apple、オンデバイスおよびクラウドAIモデルを大幅更新し、新しい開発者APIを公開

(deeplearning.ai)

4 ポイント投稿者 GN⁺ 2025-06-26 | まだコメントはありません。 | WhatsAppで共有

Appleがビジョン・言語AIモデル（AFM, Apple Foundation Models）と**開発者向けFoundation Modelsフレームワーク（API）**を新たに公開し、オンデバイス・クラウドモデルの両方で性能と効率を大きく改善
AFMオンデバイスモデルは30億パラメータのトランスフォーマーと3億パラメータのビジョントランスフォーマーで構成され、テキスト・画像入力および多言語・ビジョン機能をサポート。サーバーモデルにはカスタムMoEアーキテクチャを適用
モデル軽量化（量子化およびLoRA）、15言語対応、画像理解、ツール使用など強力な機能と開発者アクセス性を提供
オンデバイスモデルは米国外英語・画像理解で競合モデルより強みを見せた一方、サーバーモデルはGPT-4oなど最新モデルと比べて性能が見劣りする
最近議論を呼んだAppleの論文、Siri AIアップグレードの遅延など、AppleのAI戦略転換とiOSエコシステム内での影響力に注目が集まっている

Apple Foundation Models（AFM）の大規模アップデート

Appleはオンデバイス（モバイル搭載型）とサーバーホスティング型AIモデル（AFM）の両方をアップグレードし、速度・効率・性能を大幅に改善した
開発者API（Foundation Models framework）を新たに提供し、Apple Intelligence機能が有効化されたデバイスでオンデバイスAIの呼び出しが可能になった

入出力: テキスト、画像（最大65,000トークン入力）、出力はテキスト
アーキテクチャ:
- AFM-on-Device: 30億パラメータのトランスフォーマー、3億パラメータのビジョントランスフォーマー
- AFM-Server: カスタムMixture-of-Experts（MoE）トランスフォーマー（パラメータ数非公開）、10億パラメータのビジョントランスフォーマー
性能: 米国外英語・画像理解に強み
可用性: AFM-on-DeviceはFoundation Modelsフレームワークで利用可能。AFM-Serverは一般公開されていない
15言語対応、ツール使用などを提供
未公開情報: サーバーモデルのパラメータ数、トークン制限、学習データセットの詳細などは非公開

量子化（Quantization）:
- オンデバイスモデルは大半の重みを2ビット、埋め込み層を4ビットに圧縮（量子化認識学習を活用）
- サーバーモデルはASTC（グラフィックス向け圧縮）を適用し、平均3.56ビット（埋め込み4ビット）に圧縮
LoRAアダプターで圧縮に伴う性能低下を補い、要約・校正・質疑応答など特定業務向けに適応
カスタムMoEアーキテクチャによりハードウェア間通信オーバーヘッドを最小化し、効率を向上