1 ポイント 投稿者 GN⁺ 2024-06-11 | 1件のコメント | WhatsAppで共有
  • AppleはiOS、iPadOS、macOSにChatGPTを統合し、ユーザーがアプリを行き来せずに画像・文書理解機能まで利用できるようにする
  • Siriは必要なときにChatGPTを活用し、質問・文書・写真が送信される前にユーザー確認を先に求める
  • システム全体のWriting ToolsにもChatGPTが組み込まれ、文章作成支援と多様なスタイルの画像生成を提供する
  • SiriとWriting Toolsでは、OpenAIはリクエストを保存せず、IPアドレスを隠し、アカウント連携時にはChatGPTアカウントのデータ設定が適用される
  • GPT‑4oベースの統合は今年後半にiOS、iPadOS、macOSで提供され、無料・ログイン不要での利用と、契約者向け有料機能へのアクセスの両方をサポートする

Apple体験の中に入るChatGPT

  • AppleはiOS、iPadOS、macOSのユーザー体験の中にChatGPTを統合する
    • ユーザーは別のツールへ移動せずにChatGPTの機能を利用できる
    • 統合機能には画像と文書の理解が含まれる
  • Siriは役立つ場面でChatGPTを活用する
    • 質問、文書、写真がChatGPTに送信される前に、Appleユーザーの確認を先に受ける
    • SiriはChatGPTの回答を直接表示する
  • システム全体のWriting ToolsでもChatGPTを利用できる
    • 作成中のテーマに合わせてコンテンツ生成の支援を受けられる
    • ChatGPTの画像ツールで、文章を補完するさまざまなスタイルの画像を生成できる

提供形態とプライバシー保護

  • SiriとWriting ToolsからChatGPTにアクセスする際には、プライバシー保護の仕組みが適用される
    • OpenAIはリクエストを保存しない
    • ユーザーのIPアドレスは隠される
  • ユーザーはChatGPTアカウントを連携できる
    • アカウントを連携すると、ユーザーのデータ設定がChatGPTのポリシーに従って適用される
  • 統合はGPT‑4oベースで、今年後半にiOS、iPadOS、macOSで提供される予定
    • アカウント作成なしで無料で利用できる
    • ChatGPTの契約者はアカウントを連携し、その体験内で有料機能を利用できる
  • 今回のパートナーシップは、高度なAIを誰もが利用できるようにするというOpenAIのミッションと重なる

1件のコメント

 
GN⁺ 2024-06-11
Hacker Newsの意見
  • これは初期iOSのFacebook/Twitter統合に近い感じだ。数年しか続かなかった機能だった。
    Appleは今のところ専用の大規模言語モデルサービスが必要だと見ているようだが、主要な機能のかなりの部分は自前で処理し、OpenAIの利用には明示的な同意を求めている。他のモデルも追加すると言っているのを見ると、OpenAIを部分的に汎用品のように見ているようで、10年契約のようには感じられない

    • 同意する。今は得があるから使うだろうが、3年くらい経てばOpenAIはデータプライバシーを十分に守っていないと公に批判しながら、前から何の関係もなかったかのように振る舞いそうだ
    • 3〜5年以内に、数多くのAIボックスや入力欄の横でAIを呼び出すきらきらしたアイコンは静かに消えていく気がする。
      大規模言語モデルは正確ではなく、誤差5%以内で当てる分野の専門家でもない。人々も次第にそれに気づくだろうし、モデルを最新の状態に保って運用するコストも急激には下がらない可能性が高く、結局はバブルがしぼむ気がする
    • 直感的には、Appleが望むユーザー体験を実現するための暫定策に見える。
      Appleの最終目標は、できるだけ多くのAI機能をオンデバイスへ移すことだろう
    • Sam AltmanもOpenAIも気に入らない点は多いが、OpenAIがGoogleとAppleを完全に追い抜き、兆ドル規模の企業がスタートアップに追いつこうとしている姿は本当に驚きだ。
      こういうことがもっと増えてほしい。ビッグテックは長い間、イノベーションを妨げてきた
    • 同意しない。これは長年続いているSafariのGoogle提携の方に近く見える。
      ただし今回は、大きな小切手を受け取るのはOpenAIの方になりそうだ
  • GPT-4oへのアクセスは便利な機能だが、本当に聞きたかったのはSiriの言語理解が改善されたのかという点だった。
    今回のWWDC発表では、Siriが文脈を維持し、「彼女のフライト到着時刻をカレンダーに追加して」のような依頼で「彼女」が誰なのかを理解する例が少し示された。しかし日常では、Siriは大規模言語モデル級の言語理解能力を持っておらず、依然として決まった文句に合わせた巧妙なEliza的ハックのように感じられる。「スキップしろと言った曲の直前に流れていた曲を再生して」のような依頼はGPT-4oなら簡単に処理できるが、Siriは理解できないように見えた。Siriの基盤言語モデルがどの程度アップグレードされるのか気になる

    • 今の音声アシスタントで最大のいら立ちポイントはまさにここだ。幸い、複雑だったり曖昧だったりする依頼を解釈する技術は、すでにChatGPTで実現されている。
      Appleも天気を尋ねながら発表者が文の途中で言い直すデモをしていた気がするし、ユーザーの依頼の意図を解釈するために大規模言語モデルを組み込んだというシグナルであってほしい
    • 既存の音声アシスタントは全体的にどれもひどい。Siriがどうであれ、Google Assistantはもっと悪い。
      一方でここ数か月のChatGPTアプリは、騒がしい環境でも自然に話せば音声を5%未満の誤りでテキスト化し、文字起こしに誤りがあっても実際の意図を正しく理解していた。はるかに良い音声アシスタントを作るには、GPT-4にスマホ上で実行可能な関数仕様を与えてOSと統合すればいいはずなのに、なぜどの会社もまともにやっていないのか不思議だ。OpenAIがChatGPTアプリをその方向に拡張していないのも不可解だ
    • Cortanaもこういう文脈処理をしていなかったかと思う。2024年にこの程度ではかなり物足りない
    • Appleのキーノートでは、既存のSiriモデルに文脈機能を無理やり継ぎ足すのではなく、SiriがApple Intelligenceベースへ大きく更新されるように聞こえた。
      新しい音声文字起こし機能、話している途中で自分で言い直せる能力、個人的文脈への深い理解などに触れていた。生成AIモデルを写真分類のようなものまでより広く適用する大規模アップデートのように見えるが、実際は様子を見る必要がある
    • Appleはかなり前からこういうことができると主張してきた。今のところ、あまり信じる気にはなれない
  • これは自分が望んでいたものにほぼ正確に一致している。車の中でSiriに聞きたいのに処理できない質問がたくさんあった。
    たとえば「今どの州にいて、次の州境までどれくらいあって、通過する各州でセルフ給油できるのか?」のような質問だ。ただ、これはある程度Google Mapsから情報を引き出せるかどうかにかかっている

    • その大部分はChatGPTではなくApple Intelligenceを通ることになりそうだ。
      Apple Intelligenceは現在地や予定のような情報を考慮して、よりローカルでパーソナライズされた形で動作すると言っていた。アプリが「意図」を提供するAPIがあり、Siriがそれをつないで「最寄りのガソリンスタンドのガソリン価格」のような依頼を処理できる。キーノートを見る限り、この部分はOpenAIではない
    • 現在のCarPlayのSiri機能はかなり制限されている。CarPlayでなければ答えられる、より複雑な質問にも、しばしば答えない
    • 「今どの州にいて、次の州境までどれくらいあって、通過する各州でセルフ給油できるのか?」が必要になる旅行ってどんな旅行なのか気になる。
      たいていは「今いる場所はどこ?」「地図を見せて」「セルフ給油が禁止されている州はどこ?」のように言い換えられたのではないかと思う
    • 給油員が代わりに入れる決まりがある州はOregonだけだと思っていた
    • もちろん、これはApple Mapsを使っているときにしか動かないだろう
  • OpenAIを、すべてのユーザーに無料で提供されるシステム全体のサードパーティ依存として統合するというのは、規模と技術の両面でOpenAIの成熟度をかなり信頼しているという興味深いシグナルだ

    • 「興味深い」がまさにぴったりの表現だ。OpenAIの安定性は普通の2人スタートアップよりひどいことも多いが、機械学習の品質はそれだけ優れている
  • OpenAIは物議を醸す企業で、ブランド整合性の面ではAnthropicのようなより良く見える競合もある。だからこの契約は奇妙に感じる

    • OpenAI/ChatGPTはAIで唯一一般大衆に知られている名前だ
      たとえAnthropicが10倍優れていても、顧客や公開市場の投資家にとっては「ChatGPT」という名前ほど重要ではないかもしれない。Googleが検索で勝ったのは、しばらく最高の検索エンジンだったからだけではなく、終わりのないメディア報道によってブランドが日常的な動詞のように定着したからでもある。「ChatGPTに聞いてみて」は、AI版の「Googleで検索してみて」として定着する可能性が高く、OpenAIを巡るメディアの論争もその地位をさらに強固にするだけだ
    • Anthropicのモデルはこうした作業にはむしろ優れているので、なおさら奇妙だ。Claudeの応答はほとんど常にGPT-4より良いと感じる
      GPT-4は望んでいない内容を冗長に並べ立てるので使わなくなった。Claude 3は人が返しそうな情報に近い答え方をし、不要なたわごとが少ないので、より人間らしく感じる。今年末のリリース時点でどのモデルが最高かも分からないし、オープンソースモデルがGPT-4にどれほど速く追いついたかも見てきたのに、なぜ1社のモデルにだけ賭けるのか分からない
    • OpenAIには特別に高い価値を持つ資産があるようには見えない。今は流入を確保するために店ごと差し出している状態で、この持続不可能なゲームは近いうちに悪い形で終わりそうだ
  • AppleがOpenAIにこれほど依存していないことに驚いた。実際に有用そうに見える印象的な統合の大半は、オンデバイスまたはAppleのプライベートクラウドで動いている
    OpenAIのChatGPTは、ユーザーが許可したときに「Google的な質問」に答えるSiriの片隅へ押しやられたように感じる。アーキテクチャにおいてもっと大きな比重を占められなかったのはOpenAIにとって損に見えるし、個人的にはありがたい

    • 同意する。事前のうわさでは、AppleとOpenAIがほとんど合併でもするかのように聞こえていた
      実際には、iPhoneで最新モデルにアクセスできると言うための体裁合わせのように感じられた。個人的には、エコシステムとの深い統合と、意味ベースのインデックスのほうがはるかに興味深い
  • いまだにこういうものを望んでいる人を一人も知らない。ウェブブラウザにも、メールクライアントにも、スマートフォンにもAIが入ってくるのは望まない
    周りに聞いてもみんなだいたい同じように同意している感じで、いったい誰のためのものなのか分からない

    • 子どもに聞かせる童謡を別の言語に翻訳しつつ、韻律と意味をおおむね保つのには役立った
      GPT-3ではいまひとつだったが、4o、あるいは最新モデルはその作業を本当にうまくこなす。基本的に「あるもののスタイルを別のものに移す」作業に強い。ただし、Googleで見つからなかった事実を尋ねると、いつも笑ってしまうほど間違っていた
    • 簡単な依頼を安定して処理する仮想アシスタントは実際に欲しい
      ただ、これまでのところ企業はまだ方向性を探っている段階に見え、壁に何でも投げて何がくっつくかを見ている最中のようだ。2〜3年後くらいに整理されて、すばらしい仮想アシスタントが手に入るといい
    • とても同意する。これまで生成されたものはどれも非常に凡庸だった
      正当なユースケースはいくつかあるかもしれないが、いつものように皆が十分に考えないまま過剰に突っ走っているように思える
    • 私は欲しい。一日中、自分が書いたテキストを大規模言語モデルに入れて編集支援を受けている
      ブレインストーミングや調査を始めるときにも、ChatGPTを音声モードで開いて話しながら、同時にブラウザを開いて出力内容をファクトチェックしている
    • これで何人かは知っていることになる。「先週の面接の件でメールを送ってきた人の名前、何だったっけ?」のようなことをスマートフォンに尋ねられるなら便利だと思う
      頭の中の文脈を失わないためにメールを掘り返さなくて済むからだ
  • これは良さそうに見えるが、実はOpenAIにとって存立に関わる脅威になり得る
    単一の超大口顧客がいると、その顧客が事業に対して過大な力を持つことになる。Appleはいずれ単に金を払わないと言い出すこともできるし、訴訟が何年かかっても耐えられる余力がある。Benjamin MooreがHome DepotやLowe’sに売らず、自社店舗を維持しているのも、大口顧客が条件を押しつけられるからだ。Appleは機械学習処理を高速化するために独自チップまで設計しており、OpenAIとの提携は明らかに暫定策だ。機会があればOpenAIを弱体化させ、可能になれば置き換えるだろう。Appleは中核機能をパートナーに依存するのを嫌うので、Google Mapsを捨てて、まだ劣勢のApple Mapsに移行したし、Google Searchを置き換えられないのはGoogleが莫大な金を払っており、Appleがまだ代替に失敗しているからだ。OpenAIには良い一手に見えるが、キツネを鶏小屋に入れたようなものだ

    • 今言ったことのどれか一つでも引用できる根拠はあるのか?
      Appleが費用を払わず訴訟で持ちこたえるというなら、OpenAIとMicrosoftも同じことができるし、MicrosoftはAppleを傷つけられるなら喜ぶだろう。Appleが利用している供給業者にそんなふうに振る舞った前例もない。Benjamin Mooreの話も、Home Depotには自社ブランドのBehrがあり、Behrの各色ごとにどのBenjamin Mooreの色をまねたかを明示して代替品として売上を奪っているからだ。Apple Mapsが「まだ劣勢」だというのも、どう定義しているのか、1日にApple Mapsを何回使うのか、両サービスを比較したベンチマークがあるのか気になる
    • OpenAIにはすでに「単一の超大口顧客」がいた。Microsoftのことだ
      むしろAppleとの契約は、OpenAIが事実上Microsoftの子会社ではないことを示す最初のシグナルだ
    • Appleは現在、コンピューティングプラットフォームにAIを可能な限り早く統合しようと突き進んでいる
      OpenAIは、十分に賢いAI、つまりAGIやASIが、はるかに大きな問題を解決するか、事実上まったく新しいコンピューティングプラットフォームを生み出すと信じているはずだ。実際、現在の不完全な大規模言語モデルであるChatGPTでさえ、ほとんどそれ自体がコンピューティングプラットフォームのように見える。Appleは、人々がアプリや魅力的なデバイスなしでエージェントとやり取りする方法に慣れていく速度を高めている。もしAIが本当に十分によくなれば、10〜15年後に誰がAppleを必要とするのか分からない
  • 「SiriとWriting ToolsからChatGPTにアクセスする際にはプライバシー保護が組み込まれており、リクエストはOpenAIに保存されず、ユーザーのIPアドレスは隠される。ユーザーはChatGPTアカウントを連携することもでき、この場合データ設定はChatGPTのポリシーに従う」という記述がある
    だとすると、基本的に一般のAppleユーザーのChatGPTリクエストはOpenAIの学習には使われないが、有料のChatGPT Plus顧客のものは使われ得るという意味なのだろうか? ChatGPT Plusアカウントを連携すると、自分のデータが学習に使われるという意味なのかも気になる。提携で流入したユーザーより有料顧客のほうがプライバシー基準が低いように見えるのは奇妙に感じる。もちろん、「Temporary Chat」機能やメモリの無効化で学習利用を防げることは知っている

    • アカウント設定で、OpenAIがチャットデータを学習に使えないよう恒久的にオフにできる
      「モデル学習を無効にするには、ページ左下のプロフィールアイコンから Settings > Data Controls に移動し、『Improve the model for everyone』をオフにすればよい。この設定がオフになっている場合、新しい会話はモデル学習に使用されない」