1 ポイント 投稿者 GN⁺ 1 시간 전 | 1件のコメント | WhatsAppで共有
  • ChatGPTのデフォルトモデル Instant が GPT‑5.3 Instant から GPT‑5.5 Instant に更新され、すべてのユーザーに順次提供される。より正確で簡潔、かつパーソナライズされた回答を目指す
  • OpenAIの内部評価では、GPT‑5.5 Instant は医療・法律・金融のような高リスクなプロンプトにおける 幻覚的な主張 を GPT‑5.3 Instant より 52.5%削減し、ユーザーが事実誤認として報告した難しい会話での不正確な主張も 37.3%減少
  • 写真・画像アップロードの分析、STEM関連の質問、Web検索を使うべきかの判断、視覚的推論・数学・科学の評価で改善され、数学の例では項の移項ミスを見つけて x = (3 + √33) / 2 に到達
  • GPT‑5.5 Instant は要点を保ちながら 短く集中した回答 を出すように変更され、冗長さ、過剰な書式設定、不要な追質問、不要な絵文字の使用を減らす
  • 過去のチャット、ファイル、接続された Gmail の文脈をよりうまく活用してパーソナライズし、新しい memory sources 機能により、回答に使われた保存メモリや過去チャットの一部を確認・削除・修正できる

更新範囲と応答の方向性

  • ChatGPTのデフォルトモデル Instant は GPT‑5.3 Instant から GPT‑5.5 Instant に切り替わり、すべてのユーザーに提供される
  • Instant は毎日数億人が使うモデルであり、小さな改善でも日常的なインタラクションの有用性と満足度に大きな影響を与える
  • 今回のアップデートでは、さまざまなトピックでより強力かつ凝縮された回答、より自然な会話トーン、そしてパーソナライズが有効な場面では、ユーザーがすでに共有した文脈をより適切に活用する方向へ変化した

正確性と推論の改善

  • GPT‑5.5 Instant は全体的な事実性が向上し、正確さが重要な領域で最も大きな改善を示した
  • OpenAI内部評価 では、GPT‑5.5 Instant は医療、法律、金融のような高リスクなプロンプトにおいて、GPT‑5.3 Instant より幻覚的な主張を 52.5%少なく生成した
  • ユーザーが事実誤認として指摘した特に難しい会話では、不正確な主張を 37.3%削減
  • 日常的な作業全般でもより有能なモデルへと改善されており、写真や画像アップロードの分析、STEM関連の質問への応答、より有用な答えのためにいつWeb検索を使うべきかを判断する能力が向上
  • 視覚的推論、数学、科学の評価でも改善が見られる

数学回答の例

  • GPT‑5.3 Instant の応答

    • ユーザーが解法が正しいか尋ねた平方根方程式の例で、GPT‑5.3 Instant は最初、平方、展開、因数分解、定義域の確認は正しいと答えた
    • その後 x = 3 を元の式に代入すると √10 ≠ 2 であることを確認し、平方の過程で生じた余分な解だと判断した
    • しかし、誤った結論である 実数解はない で終わってしまい、実際の代数的な誤りを再追跡できなかった
  • GPT‑5.5 Instant の応答

    • GPT‑5.5 Instant も最初はユーザーの解法を正しいと認めるが、x = 3 を元の式に代入して √10 ≠ 2 という誤りを見つける
    • 続いて、問題の原因が余分な解だけではなく移項ミスでもあることを突き止め、x + 7 = (x - 1)^2 から 0 = x^2 - 3x - 6 になるべきだと訂正する
    • 二次方程式の公式で x = (3 ± √33) / 2 を求めた後、x ≥ 1 の条件に従って有効な解を (3 + √33) / 2 と提示する
    • GPT‑5.5 Instant の回答は、初期のミスから立て直して実際の代数的誤りを見つけ、正しい解にまで到達している

より簡潔なコミュニケーション

  • GPT‑5.5 Instant は、要点を失わずにより 短く集中した回答 を提供するよう変更された
  • ChatGPTを使いやすくする温かみや個性は維持しつつ、以前のモデルより同じ情報をより有用に伝え、冗長さと過剰な書式を減らしている
  • 不要な追質問を減らし、不要な絵文字のように応答を雑然とさせる要素を避ける
  • 職場の同僚にもっと簡潔に話してほしいと伝える方法を尋ねる例では、GPT‑5.5 Instant は GPT‑5.3 Instant と比べて単語数を 30.2%、行数を 29.2%少なく使用した
  • GPT‑5.5 Instant は、くだけすぎず実用的で、職場で使っても安全なトーンを維持しつつ、状況別の文例を提供し、問題を同僚の性格ではなく境界設定として扱う
  • GPT‑5.3 Instant は「やってはいけないこと」セクションまであり、より完全ではあるものの、カジュアルな助言を求めるプロンプトに対しては構成や磨き込みがやや過剰な回答になっている

パーソナライズと制御

  • Instant は、過去のチャット、ファイル、接続された Gmail の文脈をより効果的に活用し、回答をより個別に最適化する
  • 追加のパーソナライズが応答を改善できるタイミングを賢く判断し、過去の会話をより素早く検索して適切な文脈を見つけ、ユーザーが同じ内容を繰り返さなくて済むようにする
  • カスタム提案や計画を受け取るとき、あるいは進行中の作業を続けるときに特に有用
  • 車を勧めてほしいという例では、GPT‑5.3 Instant はユーザーが San Francisco にいる点を反映して、全体的な場所ベースの推薦を行った
  • GPT‑5.5 Instant は、ユーザーが Asha Tea House によく行き、甘みの強い boba よりもすっきりした Taiwanese/high-mountain tea を好むという過去の文脈を活用し、Ceré Tea、Song Tea & Ceramics、Tea Rex Cafe & Specialty Teas、Stonemill Matcha をより精緻に推薦した

memory sources

  • すべてのChatGPTモデルに memory sources が導入され、応答のパーソナライズにどの文脈が使われたかを確認できる新しい制御機能が提供される
  • 応答がパーソナライズされると、保存されたメモリや過去のチャットなど、どの文脈が使われたかを確認でき、古くなった、またはもはや関連しない内容は削除または修正できる
  • 共有したチャットでは、memory sources は他の人には表示されない
  • ユーザーは、今後引用されたくないチャットを削除したり、設定で保存済みメモリ項目を削除・変更したり、メモリを使用または更新しない一時チャットを使ったりできる
  • memory sources はパーソナライズをより理解しやすくするための機能だが、回答に影響したすべての要素を常に表示するとは限らない
  • sources には、検索・参照されたすべての過去チャットではなく、最も関連性の高いいくつかの過去チャットだけが表示される場合があり、この表示は今後さらに包括的に改善される予定

提供スケジュール

  • GPT‑5.5 Instant は本日からすべてのChatGPTユーザーに順次展開され、GPT‑5.3 Instant をデフォルトモデルとして置き換える
  • APIでは chat-latest として提供される
  • 有料ユーザーはモデル構成設定を通じて GPT‑5.3 Instant を3か月間引き続き利用でき、その後 GPT‑5.3 Instant は終了する
  • 過去のチャット、ファイル、接続された Gmail に基づく強化されたパーソナライズは、Webの Plus および Pro ユーザーに順次展開されており、モバイルにも近日提供予定
  • Free、Go、Business、Enterprise へは今後数週間以内に拡大される予定
  • memory sources は Web のすべてのChatGPTコンシューマープランに順次展開されており、モバイルにも近日提供予定
  • 特定のパーソナライズソースの利用可否は地域によって異なる場合がある

1件のコメント

 
GN⁺ 1 시간 전
Hacker News の意見
  • 即時性を見たいなら chatjimmy.ai を一度見てみるといい。関係者ではないが、自分が作っている製品で開ける可能性がかなり衝撃的
    もっとずっと古いモデルでも ミリ秒単位の推論 が可能なら、ゲームのルールが完全に変わる。ほぼすべての API 呼び出しごとに推論を回しても目立つ遅延がないレベルなので、本当にすごい

    • これについてもっと情報はある? Groq も速いと思っていたけど、これはありえないほど速い
      修正: この会社だった https://taalas.com/products/
    • gpt-4.1 で 2 桁ミリ秒のレイテンシが出るなら、本当にゲームチェンジャーになりそう
  • GPT-5.3-instant はまったく instant ではなかった。最小の推論 effort でも、最良のケースで TTFT が GPT-4.1 より 3〜4 倍ほど遅い
    もちろん "instant" と名付けたのは彼らなのでそう言っている。データセンターの働き者である GPT-4.1 を新しく置き換える本当の必要がある
    それに "instant" モデルを出しておきながら レイテンシ特性 にまったく触れないのは、一体どういうことなのかと思う

  • これが GPT 5.5 thinking で推論 effort を 0 にしたものと何が違うのか気になる。別モデルに分けるという製品判断が興味深い

    • いい質問。GPT-5.5 thinking は簡単な質問に対して考えない能力がとても高いので、速い質疑応答でも instant モデルを使う必要を感じたことがない
      だとすると instant モデルはまったく別のより小さなモデルで、主に ChatGPT の無料ティアを担当する用途なのだと思う
  • これって API でも使える? instant は見当たらず、chat しか見えない

    • GPT‑5.5 Instant is rolling out starting today to all ChatGPT users, replacing GPT‑5.3 Instant as the default model, and in the API as chat-latest.

  • 回答がもっと読みやすく見えるし、実際そうだといいな。今の一般無料 ChatGPT モデル はあまりにもしんどい

  • 一番安い価格帯で 知能が大きく上がった ということだね

    • 安いって本当? https://developers.openai.com/api/docs/pricingchat-latest は入力/出力 $5/$30 と出ていて、gpt-5.5 と同じ価格だよ
    • 価格はどこに出てる? まだモデルページにも載っていない気がする
  • なぜバージョン番号ごとに Instant と Thinking モデル をもっと一貫して同時に出せないのだろう? なぜこんな重複した騒ぎを作るのかわからない

    • おそらく thinking モデルを修正したバージョンである可能性が高い。だとすると同時リリースにするには thinking モデルの公開を遅らせる必要があったはず
  • いいね。実際に使えて 手の届く価格 のものが出てきた