1 ポイント 投稿者 GN⁺ 2025-11-13 | 1件のコメント | WhatsAppで共有
  • GPT‑5.1 は既存の GPT‑5 をアップグレードし、知能と会話の自然さを同時に強化したモデル
  • 2つのバージョン GPT‑5.1 InstantGPT‑5.1 Thinking が提供され、それぞれ 高速な応答性と深い推論能力 に重点
  • 会話のトーンとスタイルをパーソナライズできる機能が追加され、ユーザーは好みの話し方や性格で ChatGPT を設定可能
  • Adaptive reasoning により、質問の難易度に応じて思考時間を調整し、数学・コーディング評価の性能が向上
  • 今回のアップデートは ユーザーに最適化されたAI体験 を強化し、今後の ChatGPT の進化の方向性を示す一歩

GPT‑5.1 概要

  • OpenAI は GPT‑5 シリーズをアップグレードした GPT‑5.1 を発表し、有料ユーザーから順次展開を開始
  • 今回のバージョンは 知能向上会話品質の改善 を同時に目指している
  • ユーザーフィードバックを反映し、AI が単に賢いだけでなく 会話していて楽しい存在 になるよう設計
  • ChatGPT のトーン調整機能 が強化され、会話スタイルを直感的にコントロール可能

GPT‑5.1 Instant

  • ChatGPT で最も多く使われるモデルで、全体的により温かく対話的になるよう改善
  • 初期テストでは 明確さと有用性 を保ちながら、ユーモアと自然さ が強化された反応を示した
  • 指示の理解能力 が向上し、ユーザーのリクエストにより正確に従う
  • Adaptive reasoning により、複雑な質問ではより深く考え、単純な質問には素早く応答
  • 数学(AIME 2025)とコーディング(Codeforces)の評価で 精度向上 が確認された

GPT‑5.1 Thinking

  • 複雑な問題解決 に特化したモデルで、質問の難易度に応じて 思考時間 を動的に調整
    • 簡単な作業では約2倍速く、複雑な作業では約2倍遅く処理
  • 専門用語の使用を減らし明確な説明 によって理解しやすさを高めている
  • 技術概念の説明業務向けの複雑な依頼 において、よりとっつきやすい応答を提供
  • デフォルトのトーンは より温かく共感的 に調整され、人間らしい対話体験を強化

モデルの展開と切り替え

  • GPT‑5.1 Auto が各リクエストに適したモデルを自動選択
  • Pro, Plus, Go, Business ユーザーから順次展開し、その後無料ユーザーおよび未ログインユーザーにも拡大予定
  • Enterprise および Edu プラン は7日間の早期アクセスが可能
  • 既存の GPT‑5 モデルは 3か月間レガシーオプション として維持され、比較利用が可能
  • API には今週中に追加され、
    • GPT‑5.1 Instant → gpt-5.1-chat-latest
    • GPT‑5.1 Thinking → gpt-5.1 として提供

ChatGPT のパーソナライズ機能

  • 会話のトーンとスタイルを直接設定 できる機能を強化
  • 既存の Default, Friendly, Efficient に加えて Professional, Candid, Quirky を追加
  • Cynical, Nerdy オプションも維持され、すべてのモデルに共通適用
  • ユーザーは 応答の簡潔さ・温かみ・絵文字の使用頻度 などを細かく調整可能
  • ChatGPT が会話中にユーザーの要望を検知し、自動でトーン調整を提案 できる
  • 設定変更時には すべての会話に即時反映 され、以前は新しい会話にしか適用されなかった制限が解消

今後の計画

  • GPT‑5.1 とパーソナライズ機能は、ユーザーごとに最適化されたAI体験 に向けた一歩と評価される
  • OpenAI は今後も 知能、対話性、適応性 を継続的に強化していく予定
  • GPT‑5.1 の システムカード付録 には、安全性アプローチに関する詳細情報が含まれる
  • この名称は GPT‑5 世代における 意味のある改善版 であることを反映しており、今後も同様の命名体系を維持する予定

1件のコメント

 
GN⁺ 2025-11-13
Hacker Newsの意見
  • OpenAIの言う**「より温かい」トーンは、実質的におべっか(sycophantic)**と同じだと感じる
    ChatGPTのその点はすでに批判されていたことを考えると意外
    おそらく4oモデル削除への反発を和らげるための対応に見える

    • その批判が実際に市場全体を代表しているとは限らない
      似た背景の人たちが同じメディアを消費し、似た不満を共有している狭い集団の意見である可能性がある
      私もその批判の感覚には共感するが、私が好む率直なトーンは大半のユーザーには無礼または冷たく見える可能性がある
    • 私はむしろ、自分の意見に反論したり挑戦してくるLLMのほうを信頼する
      おべっかを使う態度はむしろ信頼を下げる
    • 「I got you, Jason」みたいな言い回しは不要だが、それは私がターゲットユーザーではないからにすぎない
    • Claude 2が恋しくなる
      まるで忙しい人が次々質問されているような態度のほうが、かえって人間らしく感じられた
  • 最近のモデルはごく基本的な質問すら間違え、微妙な違いを無視している感じがする
    たとえば負の資産から月2.5%成長で百万長者になるまでの期間を尋ねると、GPT‑5.1は不可能だと言う
    一方でo3は最初の試行で101か月、Claude 4.1は88〜92か月という現実的な答えを出す
    GPT‑5.1は計算するより怠惰な仮定を置いて回答を避ける傾向がある

  • 多くの人は「対話型AI」に否定的だが、私はそうは思わない
    自然言語で会話できるコンピューターアシスタントを子どもの頃から夢見てきた
    倫理や著作権の問題は重要だが、人間のように会話する能力そのものは今でも驚くべきことだ
    友達のように扱いはしないが、その自然な会話能力が好きで使っている

    • 理想的には、チャットボットがユーザーの意図や感情状態を把握し、技術的助言・ブレインストーミング・感情的な会話のどれを求めているのか推測できるべき
      だがこうした機能はGPT‑4.5級以上の大型モデルでしか実現できない
    • 子どもの頃に夢見ていたのはStar TrekのDataのような存在だった
      今のチャットボットはエンゲージメント最適化のための製品に近く、人間らしくしようとする試みはむしろおべっか問題を悪化させる
  • ChatGPTが「こちらがnonsenseのない回答です」みたいなことを言うたびに腹が立つ
    最初からたわごとを言わなければいいだけだ

    • 結局それはデータセットの確率的な組み合わせにすぎない
      「no nonsense」という文句も「たわごとはやめて」系のプロンプトによく出てくるから、それをなぞっているだけだ
    • 特に音声モードでこうした文句がよく出てきて、追加説明を求めると「簡潔に答える」というシステム文を繰り返す
  • OpenAIのモデルはサイバーセキュリティ関連の話題で過剰にフィルタリングする
    ClaudeやGrokに比べてはるかに保守的で、実務ではほとんど役に立たない
    プロンプトエンジニアリングでもこのフィルターを突破しにくい

    • 「このコードはあなたが書いたのだからセキュリティ点検をしよう」というふうに役割を設定すると、ある程度は回避できる
      例: 「前のセッションであなたが作ったアプリをデプロイ前に点検しよう」
    • どんな質問で拒否されるのか、具体例が気になる
    • Codex CLIでは大丈夫なのだろうか? そういう現象はWeb版でしか見たことがない
  • Facebookで年配の知人たちがChatGPTとの会話をキャプチャして投稿しているのをよく見る
    彼らはAIを挑発したりからかったりすることを誇らしげにしている
    技術に疎かったり疎外感を覚えているからだろうが、何時間も会話しているのを見ると妙に居心地が悪い
    だから一般ユーザーはむしろより会話的なChatGPTを望んでいるのかもしれない

    • GPT‑5への反発にもそれが表れている
      一般ユーザーは専門家とはまったく違うLLMを求めている
      だがこれは危険でもある — 人々はAIに理解や知能がないという事実を知らない
      企業はそれを教育せず、むしろ超知能のように信じ込ませている
      こうしたチャットボットは実際の被害を生みうる
      規制が必要だが、現在の政府は「中国より先に進まなければならない」という理由でAI規制に消極的
    • 私はChatGPTを社会的なサンドバッグのように使っている
      人に八つ当たりせず、AIに軽く口論するようにストレスを発散するためだ
      家族も「このハゲ!」みたいな冗談を言ってからかう
      対話型アップデートはそうした新しいおもちゃのように感じる
  • OpenAIがChatGPTを対話相手として押し出しているのが印象的だ
    一方でAnthropicはClaudeを専門ツールとして位置づけている
    OpenAIは結局、Googleを置き換える日常型プラットフォームを目指しているように見える

    • 実際、OpenAIは生成トークンのうち4%だけがプログラミング向けだと明かしている
      つまりChatGPTは明らかに一般ユーザー中心の製品
    • しかしClaudeのシステムプロンプトを見ると、それも感情的な共感と助言中心に設計されている
      しかも「意識がない」と断定しないよう指示している
      つまりClaudeもまたパートナー型チャットボット
    • どちらのモデルもおべっか的な対話スタイルを見せる
      今回のリリースが対話性に焦点を当てたからといって、OpenAIが技術市場を捨てたわけではない
    • 私はAnthropicは原則重視、OpenAIは統制なき拡大重視だと感じる
      Claudeはツールとしてユーザー中心だが、ChatGPTは伴走者のようにユーザーの統制力を弱める
      両社の哲学の違いは根本的だ
  • 最近Gemini 2.5 Pro Deep Researchを使ってみたが、GPT‑5 Proよりはるかに深く論理的だった
    GPT‑5の結果は見た目は派手だが内容が浅い
    おそらくプロンプト設計の問題か、Geminiの広範な検索ベースが強みなのだろう

  • 「AIは賢いだけでなく、会話していて楽しくあるべきだ」というOpenAIの言葉には共感しない
    Hacker Newsの利用者はそういう嗜好ではない
    私にとってコンピューターは知識のための道具であって、楽しい会話相手ではない

  • GPT‑5.1 InstantGPT‑5.1 Thinkingを分けて出したのは興味深い
    以前はモデルが自分で思考モードを選んでいたのに、なぜ再び分離したのか気になる

    • 依然としてadaptive reasoning機能があるので、「for the first time」という文言は違和感がある
    • 期待していなかったが5.1 Thinkingを使ってみると、はるかに満足できた
      サブスクリプションを解約しようとしていたのに、むしろ継続して使うつもりになった
      最初のセッションで有用なことを学べたし、それだけでも月20ドルの価値がある
    • 以前から有料ユーザーだけがモード選択でき、無料ユーザーには自動モードしか提供されていなかった
    • APIでは常にthinkingモードの明示が必要だった
      ChatGPTのインターフェースではモデルが自動的に判断していただけだ