OpenAIの「12 Days of OpenAI」発表まとめ

xguru · 2024-12-24T09:46:01+09:00

12月5日から始まった「12 Days of OpenAI」で、ChatGPTに関する新機能、モデル、購読オプション、そして拡張機能が12日間にわたって順次公開 Day 1: 新しいo1推論モデルとChatGPT Proをリリース o1推論モデルの完全版を公開 Plus（$20/月）購読者に制限付きで提供 Pro（$200/月）購読者には、すべてのo1モデルとAdvanced Voice Modeの無制限利用を提供より多くの計算リソースを活用して、より深く思考し、複雑な問題に対してさらに洗練された回答を提供 OpenAI o1 System Card Day 2: 強化学習ファインチューニング研究プログラムを拡張 Reinforcement Fine-Tuning Researchプログラムの拡張を発表 RFTはOpenAIの新しいモデルカスタマイズ技術で、以下のような過程を通じて特定ドメインでのモデル性能を微調整し、複雑で詳細な作業に対する精度を大きく向上させるのに効果的数十件から数千件のドメイン別高品質タスクをモデルに提供モデルが生成した応答を、あらかじめ用意された参照回答と比較して評価評価結果を活用し、モデルが類似問題を解く推論過程を改善企業、大学、研究機関向け 2025年初頭にAPIを通じて一般提供予定 Day 3: Soraをリリース Sora動画生成モデルを公開最大20秒、1080pのクリップを生成可能ワイドスクリーン、縦長、正方形の比率をサポートテキストだけでなく画像を含むユーザーアセットも活用可能 Remix、Re-cut、Storyboard、Loop、Blend、Style Presetsなどをサポート期待に比べると性能は中程度と評価されている Day 4: Canvas機能を拡張 Canvas機能がGPT-4oモデルに直接統合され、無料ユーザーを含むすべてのユーザーに提供 AnthropicのArtifactsに対応する機能 Canvas空間内でPythonコードを実行して分析可能チャットボットが直接分析して改善点を提案し、カスタムGPTの作成を支援 Day 5: ChatGPTとApple Intelligenceを統合「ChatGPT x Siri統合」を発表 iOS 18.2からSiri経由でChatGPTを直接呼び出し可能 Day 6: Advanced Voice Modeに動画分析と画面共有機能を追加 Advanced Voice Modeがビデオカメラと共有された画面を見る機能をサポート周囲の環境をリアルタイムで分析可能シーズンテーマ音声としてサンタの声を追加（Jolly Old St. Nick） Day 7: ChatGPTにProjects機能を追加 Projects: スマートフォルダーシステムを提供チャット履歴とアップロードした文書をテーマ別に整理可能 Day 8: ChatGPT Searchをすべてのユーザーに提供 8月に公開した**ChatGPT Search**機能を、すべてのユーザーに無料提供インターネットでユーザーの検索語に関する情報を検索し、関連Webサイトで見つけた情報をスクレイピングしたうえで、そのデータを対話型回答として統合基本的に検索結果ページをクリックする必要はなく、Perplexity AIが提供するものと機能的に同一精度に問題があるという一部の批判がある Day 9: o1モデルをOpenAI APIで提供 o1推論モデルの完全版を一部の開発者にAPIで提供 Realtime APIの更新とPreference Fine-Tuningを提供 GoとJava向けSDKを追加 Day 10: 1-800-ChatGPT電話サービス 1-800-ChatGPT: ChatGPTへのより広いアクセスを提供するため、AI電話サービスを提供米国内のユーザーは15分間、Advanced Voice Modeを無料で利用可能 WhatsApp経由でも利用可能 Day 11: より多くのアプリと統合されたChatGPT ChatGPTがより多くのコーディングアプリやIDEと直接統合 11月にはmacOSアプリがVS Code、Xcode、TextEdit、Terminal、iTerm2と連携する機能を公開現在はBEdit、MatLab、TextMate、Android Studioなどに加え、RubyMine、WebStormのようなJetbrains IDEも含まれるさらにApple Notes、Notion、QuipのようなテキストアプリやWarpターミナルなどとも連携可能 Advanced Voice Modeを別ウィンドウで実行しながら作業可能 Day 12: 次世代o3およびo3-miniモデルのティザーを公開次世代推論モデルo3およびo3-miniを紹介 o2ではなくo3なのは、英国通信会社O2との著作権問題を避けるため数学、科学、コーディング分野の最も難しいベンチマークテストで優れた成果を示し、最近公開されたo1モデルよりも優れた性能を提供 o3-miniは研究者向けにプレビュー提供中。一般ユーザーへの提供時期は未定。 OpenAIはこのモデルを通じて、さらに洗練された推論能力と問題解決能力を提供する計画

(openai.com)

15 ポイント投稿者 xguru 2024-12-24 | 1件のコメント | WhatsAppで共有

12月5日から始まった「12 Days of OpenAI」で、ChatGPTに関する新機能、モデル、購読オプション、そして拡張機能が12日間にわたって順次公開

Day 1: 新しいo1推論モデルとChatGPT Proをリリース

o1推論モデルの完全版を公開
- Plus（$20/月）購読者に制限付きで提供
- Pro（$200/月）購読者には、すべてのo1モデルとAdvanced Voice Modeの無制限利用を提供
  - より多くの計算リソースを活用して、より深く思考し、複雑な問題に対してさらに洗練された回答を提供
OpenAI o1 System Card

Day 2: 強化学習ファインチューニング研究プログラムを拡張

Reinforcement Fine-Tuning Researchプログラムの拡張を発表
- RFTはOpenAIの新しいモデルカスタマイズ技術で、以下のような過程を通じて特定ドメインでのモデル性能を微調整し、複雑で詳細な作業に対する精度を大きく向上させるのに効果的
  - 数十件から数千件のドメイン別高品質タスクをモデルに提供
  - モデルが生成した応答を、あらかじめ用意された参照回答と比較して評価
  - 評価結果を活用し、モデルが類似問題を解く推論過程を改善
- 企業、大学、研究機関向け
- 2025年初頭にAPIを通じて一般提供予定

Day 3: Soraをリリース

Sora動画生成モデルを公開
- 最大20秒、1080pのクリップを生成可能
- ワイドスクリーン、縦長、正方形の比率をサポート
- テキストだけでなく画像を含むユーザーアセットも活用可能
- Remix、Re-cut、Storyboard、Loop、Blend、Style Presetsなどをサポート
期待に比べると性能は中程度と評価されている

Day 4: Canvas機能を拡張

Canvas機能がGPT-4oモデルに直接統合され、無料ユーザーを含むすべてのユーザーに提供
- AnthropicのArtifactsに対応する機能
- Canvas空間内でPythonコードを実行して分析可能
- チャットボットが直接分析して改善点を提案し、カスタムGPTの作成を支援

Day 5: ChatGPTとApple Intelligenceを統合

「ChatGPT x Siri統合」を発表
iOS 18.2からSiri経由でChatGPTを直接呼び出し可能

Day 6: Advanced Voice Modeに動画分析と画面共有機能を追加

Advanced Voice Modeがビデオカメラと共有された画面を見る機能をサポート
- 周囲の環境をリアルタイムで分析可能
シーズンテーマ音声としてサンタの声を追加（Jolly Old St. Nick）

Day 7: ChatGPTにProjects機能を追加

Projects: スマートフォルダーシステムを提供
- チャット履歴とアップロードした文書をテーマ別に整理可能

Day 8: ChatGPT Searchをすべてのユーザーに提供

8月に公開した**ChatGPT Search**機能を、すべてのユーザーに無料提供
- インターネットでユーザーの検索語に関する情報を検索し、関連Webサイトで見つけた情報をスクレイピングしたうえで、そのデータを対話型回答として統合
- 基本的に検索結果ページをクリックする必要はなく、Perplexity AIが提供するものと機能的に同一
精度に問題があるという一部の批判がある

Day 9: o1モデルをOpenAI APIで提供

o1推論モデルの完全版を一部の開発者にAPIで提供
Realtime APIの更新とPreference Fine-Tuningを提供
GoとJava向けSDKを追加

Day 10: 1-800-ChatGPT電話サービス

1-800-ChatGPT: ChatGPTへのより広いアクセスを提供するため、AI電話サービスを提供
- 米国内のユーザーは15分間、Advanced Voice Modeを無料で利用可能
- WhatsApp経由でも利用可能

Day 11: より多くのアプリと統合されたChatGPT

ChatGPTがより多くのコーディングアプリやIDEと直接統合
- 11月にはmacOSアプリがVS Code、Xcode、TextEdit、Terminal、iTerm2と連携する機能を公開
- 現在はBEdit、MatLab、TextMate、Android Studioなどに加え、RubyMine、WebStormのようなJetbrains IDEも含まれる
- さらにApple Notes、Notion、QuipのようなテキストアプリやWarpターミナルなどとも連携可能
Advanced Voice Modeを別ウィンドウで実行しながら作業可能

Day 12: 次世代o3およびo3-miniモデルのティザーを公開

次世代推論モデルo3およびo3-miniを紹介
- o2ではなくo3なのは、英国通信会社O2との著作権問題を避けるため
- 数学、科学、コーディング分野の最も難しいベンチマークテストで優れた成果を示し、最近公開されたo1モデルよりも優れた性能を提供
- o3-miniは研究者向けにプレビュー提供中。一般ユーザーへの提供時期は未定。
OpenAIはこのモデルを通じて、さらに洗練された推論能力と問題解決能力を提供する計画

1件のコメント

rpf5573 2024-12-24

o1-pro を2日ほど使ってみていますが、まず入力を非常に多く与えられて、出力も途中で切れずにコードを最後まで全部出してくれるので、とても便利です。Claude より少し賢い気もします。