- 12月5日から始まった「12 Days of OpenAI」で、ChatGPTに関する新機能、モデル、購読オプション、そして拡張機能が12日間にわたって順次公開
Day 1: 新しいo1推論モデルとChatGPT Proをリリース
- o1推論モデルの完全版を公開
- Plus($20/月)購読者に制限付きで提供
- Pro($200/月)購読者には、すべてのo1モデルとAdvanced Voice Modeの無制限利用を提供
- より多くの計算リソースを活用して、より深く思考し、複雑な問題に対してさらに洗練された回答を提供
- OpenAI o1 System Card
Day 2: 強化学習ファインチューニング研究プログラムを拡張
- Reinforcement Fine-Tuning Researchプログラムの拡張を発表
- RFTはOpenAIの新しいモデルカスタマイズ技術で、以下のような過程を通じて特定ドメインでのモデル性能を微調整し、複雑で詳細な作業に対する精度を大きく向上させるのに効果的
- 数十件から数千件のドメイン別高品質タスクをモデルに提供
- モデルが生成した応答を、あらかじめ用意された参照回答と比較して評価
- 評価結果を活用し、モデルが類似問題を解く推論過程を改善
- 企業、大学、研究機関向け
- 2025年初頭にAPIを通じて一般提供予定
Day 3: Soraをリリース
- Sora動画生成モデルを公開
- 最大20秒、1080pのクリップを生成可能
- ワイドスクリーン、縦長、正方形の比率をサポート
- テキストだけでなく画像を含むユーザーアセットも活用可能
- Remix、Re-cut、Storyboard、Loop、Blend、Style Presetsなどをサポート
- 期待に比べると性能は中程度と評価されている
Day 4: Canvas機能を拡張
- Canvas機能がGPT-4oモデルに直接統合され、無料ユーザーを含むすべてのユーザーに提供
- AnthropicのArtifactsに対応する機能
- Canvas空間内でPythonコードを実行して分析可能
- チャットボットが直接分析して改善点を提案し、カスタムGPTの作成を支援
Day 5: ChatGPTとApple Intelligenceを統合
- 「ChatGPT x Siri統合」を発表
- iOS 18.2からSiri経由でChatGPTを直接呼び出し可能
Day 6: Advanced Voice Modeに動画分析と画面共有機能を追加
- Advanced Voice Modeがビデオカメラと共有された画面を見る機能をサポート
- シーズンテーマ音声としてサンタの声を追加(Jolly Old St. Nick)
Day 7: ChatGPTにProjects機能を追加
- Projects: スマートフォルダーシステムを提供
- チャット履歴とアップロードした文書をテーマ別に整理可能
Day 8: ChatGPT Searchをすべてのユーザーに提供
- 8月に公開した**ChatGPT Search**機能を、すべてのユーザーに無料提供
- インターネットでユーザーの検索語に関する情報を検索し、関連Webサイトで見つけた情報をスクレイピングしたうえで、そのデータを対話型回答として統合
- 基本的に検索結果ページをクリックする必要はなく、Perplexity AIが提供するものと機能的に同一
- 精度に問題があるという一部の批判がある
Day 9: o1モデルをOpenAI APIで提供
- o1推論モデルの完全版を一部の開発者にAPIで提供
- Realtime APIの更新とPreference Fine-Tuningを提供
- GoとJava向けSDKを追加
Day 10: 1-800-ChatGPT電話サービス
- 1-800-ChatGPT: ChatGPTへのより広いアクセスを提供するため、AI電話サービスを提供
- 米国内のユーザーは15分間、Advanced Voice Modeを無料で利用可能
- WhatsApp経由でも利用可能
Day 11: より多くのアプリと統合されたChatGPT
- ChatGPTがより多くのコーディングアプリやIDEと直接統合
- 11月にはmacOSアプリがVS Code、Xcode、TextEdit、Terminal、iTerm2と連携する機能を公開
- 現在はBEdit、MatLab、TextMate、Android Studioなどに加え、RubyMine、WebStormのようなJetbrains IDEも含まれる
- さらにApple Notes、Notion、QuipのようなテキストアプリやWarpターミナルなどとも連携可能
- Advanced Voice Modeを別ウィンドウで実行しながら作業可能
Day 12: 次世代o3およびo3-miniモデルのティザーを公開
- 次世代推論モデルo3およびo3-miniを紹介
- o2ではなくo3なのは、英国通信会社O2との著作権問題を避けるため
- 数学、科学、コーディング分野の最も難しいベンチマークテストで優れた成果を示し、最近公開されたo1モデルよりも優れた性能を提供
- o3-miniは研究者向けにプレビュー提供中。一般ユーザーへの提供時期は未定。
- OpenAIはこのモデルを通じて、さらに洗練された推論能力と問題解決能力を提供する計画
1件のコメント
o1-pro を2日ほど使ってみていますが、まず入力を非常に多く与えられて、出力も途中で切れずにコードを最後まで全部出してくれるので、とても便利です。Claude より少し賢い気もします。