OpenAI、最もコスト効率の高い小型モデル GPT-4o mini を公開

xguru · 2024-07-19T11:52:11+09:00

GPT-4o mini は AI を大幅に低コスト化し、AI で構築されるアプリケーションの範囲を大きく広げることが期待される MMLU で 82% のスコアを獲得し、現在の LMSYS リーダーボードのチャット選好で GPT-4 を上回る価格は入力トークン 100 万個あたり 15 セント、出力トークン 100 万個あたり 60 セントで、従来の最先端モデルより 10 倍安く、GPT-3.5 Turbo より 60% 以上安価 GPT-4o mini の主な機能低コストかつ低レイテンシで幅広いタスクを実行できる複数のモデル呼び出しを連結または並列化するアプリケーション（例: 複数の API 呼び出し）に適している大量のコンテキストをモデルに渡すアプリケーション（例: コードベース全体や会話履歴）に適している顧客と高速かつリアルタイムにテキスト応答をやり取りするアプリケーション（例: カスタマーサポートのチャットボット）に適している API でテキストとビジョンをサポートし、今後はテキスト、画像、動画、音声の入出力をサポートする予定 128K トークンのコンテキストウィンドウを備え、リクエストあたり最大 16K 出力トークンをサポートし、2023 年 10 月までの知識を持つ GPT-4o と共有する改良されたトークナイザーにより、英語以外のテキスト処理もさらにコスト効率よく行える GPT-4o mini の優れた性能 GPT-4o mini は、テキスト知能とマルチモーダル推論の両方で GPT-3.5 Turbo やその他の小型モデルを上回る GPT-4o と同じ言語範囲をサポートする関数呼び出し性能に優れており、開発者は外部システムからデータを取得したり作業を実行したりするアプリケーションを構築できる GPT-3.5 Turbo と比べて長文コンテキスト性能が向上している MMLU で 82.0%、MGSM で 87.0%、HumanEval で 87.2%、MMMU で 59.4% を記録し、他の小型モデルより優れた性能を示す安全対策事前学習時に、モデルが学習または出力してほしくない情報（例: ヘイトスピーチ、成人向けコンテンツ、個人情報を主に収集するサイト、スパムなど）をフィルタリングする事後学習時に、人間のフィードバックによる強化学習（RLHF）などの手法を用いてモデルの挙動をポリシーに合わせて調整し、モデル応答の正確性と信頼性を改善する GPT-4o mini には GPT-4o と同じ安全緩和機能が組み込まれている 70 人以上の外部専門家が GPT-4o をテストして潜在的リスクを特定し、これを解決済みであり、GPT-4o システムカードと準備状況スコアカードで詳しく共有する予定 GPT-4o mini は API の最初のモデルとして命令階層手法を適用し、モデルの脱獄、プロンプトインジェクション、およびシステムプロンプト抽出への耐性を改善する価格と提供状況 GPT-4o mini は現在、Assistants API、Chat Completions API、Batch API でテキストおよびビジョンモデルとして利用可能開発者は入力トークン 100 万個あたり 15 セント、出力トークン 100 万個あたり 60 セントを支払う今後数日以内に GPT-4o mini 向けのファインチューニングを提供開始する予定 ChatGPT の無料、Plus、Team ユーザーは本日から GPT-3.5 の代わりに GPT-4o mini へアクセスできる Enterprise ユーザーも来週からアクセス可能今後の計画 AI インテリジェンスの驚異的な進歩とともに、大幅なコスト削減が実現している GPT-4o mini のトークンあたりコストは、2022 年に導入された text-davinci-003 と比べて 99% 低いすべてのアプリやウェブサイトにモデルがシームレスに統合される未来を思い描いている GPT-4o mini は、開発者が強力な AI アプリケーションをより効率的かつ低コストで構築・拡張できる道を開く AI の未来は、よりアクセスしやすく、より信頼でき、私たちの日常的なデジタル体験に組み込まれていく

(openai.com)

12 ポイント投稿者 xguru 2024-07-19 | 1件のコメント | WhatsAppで共有

GPT-4o mini は AI を大幅に低コスト化し、AI で構築されるアプリケーションの範囲を大きく広げることが期待される
MMLU で 82% のスコアを獲得し、現在の LMSYS リーダーボードのチャット選好で GPT-4 を上回る
価格は入力トークン 100 万個あたり 15 セント、出力トークン 100 万個あたり 60 セントで、従来の最先端モデルより 10 倍安く、GPT-3.5 Turbo より 60% 以上安価

GPT-4o mini の主な機能

低コストかつ低レイテンシで幅広いタスクを実行できる
複数のモデル呼び出しを連結または並列化するアプリケーション（例: 複数の API 呼び出し）に適している
大量のコンテキストをモデルに渡すアプリケーション（例: コードベース全体や会話履歴）に適している
顧客と高速かつリアルタイムにテキスト応答をやり取りするアプリケーション（例: カスタマーサポートのチャットボット）に適している
API でテキストとビジョンをサポートし、今後はテキスト、画像、動画、音声の入出力をサポートする予定
128K トークンのコンテキストウィンドウを備え、リクエストあたり最大 16K 出力トークンをサポートし、2023 年 10 月までの知識を持つ
GPT-4o と共有する改良されたトークナイザーにより、英語以外のテキスト処理もさらにコスト効率よく行える

GPT-4o mini の優れた性能

GPT-4o mini は、テキスト知能とマルチモーダル推論の両方で GPT-3.5 Turbo やその他の小型モデルを上回る
GPT-4o と同じ言語範囲をサポートする
関数呼び出し性能に優れており、開発者は外部システムからデータを取得したり作業を実行したりするアプリケーションを構築できる
GPT-3.5 Turbo と比べて長文コンテキスト性能が向上している
MMLU で 82.0%、MGSM で 87.0%、HumanEval で 87.2%、MMMU で 59.4% を記録し、他の小型モデルより優れた性能を示す

安全対策

事前学習時に、モデルが学習または出力してほしくない情報（例: ヘイトスピーチ、成人向けコンテンツ、個人情報を主に収集するサイト、スパムなど）をフィルタリングする
事後学習時に、人間のフィードバックによる強化学習（RLHF）などの手法を用いてモデルの挙動をポリシーに合わせて調整し、モデル応答の正確性と信頼性を改善する
GPT-4o mini には GPT-4o と同じ安全緩和機能が組み込まれている
70 人以上の外部専門家が GPT-4o をテストして潜在的リスクを特定し、これを解決済みであり、GPT-4o システムカードと準備状況スコアカードで詳しく共有する予定
GPT-4o mini は API の最初のモデルとして命令階層手法を適用し、モデルの脱獄、プロンプトインジェクション、およびシステムプロンプト抽出への耐性を改善する

価格と提供状況

GPT-4o mini は現在、Assistants API、Chat Completions API、Batch API でテキストおよびビジョンモデルとして利用可能
開発者は入力トークン 100 万個あたり 15 セント、出力トークン 100 万個あたり 60 セントを支払う
今後数日以内に GPT-4o mini 向けのファインチューニングを提供開始する予定
ChatGPT の無料、Plus、Team ユーザーは本日から GPT-3.5 の代わりに GPT-4o mini へアクセスできる
Enterprise ユーザーも来週からアクセス可能

今後の計画

AI インテリジェンスの驚異的な進歩とともに、大幅なコスト削減が実現している
GPT-4o mini のトークンあたりコストは、2022 年に導入された text-davinci-003 と比べて 99% 低い
すべてのアプリやウェブサイトにモデルがシームレスに統合される未来を思い描いている
GPT-4o mini は、開発者が強力な AI アプリケーションをより効率的かつ低コストで構築・拡張できる道を開く
AI の未来は、よりアクセスしやすく、より信頼でき、私たちの日常的なデジタル体験に組み込まれていく

1件のコメント

wedding 2024-07-22

gpt-4o pro max ultraも出てきそうですね。