- GPT-4.1、GPT-4.1 mini、GPT-4.1 nanoの3つのモデルを公開
- GPT-4oと比べて全体的に性能が向上しており、特に コーディング、指示追従、長文コンテキスト理解 で顕著な改善
- 3モデルすべてが最大 100万トークンのコンテキストウィンドウ をサポートし、大規模コードベースや複雑な文書分析に適している
- レイテンシ削減とコスト削減 とともに優れた性能を提供
- 主な性能向上
- コーディング能力: SWE-bench Verifiedで54.6%となり、GPT-4o比で+21.4ポイント向上
- 指示追従: MultiChallengeスコア38.3%で、GPT-4oより+10.5ポイント向上
- マルチモーダル長文コンテキスト理解: Video-MME(long, no subtitles)で72.0%、GPT-4o比で+6.7ポイント
- GPT-4.1モデル群の特徴
- GPT-4.1 mini: GPT-4oを上回る知能評価結果、レイテンシ半減、コスト83%削減
- GPT-4.1 nano: 最低コストかつ最小レイテンシで、高性能を維持
- GPT-4.5 Previewは2025年7月14日に終了予定、GPT-4.1シリーズへの移行を推奨
- ビジョン(画像理解およびマルチモーダル)
- GPT-4.1 miniは 画像ベースのベンチマーク でGPT-4oを上回る
- MMMU、MathVista、CharXiv などで高い精度
- Video-MME(30〜60分の字幕なし動画に対する質問): 72.0%の正確度
- 価格ポリシー
- 全モデルが公開済みで利用可能
- GPT-4.1は GPT-4oより平均26%安価
- GPT-4.1 nanoは最低コストのモデル
- キャッシュ入力時は75%割引、長文コンテキストにも追加費用なし
- モデル別価格
- GPT-4.1: 入力100万トークンあたり$2.00、出力$8.00、平均コスト約$1.84
- GPT-4.1 mini: 入力$0.40、出力$1.60、平均$0.42
- GPT-4.1 nano: 入力$0.10、出力$0.40、平均$0.12
- プロンプトキャッシュ割引を従来の50%から 最大75%まで拡大
- 長文コンテキストのリクエストに追加料金なし、トークン使用量のみ基準
1件のコメント
Hacker Newsの意見
ChatGPTユーザーは、さまざまなモデルを選ばなければならない状況に混乱を感じている
SWE-bench Verified、Aider Polyglot、コスト、秒間出力トークン数、知識カットオフの月/年を比較
OAIがGPT 4.1向けのプロンプトガイドを公開
OpenAIの発表によると、GPT-4.1はClaude Sonnet 3.7とのコードレビュー生成対決で、55%のケースでより良い提案を提供した
最近のTed Talkで、Samはモデルは移り変わるが、最高のプラットフォームになりたいと発言
GPT-4.1を複雑なコードベースで使った経験の共有
長い最大トークンを持つモデルの性能に関するベンチマークの必要性を提起
大手AI研究所は複数の市場戦争を同時に戦っている
GPT-4.1が164件のコメントが付いたHacker Newsスレッドを要約した結果