31 ポイント 投稿者 haebom 2025-08-06 | 8件のコメント | WhatsAppで共有

OpenAIがGPT-OSSモデルシリーズ(gpt-oss-120b / gpt-oss-20b)をApache 2.0ライセンスで電撃公開しました。GPT-2以来6年ぶりとなるオープンウェイトモデルであり、性能と効率の両面で市場の勢力図を変える潜在力を持っています。

🧠 主な特徴

  • 20Bモデル: Mixture of Experts(MoE)構造
     • 128人のエキスパートのうち4つを活性化 → 性能を維持しながら推論コストを削減
     • FlashAttention、128kトークン対応、YaRNを含む
  • 20Bモデル: 16GB GPU環境でも実行可能(Apple Siliconを含む)

📊 主なベンチマーク性能(GPT-OSS-120B基準)

広告
  • MMLU: 90.0%(o4-miniと同程度)
  • AIME数学: 97.9%(数学+ツールで最上位級)
  • Codeforces Elo: 2622(コーディング能力も上位圏)
  • HealthBench: GPT-4o比で優れた性能
  • MMMLU(14言語): 81.3% → 多言語推論も強力

💡 実用性 & エコシステム

  • 単一のH100 80GB GPUで120Bモデルを実行可能
  • 16GB環境でも20Bモデルをリアルタイム実行
  • HuggingFace、vLLM、Ollamaなどと即座に互換
広告

🔐 安全性 & 責任

  • RLベースで推論の整合性を強化
  • Deliberative Alignmentを導入
  • 意図的な悪用に対しても高リスクな出力を生成しない

しばらくはClosedAIという冷やかしは避けられそうです。少しテストしてみましたが、日本語もとても上手です。

https://huggingface.co/openai/gpt-oss-120b

8件のコメント

 
yeorinhieut 2025-08-06

120bモデルでもsimpleqaのスコアは0.168なんですね

 
jinucho 2025-08-06

vllmでサービングしてみようと思ったのですが、Flash Attention3ベースなのでHopperしかサポートしていないですね しくしく

 
yeorinhieut 2025-08-06

私もそれでollamaに…

 
jinucho 2025-08-06

型落ちになったA100...

 
xguru 2025-08-06

関連するHacker Newsのコメントは、OpenAI、大規模オープンウェイト言語モデルを公開 の記事を参照してください。
性能に関するさまざまな評価を見ることができます。

 
argo9 2025-08-06

自分のコンピュータが遅いかどうか知りたいときは……同じプロンプトで実際に秒数を測ってテストしてみるのもいいかもしれません。^^; 簡単な記録用のGoogleスプレッドシートでも1つ開いておきたいですね(純粋に記録する楽しさとして)

 
fanotify 2025-08-06

MXFP4量子化により、Ollamaでは16GBメモリ(VRAM)のシステムでも実行できるとのことです(gpt-oss:20b): https://ollama.com/blog/gpt-oss

 
fanotify 2025-08-06

より大きなモデルを実行したい方は、今回リリースされた月額20ドルのollama turboを利用できます: https://ollama.com/turbo