31 ポイント 投稿者 haebom 2025-08-06 | まだコメントはありません。 | WhatsAppで共有

OpenAIがGPT-OSSモデルシリーズ(gpt-oss-120b / gpt-oss-20b)をApache 2.0ライセンスで電撃公開しました。GPT-2以来6年ぶりとなるオープンウェイトモデルであり、性能と効率の両面で市場の勢力図を変える潜在力を持っています。

🧠 主な特徴

  • 20Bモデル: Mixture of Experts(MoE)構造
     • 128人のエキスパートのうち4つを活性化 → 性能を維持しながら推論コストを削減
     • FlashAttention、128kトークン対応、YaRNを含む
  • 20Bモデル: 16GB GPU環境でも実行可能(Apple Siliconを含む)

📊 主なベンチマーク性能(GPT-OSS-120B基準)

  • MMLU: 90.0%(o4-miniと同程度)
  • AIME数学: 97.9%(数学+ツールで最上位級)
  • Codeforces Elo: 2622(コーディング能力も上位圏)
  • HealthBench: GPT-4o比で優れた性能
  • MMMLU(14言語): 81.3% → 多言語推論も強力

💡 実用性 & エコシステム

  • 単一のH100 80GB GPUで120Bモデルを実行可能
  • 16GB環境でも20Bモデルをリアルタイム実行
  • HuggingFace、vLLM、Ollamaなどと即座に互換

🔐 安全性 & 責任

  • RLベースで推論の整合性を強化
  • Deliberative Alignmentを導入
  • 意図的な悪用に対しても高リスクな出力を生成しない

しばらくはClosedAIという冷やかしは避けられそうです。少しテストしてみましたが、日本語もとても上手です。

https://huggingface.co/openai/gpt-oss-120b

まだコメントはありません。

まだコメントはありません。