7 ポイント 投稿者 xguru 2022-05-04 | 1件のコメント | WhatsAppで共有

"Open Pre-trained Transformer Language Model"

  • このような大規模言語モデルは、構築にかなりの資本が必要であり、APIアクセスだけの公開では研究が難しい
  • 関心のある研究者向けに、モデル全体と実験用コード、ログブックをすべてダウンロード可能な形で公開
  • GPT-3よりCarbon Footprintが1/7で済む