LLaMA - Metaが公開した65BパラメータLLM

xguru · 2023-02-28T10:49:01+09:00

7B、13B、33B、65Bの4つのサイズで公開はるかに小規模でありながら、データ学習の強化とファインチューニングにより、より大規模なモデルと比較可能な効率的モデル 33B/65Bは1兆4,000億個のトークンで訓練（7Bは1兆） "13Bモデルは175BのGPT-3を上回り、65Bははるかに大規模なChinchilla70BおよびPaLM-540Bと競争可能" 人工知能研究など、非商用目的でのみ利用可能（申請して承認が必要）

(ai.facebook.com)

7 ポイント投稿者 xguru 2023-02-28 | まだコメントはありません。 | WhatsAppで共有

7B、13B、33B、65Bの4つのサイズで公開
はるかに小規模でありながら、データ学習の強化とファインチューニングにより、より大規模なモデルと比較可能な効率的モデル
33B/65Bは1兆4,000億個のトークンで訓練（7Bは1兆）
"13Bモデルは175BのGPT-3を上回り、65Bははるかに大規模なChinchilla70BおよびPaLM-540Bと競争可能"
人工知能研究など、非商用目的でのみ利用可能（申請して承認が必要）

LLaMA - Metaが公開した65BパラメータLLM

関連記事

まだコメントはありません。