RedPajama、HELMベンチマークで公開済みの他の7B LLMモデルを上回る性能を持つ7Bモデルを公開
(together.xyz)RedPajama-INCITE-7Bモデル3種を紹介
- HELMベンチマーク基準で、既存の公開済み7Bモデル群より優れたRedPajama-INCITE-7B-Instructモデルを含む、7Bの3種モデルを公開
RedPajama-INCITE-7B-Instructモデル
- 既存モデルのInstructチューニング版
- P3(BigScience)およびNatural Instruction(AI2)を使用して学習
- HELMベンチマークで最も高いスコアを獲得したオープンモデルで、さまざまなタスクに最適
RedPajama-INCITE-7B-Chatモデル
- Dolly2やOASSTなどのオープンソースデータのみを使用して学習 ➡️ 商用利用可能
- (+ Chatモデルだけでなく、RedPajama-INCITEモデル群はすべて商用利用可能)
- ファインチューニング用の学習スクリプトを含めて公開 :arrow_forward: OpenChatKitですぐに利用可能
- RedPajama.cpp(LLaMA.cppのfork)をサポート - CPUで実行可能
- MLC LLMなどのプロジェクトと協力 ➡️ 今後さまざまなハードウェア上で動作可能にする予定
RedPajama-INCITE-7B-Baseモデル
- EleutherAIのPythiaモデルと同一のアーキテクチャを使用し、RedPajama-Data-1Tデータセットで学習
- 🤗HuggingFaceのtogethercomputer/RedPajama-INCITE-7B-Baseからダウンロード可能
- HELMベンチマーク基準でLLaMA-7Bより4点、Falcon-7B/MPT-7Bより約1.3点低い性能
- logprobを使って正解/不正解間の確率差を計算するタスクでのみ性能が低い
- 回答を直接生成して品質を測定するタスクでは同等の性能を示す
- LM Harnessの結果もlogprobを使用するため、同様に低い性能を示す
今後の計画(RedPajama2)
- 以下のような計画で、2〜3Tトークンの新しいデータセットRedPajama2を開発中:
- DoReMiのような技術を使ってデータ混合のバランスを取る予定
- 多様性と規模を補うため、Eleuther.aiのPile v1やCarperAIのPile v2などのデータを使用
- より多くのCommonCrawlデータを処理
- LLaMA論文のアプローチ以外のさまざまなデータ重複除去戦略を探索
- 150B以上のコードトークンを追加して、コーディングと推論(reasoning)タスクの品質を改善
3件のコメント
あっ.. タイトルに誤字がありましたね…
@xguruさん、もしタイトルのHEMLをHELMに変更していただけないでしょうか…
修正しておきました!
さらに読む