DeepSpeed Chat - RLHFを利用したChatGPTライクなモデル訓練用フレームワーク

xguru · 2023-04-17T10:26:01+09:00

高速・低コスト・スケーラブルなオープンシステムフレームワーク End-to-End RLHF(Reinforcement Learning Human Feedback)を通じて、あらゆる規模の高品質なChatGPTスタイルモデルを生成可能 1クリックで、48GBメモリを搭載したNVIDIA A6000 GPU 1台で、1.3BパラメータのChatGPTモデルを1.36時間以内に訓練・生成・サービング可能 Databricks Dolly、CarperAI-TRLX、Huggingface-PEFT などが利用中

(github.com/microsoft)

12 ポイント投稿者 xguru 2023-04-17 | 1件のコメント | WhatsAppで共有

高速・低コスト・スケーラブルなオープンシステムフレームワーク
End-to-End RLHF(Reinforcement Learning Human Feedback)を通じて、あらゆる規模の高品質なChatGPTスタイルモデルを生成可能
1クリックで、48GBメモリを搭載したNVIDIA A6000 GPU 1台で、1.3BパラメータのChatGPTモデルを1.36時間以内に訓練・生成・サービング可能
Databricks Dolly、CarperAI-TRLX、Huggingface-PEFT などが利用中

1件のコメント

xguru 2023-04-17

DeepSpeed - MSが公開したディープラーニング最適化ライブラリ
 Databricks、ChatGPTに似たDolly 2.0をオープンソースとして公開

DeepSpeed Chat - RLHFを利用したChatGPTライクなモデル訓練用フレームワーク

関連記事

1件のコメント