Stability AI、世界初のオープンソースRLHF LLMチャットボット「StableVicuna」を公開

xguru · 2023-05-01T10:32:02+09:00

Vicuna v0 13Bを命令ファインチューニングおよびRLHFで学習 3つのデータセットを用いてSFT（Supervised Fine-Tuning） OpenAssistant Conversations Dataset（OASST1） GPT4All Prompt Generations Alpaca HuggingFaceでLLaMAモデル向けの重みデルタとしてダウンロード可能（オリジナルのLLaMAデータが必要）

(stability.ai)

16 ポイント投稿者 xguru 2023-05-01 | まだコメントはありません。 | WhatsAppで共有

Vicuna v0 13Bを命令ファインチューニングおよびRLHFで学習
3つのデータセットを用いてSFT（Supervised Fine-Tuning）
- OpenAssistant Conversations Dataset（OASST1）
- GPT4All Prompt Generations
- Alpaca
HuggingFaceでLLaMAモデル向けの重みデルタとしてダウンロード可能（オリジナルのLLaMAデータが必要）

Stability AI、世界初のオープンソースRLHF LLMチャットボット「StableVicuna」を公開

関連記事

まだコメントはありません。