Stability AI、世界初のオープンソースRLHF LLMチャットボット「StableVicuna」を公開
(stability.ai)- Vicuna v0 13Bを命令ファインチューニングおよびRLHFで学習
- 3つのデータセットを用いてSFT(Supervised Fine-Tuning)
- OpenAssistant Conversations Dataset(OASST1)
- GPT4All Prompt Generations
- Alpaca
- HuggingFaceでLLaMAモデル向けの重みデルタとしてダウンロード可能(オリジナルのLLaMAデータが必要)
まだコメントはありません。