Alpaca: GPT-3.5級の強力なオープンソース Instruction-Following モデル
(crfm.stanford.edu)- スタンフォードCRFMがMetaのLLaMA 7Bを52KのInstruction-Followingデータでファインチューニング
- OpenAIのGPT-3.5(text-davinci-003)と似たように動作するが、非常に小さく低コスト
- 学習レシピとデータを公開し、今後はモデル重みもリリース予定
- 研究目的のみで公開され、商用利用は禁止
- ファインチューニングには80GB A100を8基使って3時間かかり、クラウドでは約100ドル未満で実行可能
1件のコメント
Repo : https://github.com/tatsu-lab/stanford_alpaca
Webデモ : https://crfm.stanford.edu/alpaca/
LLaMAの公開は本当にStable Diffusion Momentを生み出していますね。本当に急速に変化しています。