Alpaca: GPT-3.5級の強力なオープンソース Instruction-Following モデル

xguru · 2023-03-14T11:21:01+09:00

スタンフォードCRFMがMetaのLLaMA 7Bを52KのInstruction-Followingデータでファインチューニング OpenAIのGPT-3.5（text-davinci-003）と似たように動作するが、非常に小さく低コスト学習レシピとデータを公開し、今後はモデル重みもリリース予定研究目的のみで公開され、商用利用は禁止ファインチューニングには80GB A100を8基使って3時間かかり、クラウドでは約100ドル未満で実行可能

(crfm.stanford.edu)

19 ポイント投稿者 xguru 2023-03-14 | 1件のコメント | WhatsAppで共有

スタンフォードCRFMがMetaのLLaMA 7Bを52KのInstruction-Followingデータでファインチューニング
OpenAIのGPT-3.5（text-davinci-003）と似たように動作するが、非常に小さく低コスト
学習レシピとデータを公開し、今後はモデル重みもリリース予定
研究目的のみで公開され、商用利用は禁止
ファインチューニングには80GB A100を8基使って3時間かかり、クラウドでは約100ドル未満で実行可能

1件のコメント

xguru 2023-03-14

Repo : https://github.com/tatsu-lab/stanford_alpaca
Webデモ : https://crfm.stanford.edu/alpaca/

LLaMAの公開は本当にStable Diffusion Momentを生み出していますね。本当に急速に変化しています。

Alpaca: GPT-3.5級の強力なオープンソース Instruction-Following モデル

関連記事

1件のコメント