19 ポイント 投稿者 xguru 2023-03-14 | 1件のコメント | WhatsAppで共有
  • スタンフォードCRFMがMetaのLLaMA 7Bを52KのInstruction-Followingデータでファインチューニング
  • OpenAIのGPT-3.5(text-davinci-003)と似たように動作するが、非常に小さく低コスト
  • 学習レシピとデータを公開し、今後はモデル重みもリリース予定
  • 研究目的のみで公開され、商用利用は禁止
  • ファインチューニングには80GB A100を8基使って3時間かかり、クラウドでは約100ドル未満で実行可能

1件のコメント

 
xguru 2023-03-14

Repo : https://github.com/tatsu-lab/stanford_alpaca
Webデモ : https://crfm.stanford.edu/alpaca/

LLaMAの公開は本当にStable Diffusion Momentを生み出していますね。本当に急速に変化しています。