Alpaca-LoRA : Low-Rank LLaMA Instruct-Tuning

xguru · 2023-03-22T10:17:02+09:00

Low-Rank Adaptationを利用して、個人のハードウェアでLLaMAを命令チューニングしてみる Raspberry Piで動作可能でありながら、text-davinci-003に近い品質のモデル学習コードは単一のRTX 4090で5時間以内に実行可能低コストで効率的なファインチューニングのために、Hugging FaceのPEFT(Parameter-Efficient Fine-Tuning)とTim Dettmerのbitsandbytesを使用

(github.com/tloen)

19 ポイント投稿者 xguru 2023-03-22 | まだコメントはありません。 | WhatsAppで共有

Low-Rank Adaptationを利用して、個人のハードウェアでLLaMAを命令チューニングしてみる
Raspberry Piで動作可能でありながら、text-davinci-003に近い品質のモデル
学習コードは単一のRTX 4090で5時間以内に実行可能
低コストで効率的なファインチューニングのために、Hugging FaceのPEFT(Parameter-Efficient Fine-Tuning)とTim Dettmerのbitsandbytesを使用

Alpaca-LoRA : Low-Rank LLaMA Instruct-Tuning

関連記事

まだコメントはありません。