10 ポイント 投稿者 wislan 2023-09-16 | 2件のコメント | WhatsAppで共有

Hacker Newsでllama2をファインチューニングした事例です。

ファインチューニングとは、自分の質問+回答セットでAIモデルを追加調整することです。

ファインチューニングを行うには、最低50個の例が必要で、可能であれば1000個以上の例があるとよいそうです。

広告

著者は、ファインチューニングしたLlama 7BモデルはGPT-3.5より50倍以上安価だと述べています。

もちろん、Llama 7BとGPT-3.5(165B)の比較は無理がありますが、ファインチューニングされたGPTモデルは安価ではないため、Llamaをファインチューニングして使う事例が増えるのではないかと思います。

2件のコメント

 
laeyoung 2023-09-17

"You can run 70B LLAMA on dual 4090s/3090s with quantization. Going with dual 3090s you can get a system that can run LLAMA 2 70B with 12K context for < $2K.

I built two such a systems after burning that much in a week on ChatGPT."

https://news.ycombinator.com/item?id=37489601

コメントが印象的ですね。後に残したコメントを見ると、それぞれ別のチームでデータを異なるフォーマットで管理していたのを、ChatGPTで正規化して1週間でデータフォーマットを揃えたそうです。こうやってうまく組み合わせれば?!

 
wislan 2023-09-17

おお、いいアイデアですね。ReplicateのCEOまで登場してコメントしているのが印象的でした。
GPT-3.5(turboだと推測される)のコストとllama 70bのコストが似たようなものになりそうだという意見が記憶に残っています。
私は実務でGPTを使うつもりですが、llama + ファインチューニングで優位性を得るスタートアップが登場してきそうだと思って持ってきました。