- HNでは、オープンソースLLMのファインチューニングへの関心が大きく高まっている(例: Anyscaleの投稿)
- モデルのファインチューニングに関する数年分の経験と知見、そして実用的なコードを共有
- データラベリング、ファインチューニング、効率的な推論実行、コスト/性能評価などを扱うノートブック群を提供
- テストセットでGPT-4のラベルと95%一致する7Bモデルを学習
- ファインチューニングとは何か? テキストで指示を書くことよりも強力なプロンプティングの形
- ファインチューニング済みモデルの学習のため、既存モデルをサンプルの入力/出力ペアで訓練
- プロンプティングとファインチューニングの長所と短所
- ファインチューニングの大きな利点: モデルの挙動を指示するのにはるかに効果的で、より小さなモデルでも十分に対応可能
- ファインチューニングしたLlama 7BモデルはGPT-3.5よりトークンあたり50倍安く、多くのユースケースで同等またはそれ以上の結果を提供
- 例: GPT-4で200万件のレシピ分類を行うと23,000ドルかかるが、私たちがファインチューニングしたモデルはGPT-4に近い性能を示し、データセット全体の実行コストはわずか19ドル
- OpenPipeというオープンソース製品を開発中
- エンジニアができるだけ簡単にファインチューニングを導入できるよう支援するOpenPipe製品
- ファインチューニングについて学んだことを共有するための今回の投稿
1件のコメント
Hacker Newsのコメント