3 ポイント 投稿者 GN⁺ 2023-09-13 | 1件のコメント | WhatsAppで共有
  • HNでは、オープンソースLLMのファインチューニングへの関心が大きく高まっている(例: Anyscaleの投稿)
  • モデルのファインチューニングに関する数年分の経験と知見、そして実用的なコードを共有
  • データラベリング、ファインチューニング、効率的な推論実行、コスト/性能評価などを扱うノートブック群を提供
  • テストセットでGPT-4のラベルと95%一致する7Bモデルを学習
  • ファインチューニングとは何か? テキストで指示を書くことよりも強力なプロンプティングの形
  • ファインチューニング済みモデルの学習のため、既存モデルをサンプルの入力/出力ペアで訓練
  • プロンプティングとファインチューニングの長所と短所
  • ファインチューニングの大きな利点: モデルの挙動を指示するのにはるかに効果的で、より小さなモデルでも十分に対応可能
  • ファインチューニングしたLlama 7BモデルはGPT-3.5よりトークンあたり50倍安く、多くのユースケースで同等またはそれ以上の結果を提供
  • 例: GPT-4で200万件のレシピ分類を行うと23,000ドルかかるが、私たちがファインチューニングしたモデルはGPT-4に近い性能を示し、データセット全体の実行コストはわずか19ドル
  • OpenPipeというオープンソース製品を開発中
  • エンジニアができるだけ簡単にファインチューニングを導入できるよう支援するOpenPipe製品
  • ファインチューニングについて学んだことを共有するための今回の投稿

1件のコメント

 
GN⁺ 2023-09-13
Hacker Newsのコメント
  • GPT-3.5/4の代替として、Llama 2のモデルのファインチューニング利用に関する記事
  • 一部のユーザーは翻訳作業において、GPT-3.5がLlama 2より100倍安価で、Llama 7Bは質の低い翻訳を返すと指摘
  • OpenAIのGPT-3.5に対する攻撃的な価格戦略について、他のベンダーではなく自社モデルへの依存を促す動きではないかとの推測
  • GPTやその他のLLMの出力を内部代替モデルの学習に使う可能性について議論されており、本番規模で通常のAPIを利用する人々にとって費用対効果の高い解決策になり得る
  • ファインチューニングしたLlama 7BモデルがGPT-3.5より50倍安いという主張に疑問が呈され、一部のユーザーはそれはセルフホスティングでしか達成できないと示唆
  • ファインチューニングの有効性とLoRAを比べた際の疑問が提起
  • ファインチューニング済みLlamaモデルとGPT-3.5の比較は誤解を招くとするユーザーもおり、適切な推論レイテンシの実現やスケーラビリティの問題を挙げている
  • ファインチューニングしたLlama 2モデルの品質は必ずしもChatGPTより優れておらず、ファインチューニングには高品質なデータセットが必要だが、それを構築するのは容易ではない
  • GPTのfunction callingの一貫性とエラー率に疑問が呈されている
  • ユーザーは自分のモデルをファインチューニングするための最良のオープンソースLLMに関心を示している
  • ファインチューニング用データセットが入力/出力ペアであるべきか、それとも自己回帰型でもよいのか明確化を求める声
  • ユーザーは、特に初心者向けに、この種のモデルをファインチューニングする方法を学べる資料に関心を持っている
  • この記事は、ML/LLM分野に入門する人にとって価値ある資料と見なされている。