AIコストを毎日100ドルから1ドルに削減した方法:GPT-4を使ったMixtralのファインチューニング
(twitter.com/wenquai)- AIベースのキャリア探索アプリを作ったところ、急成長に伴ってGPT-4のコストが1日100ドル以上かかり始めた
- レイテンシを下げ、品質を維持しながら、AIコストを最大99%削減するために使った方法
- 最も強力なモデル(GPT-4)で結果を出し、その結果を使ってより小さなモデルをファインチューニング
- AIのリクエスト/レスポンスを簡単にExportできるよう保存する。Helicone AIを利用。OpenAI APIをそのまま差し替えるだけで、テーブルにAIリクエストを保存してくれる
- およそ100〜500組のリクエスト/レスポンスのペアがたまったら、Exportして高品質にデータを整形
- このデータセットを使って、Together/AnyscaleのようなホスティングサービスでMixtral 8x7Bをファインチューニング
- GPT-4を新しくファインチューニングしたモデルに置き換える
4件のコメント
ということは、GPT-4の利用規約とMixtralのライセンスの両方に違反したということですか……? @_@
そういうことだと思います。これが目に見えて表れるものではないため、多くの人がそうしているようです。
こっそり使っていたり、あるいは研究用として公開したものはありましたが、
ここまであからさまに「私たちが使いました!」と宣伝したのは、ちょっと……珍しいですね。
何か言われたりしないんでしょうか……?
Hacker Newsの意見