ChatGPTで低コストに学習データを構築する方法
(blog.hashscraper.com)- AIモデルを開発する際は、データセットの量と質の両方が重要
- ChatGPTを活用すれば低コストでデータセットを構築でき、ラベリング代行業者を利用するよりも時間を短縮できる
- 英語で問い合わせると、コスト削減(トークン数の節約)だけでなく性能も優れている
- 一般的な状況では、temperatureを0に下げて一貫した回答を得るほうが有利
- role(user, assistant, system)に適切な振る舞いを指定
- 単純計算では、3ドルで約1万件の感情分析データセットをラベリング可能(gpt-3.5-turboモデル基準)
まだコメントはありません。