Lamini - LLM学習用instructionセットを作成するデータジェネレーター
(github.com/lamini-ai)- 独自のinstruction-following LLMをファインチューニング可能にするオープンソース
- 71kのinstructionデータセット(CC-BYライセンスで商用利用可能)
- データジェネレーターのコードを提供(100個のデータポイントだけで70k+のデータポイントを生成可能)
- この100個のデータポイントの原型をカスタマイズして、自分のドメインに合わせて調整可能
まだコメントはありません。