Nvidia、LLM訓練向けの合成データ生成パイプラインを公開

xguru · 2024-06-17T09:41:01+09:00

NVIDIAがNemotron-4 340Bモデル群を発表ヘルスケア、金融、製造、小売など多様な業界で、商用LLMの訓練向けに合成データを生成するために利用可能高品質な訓練データは、カスタムLLMの性能、精度、応答品質において重要な役割を果たす。しかし、堅牢なデータセットは高コストで入手しにくい Nemotron-4 340Bは、開発者が強力なLLMを構築するのに役立つ合成データを無料で生成できる、スケーラブルな方法を提供 Base、Instruct、Rewardモデルを含む LLMの訓練と改善に使われる合成データを生成するためのパイプラインを構成オープンソースフレームワークのNVIDIA NeMoに最適化されており、NVIDIA TensorRT-LLMライブラリとも互換性がある現在Hugging Faceからダウンロード可能で、ai.nvidia.comではNVIDIA NIMマイクロサービスとしても提供予定 Nemotronを用いた合成データ生成 LLMは、大規模で多様なラベル付きデータセットへのアクセスが難しい状況で、合成訓練データを生成するために利用可能 Nemotron-4 340B Instructモデルは、実データの特性を模倣した多様な合成データを生成し、カスタムLLMの性能と堅牢性を高められる Nemotron-4 340B Rewardモデルは、AIが生成したデータの品質を高めるため、高品質な応答をフィルタリングする。このモデルは応答を、有用性、正確性、一貫性、複雑性、冗長性の5つの属性で評価する研究者はNemotron-4 340B Baseモデルをユーザー独自データと組み合わせて使用し、独自のInstructまたはRewardモデルを作成できる NeMoによるファインチューニングとTensorRT-LLMによる推論最適化 NVIDIA NeMoとNVIDIA TensorRT-LLMを使用して、合成データを生成し応答を評価するために、InstructモデルおよびRewardモデルの効率を最適化できる Nemotron-4 340Bモデル群は、複数のGPUとサーバーにまたがって個別の重み行列を分割することで、効率的な大規模推論を可能にするテンソル並列処理を活用する 9兆トークンで訓練されたNemotron-4 340B Baseモデルは、NeMoフレームワークを使って特定の用途やドメイン向けにカスタマイズできる NeMoフレームワークを通じてさまざまなカスタマイズ手法が提供され、これにより精度を高め、特定のサブタスクに対する出力を改善できるモデル品質を向上させるため、NeMo AlignerとNemotron-4 340B Rewardモデルは、アノテーション付きデータセットを用いてモデルをアラインメントできる

(blogs.nvidia.com)

11 ポイント投稿者 xguru 2024-06-17 | 1件のコメント | WhatsAppで共有

NVIDIAがNemotron-4 340Bモデル群を発表
- ヘルスケア、金融、製造、小売など多様な業界で、商用LLMの訓練向けに合成データを生成するために利用可能
高品質な訓練データは、カスタムLLMの性能、精度、応答品質において重要な役割を果たす。しかし、堅牢なデータセットは高コストで入手しにくい
Nemotron-4 340Bは、開発者が強力なLLMを構築するのに役立つ合成データを無料で生成できる、スケーラブルな方法を提供
- Base、Instruct、Rewardモデルを含む
- LLMの訓練と改善に使われる合成データを生成するためのパイプラインを構成
- オープンソースフレームワークのNVIDIA NeMoに最適化されており、NVIDIA TensorRT-LLMライブラリとも互換性がある
- 現在Hugging Faceからダウンロード可能で、ai.nvidia.comではNVIDIA NIMマイクロサービスとしても提供予定

Nemotronを用いた合成データ生成

LLMは、大規模で多様なラベル付きデータセットへのアクセスが難しい状況で、合成訓練データを生成するために利用可能
Nemotron-4 340B Instructモデルは、実データの特性を模倣した多様な合成データを生成し、カスタムLLMの性能と堅牢性を高められる
Nemotron-4 340B Rewardモデルは、AIが生成したデータの品質を高めるため、高品質な応答をフィルタリングする。このモデルは応答を、有用性、正確性、一貫性、複雑性、冗長性の5つの属性で評価する
研究者はNemotron-4 340B Baseモデルをユーザー独自データと組み合わせて使用し、独自のInstructまたはRewardモデルを作成できる

NeMoによるファインチューニングとTensorRT-LLMによる推論最適化

NVIDIA NeMoとNVIDIA TensorRT-LLMを使用して、合成データを生成し応答を評価するために、InstructモデルおよびRewardモデルの効率を最適化できる
Nemotron-4 340Bモデル群は、複数のGPUとサーバーにまたがって個別の重み行列を分割することで、効率的な大規模推論を可能にするテンソル並列処理を活用する
9兆トークンで訓練されたNemotron-4 340B Baseモデルは、NeMoフレームワークを使って特定の用途やドメイン向けにカスタマイズできる
NeMoフレームワークを通じてさまざまなカスタマイズ手法が提供され、これにより精度を高め、特定のサブタスクに対する出力を改善できる
モデル品質を向上させるため、NeMo AlignerとNemotron-4 340B Rewardモデルは、アノテーション付きデータセットを用いてモデルをアラインメントできる

1件のコメント

soychick 2024-06-17

Nemotronを用いて合成データを生成し、これをLLMの学習に活用可能

Nvidia、LLM訓練向けの合成データ生成パイプラインを公開

Nemotronを用いた合成データ生成

NeMoによるファインチューニングとTensorRT-LLMによる推論最適化

関連記事

1件のコメント