- シンプルなテキストプロンプトから、最大47秒の高品質なオーディオデータを生成可能
- 特化したトレーニングにより、ドラムビート、楽器のリフ、アンビエントサウンド、フォーリー録音、音楽制作やサウンドデザイン向けのその他のオーディオサンプルの作成に最適
- このオープンソースリリースの主な利点は、ユーザーが独自のカスタムオーディオデータでモデルをファインチューニングできること
- たとえば、ドラマーは自分のドラム録音サンプルでファインチューニングして、新しいビートを生成できる
- Stable Audioと何が違うのか?
- 商用製品のStable Audioは、最大3分の一貫した音楽構造を持つ高品質なフルトラックに加え、audio-to-audio生成や一貫性のあるマルチパート音楽作曲などの高度な機能を提供
- 一方、Stable Audio Openはオーディオサンプル、効果音、プロダクション要素に特化している
- 短い音楽クリップは生成できるが、楽曲全体、メロディ、ボーカル向けには最適化されていない
- このオープンモデルは、クリエイティブコミュニティとともに責任ある開発を優先しながら、サウンドデザイン向け生成AIへの知見を提供する
- Stable Audio Openのモデル重みはHugging Faceで利用可能
- サウンドデザイナー、ミュージシャン、開発者、オーディオ愛好家はモデルをダウンロードして、その機能を探求し、フィードバックを提供することが推奨される
まだコメントはありません。