14 ポイント 投稿者 xguru 2023-01-31 | まだコメントはありません。 | WhatsAppで共有
  • Google Researchが発表した論文
  • テキストの説明に非常に忠実な音楽を生成。「ディストーションのかかったギターリフが敷かれた穏やかなバイオリンメロディ」
  • 階層的なシーケンス間モデリングのタスクとして定式化し、数分間の24kHz音楽を生成
  • 既存システムよりも音質やテキスト説明への準拠においてはるかに優れている
  • また、口笛やハミング形式のメロディスタイルも変換可能
  • 複数のプロンプトを順次提供し、ストーリーモードでオーディオを生成可能
  • 5.5kの音楽-テキストペアで構成されたMusicCapsデータセットを公開

まだコメントはありません。

まだコメントはありません。