14 ポイント 投稿者 xguru 2023-01-31 | 2件のコメント | WhatsAppで共有
  • Google Researchが発表した論文
  • テキストの説明に非常に忠実な音楽を生成。「ディストーションのかかったギターリフが敷かれた穏やかなバイオリンメロディ」
  • 階層的なシーケンス間モデリングのタスクとして定式化し、数分間の24kHz音楽を生成
  • 既存システムよりも音質やテキスト説明への準拠においてはるかに優れている
  • また、口笛やハミング形式のメロディスタイルも変換可能
  • 複数のプロンプトを順次提供し、ストーリーモードでオーディオを生成可能
  • 5.5kの音楽-テキストペアで構成されたMusicCapsデータセットを公開

2件のコメント

 
jin225675 2023-01-31

テキストだけでここまでのクオリティを出せるのはすごいですね!
ただ、まだかなり不自然なものも多いので、クリエイターがアイデアを得る用途でより多く使われるのではないかという気もします。