MusicLM、テキストから音楽を生成するAI

xguru · 2023-01-31T10:04:01+09:00

Google Researchが発表した論文テキストの説明に非常に忠実な音楽を生成。「ディストーションのかかったギターリフが敷かれた穏やかなバイオリンメロディ」階層的なシーケンス間モデリングのタスクとして定式化し、数分間の24kHz音楽を生成既存システムよりも音質やテキスト説明への準拠においてはるかに優れているまた、口笛やハミング形式のメロディスタイルも変換可能複数のプロンプトを順次提供し、ストーリーモードでオーディオを生成可能 5.5kの音楽-テキストペアで構成されたMusicCapsデータセットを公開

(google-research.github.io)

14 ポイント投稿者 xguru 2023-01-31 | 2件のコメント | WhatsAppで共有

Google Researchが発表した論文
テキストの説明に非常に忠実な音楽を生成。「ディストーションのかかったギターリフが敷かれた穏やかなバイオリンメロディ」
階層的なシーケンス間モデリングのタスクとして定式化し、数分間の24kHz音楽を生成
既存システムよりも音質やテキスト説明への準拠においてはるかに優れている
また、口笛やハミング形式のメロディスタイルも変換可能
複数のプロンプトを順次提供し、ストーリーモードでオーディオを生成可能
5.5kの音楽-テキストペアで構成されたMusicCapsデータセットを公開

2件のコメント

jin225675 2023-01-31

テキストだけでここまでのクオリティを出せるのはすごいですね!
ただ、まだかなり不自然なものも多いので、クリエイターがアイデアを得る用途でより多く使われるのではないかという気もします。

xguru 2023-01-31

Riffusion - 音楽を生成するようにファインチューニングされた Stable Diffusion

MusicLM、テキストから音楽を生成するAI

関連記事

2件のコメント