Meta、オーディオ向け生成AI「AudioCraft」をオープンソースで公開

xguru · 2023-08-03T09:46:56+09:00

テキストベースのユーザー入力から高品質なオーディオと音楽を生成するGenerative AI MusicGen + AudioGen + EnCodecデコーダーで構成され、それぞれ音楽、オーディオ生成、オーディオ圧縮を担当研究目的や、人々の技術への理解を高めるための用途で利用可能プロの音楽家が楽器で単音ひとつ演奏せずに新しい楽曲を作曲したり、インディーゲーム開発者が現実のような効果音や環境音を低コストで実装したりできる

(ai.meta.com)

16 ポイント投稿者 xguru 2023-08-03 | 2件のコメント | WhatsAppで共有

テキストベースのユーザー入力から高品質なオーディオと音楽を生成するGenerative AI
MusicGen + AudioGen + EnCodecデコーダーで構成され、それぞれ音楽、オーディオ生成、オーディオ圧縮を担当
研究目的や、人々の技術への理解を高めるための用途で利用可能
プロの音楽家が楽器で単音ひとつ演奏せずに新しい楽曲を作曲したり、インディーゲーム開発者が現実のような効果音や環境音を低コストで実装したりできる

2件のコメント

ticonweb 2023-08-03

公開されたソースで可能かどうかは分かりませんが、Digital Audio Workstationソフトウェアで楽器ごとのトラックとして重ねられるなら、本当に活用度が非常に高そうですね。

情報ありがとうございます

GN⁺ 2023-08-03

Hacker Newsの意見

AudioCraftのような広告向け生成AIモデルは、A/Bテストを容易にし、創造的な人材を不要にします。
Metaは、特許取得済みのデータを使用し、対価を支払っていないデータは使わないと強調することで、OpenAIとの差別化を図っています。
AudioCraftで使われているCC-BY-NCライセンスは、オープンソースの定義上、オープンソースライセンスとは見なされません。
AI生成コンテンツの氾濫によって過去が失われ、本物と偽物の情報を見分けるのが難しくなるのではないかという懸念があります。
既存の音楽ライブラリを基に音楽を生成する能力についての憶測があります。
一部の人は、著作権者がAIモデルへのデータ入力を統制することは、「思想警察」社会につながりかねないと考えています。
Metaがこのようなモデルをオープンソース化することを選んだ理由は明確ではありません。
一部のユーザーは、インストール方法やモデルの使い方に関するドキュメントを見つけるのに苦労しています。
AudioCraftのMBDとEnCodecのバリエーションの間には、音質の差がはっきりとあります。
あるコメント投稿者は、SpotifyがAudioCraftのような生成AIモデルを使って独自の音楽を生成し、収益性向上のためにレーベルへの依存を減らせるのではないかと提案しています。

Meta、オーディオ向け生成AI「AudioCraft」をオープンソースで公開

関連記事

2件のコメント

Hacker Newsの意見