ポール・マッカートニー、ビートルズ新曲のためにAIを使用
(techcrunch.com)- 今年末に新曲を公開する予定
- 1978年の「Now and Then」のデモ録音から抽出したジョン・レノンのボーカルを収録
- 既存のビートルズメンバーの録音からAIを使ってノイズを除去・分離し、高品質な再生が可能に
- 1995年に残るメンバーだけでこのトラックを録音しようとしたが、ジョン・レノンのトラックの品質が良くなかったため、ジョージ・ハリスンが途中で反対したという
- 今回は新たに録音したかのように、クリーンにボーカルを復元
- マッカートニーは、本質的にはジョン・レノンのオリジナル録音のように聞こえる音楽をAIに生成させることについて、依然としてやや懐疑的な姿勢も見せた
「これが未来だから、少し怖くもあるけれどワクワクもします。」
「これがどこへつながるのか、見守る必要があります。」
6件のコメント
OCRや自然言語処理(翻訳機など)の分野では、従来の古典的なアルゴリズム的アプローチがそれほど良い進歩を見せられなかったのは事実です(〜2010年代)。また、CNNやRNNに基づく深層ニューラルネットワークモデルがそうした分野で高い精度を示し、技術基盤を急速に置き換えていったのも事実でしょう。今、従来の文法解析ベースの翻訳機を使っている会社がどれほど残っているでしょうか。
音質復元の分野でも、従来の補間法や復元アルゴリズムは存在してきましたが、それらに比べてAIモデルベースの復元のクオリティが圧倒的に高いのであれば、産業界は自然とこちらを選ぶだろうと思います。
すでにiZotopeのような世界トップクラスの音響/オーディオソフトウェア企業は、社内に多くのAI研究者を抱えており、iZotope RXのようなソリューションを見ても、音楽から特定の楽器やボーカルを除去するAI技術を最新バージョンで積極的に導入し、提供しています。
ボーカル除去モデルとしてはUltimate Vocal Removerというオープンソースアプリケーションがあるので、一度使ってみてください。性能は本当に優秀です。
AIを利用した各種復元技術は、少なくとも今日ではエレクトロニック・ミュージシャンにとってはかなり前から普及し、当たり前のものになっていますが、具体的にどんな技術を使ったからこそこんな反応が出たのか気になります。
元記事はこのニュースを生成AIと無理やり結び付けて語っていますが、こちらとは完全に別物として見るべき技術ではあります。
もし Enhanced Speech from Adobe のように、出力結果が極端で、しかもパラメータも提供されていない系統のアプリケーションを使ったのだとしたら、こういう反応にも大いに共感できますが。
https://www.techno-edge.net/article/2023/06/14/1436.html
日本の記事ですが、ジョージ・ハリスンは「fxxxing rubbish」と評するほど乗り気ではなかったようです。
https://n.news.naver.com/mnews/article/025/0003286946
この記事では、ジョン・レノンの録音状態に不満があったと書かれています。
トラックを録音した当時、気が進まないと書かれていたようですね。