- SpotifyのAI DJ機能がクラシック音楽を正しく認識できない事例を通じて、AIの限界と音楽メタデータの問題を浮き彫りにしている
- ユーザーが「ベートーヴェンの交響曲第7番」をリクエストすると、AIは作品の構造や楽章の順序を理解できず、見当違いの楽章や別の作曲家の曲を再生する
- 「全楽章を順番に再生しろ」という具体的な命令にもかかわらず、AIは誤った交響曲や順序が入れ替わった録音を選び、一貫性のない結果を示す
- こうした誤りの根本原因は、デジタル音楽メタデータがポップ音楽中心に設計されており、作曲家・作品・楽章という概念を反映できていないためだ
- 記事はAIの「知能」への期待と現実の乖離を指摘し、西洋音楽の伝統の保存は企業利益と無関係だという冷笑的な結論で締めくくられる
AI DJの利用体験と問題意識
- 記事は「AIは本当に知能的なのか?」という問いから始まり、AIの誤りに対する責任がプログラマーにあるのかを問う問題意識を提示する
- SpotifyアプリのAI DJ機能を使ってクラシック音楽の検索を試み、既存のSpotify検索構造の限界をあらためて確認する
- 筆者はポップ音楽ではなく、500年にわたる西洋音楽の伝統を好んで聴くユーザーとして、タリスからショーに至る作曲家たちを例に挙げる
デジタル音楽メタデータの構造的限界
- デジタル音楽ファイルのメタデータはArtist、Album、Songという3つのタグで構成されており、これはポップ音楽中心の設計である
- 「Song」という用語が器楽曲にも使われる非文学的な表現だと指摘し、クラシック音楽では「composition」や「work」が適切だと説明する
- クラシック音楽の中核構造である**『楽章(movement)』という概念**がメタデータに反映されていないため、Spotifyは作品の全体構成を認識できない
ベートーヴェン交響曲第7番の再生実験
- 「Play Beethoven’s 7th Symphony」と命令すると、AIは第2楽章 Allegrettoだけを再生し、その後はまったく無関係な曲を続けて再生する
- 「Play Beethoven’s 7th Symphony in its entirety」と求めても、AIはこれを「9分の全曲」と誤認し、第2楽章だけを再生する
- 「Play Beethoven’s 7th Symphony from beginning to end」という命令でも同様に第2楽章だけを再生し、その後ジョン・フィールドの曲へ切り替わる
- 「Play all four movements」と要求すると、第1楽章から始まるものの、異なるオーケストラの録音が混ざって順序も入れ替わる
- 「Play all four movements in numerical order」という命令では、交響曲第3番の第1楽章から始まるなど、完全に誤った結果になる
AIの音楽理解の欠如
- AIが作品の楽章構成や順序という概念をまったく理解していないことを指摘する
- ベートーヴェンの交響曲が4楽章で構成されるという事実は、Wikipediaの最初の一文を読むだけでも分かるにもかかわらず、AIはそれを反映できない
- 筆者はこうした誤りをオーディオブックの最後の章を先に読むことになぞらえ、AIの無知を風刺する
結論: AIと音楽伝統の断絶
- AIが音楽を「作曲できる」という主張に懐疑的な見方を示し、基本概念すら理解できないAIが創作を論じることはできないと批判する
- Spotify DJがまだベータ段階であることは認めつつも、企業に西洋音楽の伝統を保存する動機がないという現実的な悲観で記事を締めくくる
- 全体としてAI技術の限界、メタデータ設計の偏り、文化的無関心が結び付いた問題として提示される
1件のコメント
Hacker Newsの意見
これは AIの問題ではなく製品設計の問題 だ。Spotify DJは実質的に「シャッフル + 音声コメント」程度で、意図的にアルバム全体を再生できないようにしたコードがある可能性が高い
AIをひとつの概念として一般化するのは誤ったアプローチだ。「この機能ができないならAIは役に立たない」という論理は カテゴリーエラー(category error) に当たる
文章全体が複数の論点を混ぜていて混乱しており、半分はクラシック曲名の羅列にすぎない。Spotify DJがいまひとつだという点には同意するが、説得力のある批判の仕方ではない
技術の長所と短所を探ろうとする姿勢がなく、狭い事例でAI全体を貶す 典型的なパターンだ。AIは人間ではないのだから、限界があるのは当然だ
AIコーディング支援でも似た現象を見てきた。セキュリティ問題を理由に全面否定する一方で、「一文でネイティブMacアプリを作る」可能性は無視している
Hör BerlinのようなYouTubeのDJミックスの魅力は、DJの選曲と解釈、そして彼らの文化的背景にある。AIが最適化されたリストを出すと、その本質が失われる
Spotifyはコスト削減のためにラジオ型とインタラクティブ型のライセンスを混在させている。AIが作ったプレイリストはユーザー自身の選択ではないため、ラジオ型として扱われる可能性が高い
dublab、NTS1、NTS2のような放送をよく聴くが、予想しなかった音楽に出会える
何億ドルを投じても完璧な推薦は不可能で、人間のDJが持つ 社会的信頼(social proof) を置き換えられなかった
音楽についても、ポップと西洋クラシックだけがすべてであるかのような見方が残念だ
私はこれを プロンプト設計の失敗 だと見る。同じ依頼を ChatGPTの例 で試すと、AIは適切に反応する
つまり、Spotifyのモデルが弱いか、内部プロンプトが誤った方向へ誘導していた可能性が高い
「AIは音楽を作曲できない」という主張も誤った比較だ。AIはすでに 音楽理論を理解し、作曲の可能性 を示している。結局は品質と好みの問題だ
人々がLLMを「AI」と呼ぶたびに、認識が歪められる。
これは マーケティング業界最大の成功 であると同時に、世界にもたらした最大級の害のひとつでもある