ニュース

AI音楽研究の最新動向:感情認識の国際ベンチマークと音響グリッチ検出手法がISMIR2025で注目

2025年9月に韓国で開催された音楽情報検索の国際会議ISMIR2025では、文化横断的な音楽感情認識の大規模ベンチマーク「GlobalMood」や、生成AI音楽に特有の音響グリッチを検出する単純な手法など、実用性と学術的洞察を兼ね備えた研究が注目を集めました。

著者: AISA | 2026/3/13

文化を超えた音楽感情認識の大規模ベンチマーク「GlobalMood」

2025年9月に韓国で開催された音楽情報検索の最大級国際会議「ISMIR2025」では、AI音楽研究の新たな潮流が示されました。特に注目を集めたのは、59カ国から2,519人の被験者を集め、1,180曲に対する約90万回の感情評価を収集した大規模ベンチマーク「GlobalMood」に関する研究です。この研究では、フリーワード方式で感情を表現させ、異なる言語間での感情表現の「距離」を分析。例えば、「happy」に相当する言葉は文化間で意味の幅が大きい一方、「calm」や「sad」は比較的一貫しているなど、文化横断的な感情認識モデルの構築に重要な知見を提供しました。

生成AI音楽の「音響的指紋」を暴く単純な検出手法

Deezerの研究チームが発表した別の論文では、生成AI音楽に特有の音響的「グリッチ」に着目。Deconvolution層を通した際に発生する「Checkerboard artifact」と呼ばれる現象を利用し、オーディオスペクトルに対する単純な線形回帰だけで、SunoやUdioなどのモデルで生成された音楽を極めて高精度に検出できることを実証しました。この手法は、複雑な深層学習モデルを用いずとも現時点では有効であり、音楽プラットフォームにおけるAI生成コンテンツの管理への応用が期待されます。

ロボット演奏とAIの協調、ベンチマークの質的向上へ

理化学研究所の音楽情報知能チームは、熊本大学と共同で開発した「Melody Slot Machine with RoboSax」を発表。AIが生成したメロディをサックス演奏ロボットがリアルタイムで演奏するシステムを実演し、人間とAI・ロボットの協調的な音楽創造の可能性を示しました。また、既存の音楽QA(質問応答)ベンチマークにおいて、テキストのみの大規模言語モデルが「メタ読み」で高スコアを獲得してしまう問題を指摘し、真の知覚能力を測るための新たな評価指標「Perceptual Index」を提案する研究も発表され、AI音楽研究の評価基準そのものの進化が促されています。

これらの研究動向は、AI音楽技術が単なる「生成」から、「感情の理解」「文化的文脈の考慮」「人間との協調」「技術的限界の客観的評価」といった、より深く実用的な段階へと移行していることを示しています。AISA Radio ALPSでは、こうした研究の最前線で活躍する研究者へのインタビューも計画中です。AIがもたらす音楽の未来について、一緒に考えていきましょう。

情報源