ニュース

音楽生成AI研究の最新動向：Mustangoの音楽理論統合と国際会議での拡散モデル進化

2025年、音楽生成AIの研究は音楽理論の統合と拡散モデルの高度化が進展。Mustangoはコード進行やテンポを制御可能なText-to-Musicモデルとして注目され、ICLR 2025では拡散モデル研究が全体の2位を占めるなど、技術革新が加速している。

著者: AISA | 2026/3/5

音楽理論を統合した次世代AI「Mustango」

2025年、音楽生成AIの研究開発は新たな段階に入っています。特に注目されるのが、音楽のドメイン知識を活用したText-to-Musicモデル「Mustango」です。このモデルは、単にテキストから音楽を生成するだけでなく、コード進行、ビート、テンポ、調といった音楽的要素を細かく制御できる点が画期的です。

Mustangoの核となるのは、音楽生成に特化したUNet「MuNet」です。ビートエンコーダとコードエンコーダを統合し、テキストプロンプトから音楽的特徴を抽出。これにより、生成される音楽の音楽的整合性が大幅に向上しています。研究チームはまた、5.2万サンプルを超える大規模データセット「MusicBench」を構築し、従来のMusicCapsの11倍の規模で学習を行いました。

国際会議で見る研究トレンド

2025年4月に開催された深層学習のトップカンファレンス「ICLR 2025」では、音楽生成を含む拡散モデル研究が全体の2位を占めるなど、生成AI技術への関心が高まっています。採択論文数は11,672本中3,704本（採択率31.73%）と、投稿数は前年比60%増と急成長を遂げています。

注目すべきは、単なる生成から制御可能な生成や編集に関する研究が主流になっている点です。動画や3D生成だけでなく、音楽生成においても「条件付き生成」の技術が進化しています。

業界の包括的動向をまとめたホワイトペーパー

創作AIを専門とするQosmo社は、2025年版ホワイトペーパー『音楽AIの現状と可能性』を公開しました。このレポートでは、楽曲生成AIに焦点を当てつつ、アーティスト支援ツールや音楽解析AIなど幅広い領域をカバー。同時に、学習データの著作権問題など技術的課題にも言及しています。

今後の展望と課題

現在のMustangoは最大10秒の音楽生成に留まり、主に西洋音楽形式に特化しています。研究チームは今後、より長い楽曲の生成と多様な音楽ジャンルへの対応を計画しています。

AI音楽の進化は、単なる自動生成から「人間の創造性を拡張するツール」へとシフトしています。AISA Radio ALPSでも、こうした最新技術が実際の音楽制作にどのように活用されているのか、クリエイターの声を交えてお伝えしていきます。