ニュース
2026年AI音楽研究の最新動向:音楽理論を理解する「Mustango」から商用基盤「Lyria 3」まで
AI音楽生成研究は、音楽ドメイン知識を活用した高精度な制御モデル「Mustango」の登場や、Googleの商用サービス「Lyria 3」の展開など、社会実装段階へと移行している。国際会議では、AIと人間の共創を探る研究も活発だ。
著者: AISA | 2026/3/27
研究トレンド:音楽理論の理解と制御性の向上
2026年現在、AI音楽研究の焦点は「単なる音の生成」から「音楽理論に基づいた意図的な制御」へとシフトしている。代表的な研究が、NAACL 2024で発表された「Mustango」だ。このモデルは、テキスト指示に加えてコード進行、ビート、テンポ、調といった音楽的要素をプロンプトとして受け取り、それに従った高品質な音楽を生成する。拡散モデルをベースに、音楽生成に特化した「MuNet」を採用し、大規模データセット「MusicBench」(約5.3万サンプル)で学習することで、既存モデルを上回る制御性能を実証した。
国際学会での活発な議論
音楽情報処理研究の最大級の国際会議であるISMIR(International Society for Music Information Retrieval Conference) では、AIと人間の共創を探る研究が発表されている。2025年に韓国で開催されたISMIR2025では、理化学研究所のチームが「Melody Slot Machine with RoboSax」を発表。AIが生成したメロディを、ロボットサックスアンサンブルが自動演奏するシステムを披露し、AIとロボット、人間の作曲家が協調する未来像を示した。
商用サービスと社会実装の加速
研究の成果は急速に実用化されている。Googleは音楽生成モデル「Lyria 3」を発表し、Geminiアプリ内でのカスタムサウンドトラック生成機能を展開した。最大の特徴は、著作権と安全性への配慮を前提とした設計だ。既存アーティストの模倣を防ぎ、商用利用可能な明確なポリシーを提示することで、クリエイターがリスクを抑えて活用できる基盤を整えつつある。この動きは、AI音楽が「実験段階」から「社会実装段階」へ移行したことを象徴している。
今後の展望:長尺生成と多様性へ
現在の課題は、生成時間の短さと音楽ジャンルの偏りだ。Mustangoの論文でも、計算リソースの制約から最大10秒の生成に留まる点や、西洋音楽形式への依存が限界として挙げられている。今後の研究は、「より長い楽曲の生成」と「多様な文化圏の音楽への対応」が重要なテーマとなる。
AI音楽の進化は、技術だけでなく、倫理や法制度、そして私たちの創造性のあり方まで問いかけています。AISA Radio ALPSでは、そんなAIと音楽の未来を、最新の研究動向とともに皆さんと探っていきます。
情報源
- https://ai-scholar.tech/articles/audio-and-speech-processing/mustango
- https://www.fidx.co.jp/%E3%80%902026%E5%B9%B4%E7%89%882%E6%9C%883%E9%80%B1%E7%9B%AE%E3%80%91%E7%94%9F%E6%88%90ai%E6%9C%80%E6%96%B0%E5%8B%95%E5%90%91%E3%81%BE%E3%81%A8%E3%82%81%EF%BD%9C%E9%9F%B3%E6%A5%BD%E5%88%B6%E4%BD%9C/
- https://aip.riken.jp/news/ismir2025/?lang=ja