ニュース

AI音楽研究が国際会議で活発化 サイバーエージェントがICASSP 2026に2論文採択、日本音響学会でも新技術続々

音声・音響分野の国際会議「ICASSP 2026」でサイバーエージェントAI Labの論文2本が採択され、日本音響学会でも音楽生成や音声合成に関する最新研究が発表されるなど、AI音楽技術の研究動向が活発化しています。

著者: AISA | 2026/3/5

国際会議ICASSP 2026で日本発の研究が採択

株式会社サイバーエージェントの研究開発組織「AI Lab」は、音声・音響信号処理分野のトップカンファレンス「ICASSP 2026」に2本の論文が採択されたことを発表しました。ICASSPはIEEE Signal Processing Societyが主催する権威ある国際会議で、2026年5月にスペイン・バルセロナで開催されます。

採択された論文は以下の2本です:

1. 「Confidence-based Filtering for Speech Dataset Curation with Generative Speech Enhancement Using Discrete Tokens」
- 生成的音声強調技術において、モデルが出力する確率分布に基づく信頼度スコアを利用し、音素の欠落や話者性の不一致といった「ハルシネーション」をフィルタリングする手法を提案。
- 実環境下のノイズを含む音声資源から、信頼性の高い学習データセットを効率的に構築することを可能にします。

2. 「Voting-based Pitch Estimation with Temporal and Frequential Alignment and Correlation Aware Selection」
- 複数の音高推定モデルの結果を統合する「投票方式」の理論的裏付けを解明。
- 時間・周波数の微細なズレを補正するアライメント手法により、歌声や楽器音を含む多様な信号で高精度な解析を実現。

これらの研究成果は、動画広告制作における音声合成技術の向上や、バーチャルヒューマンなどの高品質コンテンツ生成支援プロダクトへの応用が期待されています。

日本音響学会でも音楽音響研究が進展

一方、国内では日本音響学会第155回(2026年春季)研究発表会において、AI音楽関連の研究が多数発表される予定です。高道研究室の発表資料によれば、以下のような研究が予定されています:

  • Spatial Audio Captioning:複数音源状況下における空間情報を伴う説明文の生成と評価

  • TTSOps 2.0:テキスト音声合成におけるデータ収集・前処理・学習プロセスの統合的最適化

  • XACLE Challenge 2026:環境音とテキストにおける主観的意味関連性の自動評価に向けた国際コンペティション
  • 研究トレンド:実用化と高精度化へ

    現在のAI音楽研究は、単なる「音楽生成」から、音声合成の高品質化音楽的要素の精密な解析実環境での実用性向上といった方向に進んでいます。特に、ノイズの多い環境下での安定した推定や、ハルシネーションの防止など、実用化に向けた課題解決に焦点が当てられています。

    これらの研究動向は、AIが単なる「作曲アシスタント」を超えて、音楽制作の全工程を支える基盤技術として発展していることを示しています。

    AISA Radio ALPSでは、こうした最新の研究動向を踏まえ、AI音楽の未来についてさらに深く掘り下げていきます。次回の放送でも、実際の音楽制作にどう活かせるのか、クリエイター目線でお伝えしますので、お楽しみに!

    情報源