ビートルズも活用する「AIによる音源分離」とは? 音楽クリエイティブを支える技術の可能性を探る

 昨年、「Midjourney」「Stable Diffusion」といった画像生成AIや、チャットボットの「ChatGPTが公開されて以降、世間の関心がAIに集まっている。そして、今年に入ってからは、音楽の分野でもAIはホットワードのひとつとなっており、最近ではアーティストや音楽クリエイターがAIについて、自身の見解を述べることも少なくない。

 たとえば、DJ/プロデューサーのデヴィッド・ゲッタは、「音楽の未来はAIにある」と発言するなど、AIを活用した音楽制作に肯定的な意見を表明している1人だ。一方で人気ラッパーのドレイクは、今春ごろからSNS上で大きな話題になった、AIによって実在するアーティストの声を再現して作られたカバー楽曲や“偽の新曲”(架空の新曲)に対し、懸念を示している。

 このように現在、AIを音楽制作に活用することに対しては、アーティストや音楽クリエイターの間でも賛否が分かれる。AIによって自分の音楽制作能力が向上するという意見がある一方で、自分の仕事が奪われるかもしれないという意見もあり、また無許可でアーティストの音楽がAIに学習されることに対して法律や倫理の観点から問題視する意見も散見される。

 しかしながら、AIによって新たな音楽クリエイティブが生まれること(あるいは生まれていること)は否定できない。最近の例でいえば、AIを活用した「音源分離」により、ポール・マッカートニーがThe Beatles(以下、ビートルズ)の新曲を完成させたことが挙げられる。

 今年6月、ポール・マッカートニーは英・BBC Radio4の番組『Today』に出演し、AIによる音源分離を使用してジョン・レノンの歌声を抽出、ビートルズの“最後の曲”を完成させたと明らかにしている。かつてジョン・レノンによって作成された古いデモ音源から、AIによる音源分離を試みてレノンの声を抽出したと説明。曲名は明らかにされていないが、BBCによると1978年にジョン・レノンが作曲した「Now And Then」である可能性が高いという。

 こうしてAIの音源分離によって制作されたビートルズの“新曲”だが、この元となった楽曲は実は以前にも一度音源化が予定されていた。しかし当時の音源はノイズが多く、リリース音源としてのクオリティが十分でないことを理由に公開が断念されたという背景がある。

AIを活用した「音源分離」の仕組みとは?

 ここで一度、AIによる「音源分離」の仕組みについて簡単に説明しよう。音源分離とは、平たく言うとAIがニューラルネットワークを通じて音楽の特徴を学習し、複数の音が混ざった状態でも個々の音を聞き分け、分離することができるという技術だ。

(出典:https://prtimes.jp/main/html/rd/p/000000004.000061313.html)

 この技術により、アーティストや音楽クリエイターは、前述したビートルズの例のように過去の録音音源からボーカルだけを抜き出してクリーンな音質に変換し、新たにリマスター音源やリミックスを制作することが可能になる。

 このユースケースにおいて、一般的に手に入るツールの中でもっともよく知られているのは、iZotopeが開発するオーディオリペアツール『RX』だろう。AIによるリペアアシスタント機能も搭載したRXでは、古い音源からノイズを除去したり、低音や高音感に欠ける過去の音源であっても周波数を合成して復元するといったことが可能。だが、とくにクリエイターからの注目を集めたのは、音源分離機能である「Music Rebalance」だろう。この機能では、AIによる機械学習アルゴリズムを用いて、既存の音源を4つのパート(ボーカル、ベース、パーカッション、その他)に解析し、それぞれのパラメーターを調整することでボーカルやベースのみのパートとして分離させることが可能だ。

『RX 7』

 また現在の音楽シーンにおいて、音源分離機能の搭載が業界標準化しつつあるのがDJソフトだ。この分野では、AIによる音源分離機能を搭載した『djay Pro AI』や『VirtualDJ』がよく知られている。それだけでなく、最近では定番のDJソフト『Serato』にもAIによる音源分離ではないものの、独自アルゴリズムを用いた同様の機能が搭載されるなど、クリエイティブなDJプレイの実現のために幅広いソフトで音源分離機能が採用、ユーザーによって活用されている。

 さらに、Apple MusicやAmazon Music Unlimitedといった音楽ストリーミングサービスで配信されている「空間オーディオ」フォーマットの音源制作においても、音源分離技術は活用されている。このユースケースでは、過去に録音されたモノラル音源から楽器やボーカルのパートを分離させ、立体音響空間に“再配置”することで空間オーディオフォーマットの音源が制作されている。空間オーディオに対応した楽曲でいえば、2021年にはビートルズもこの手法を活用して、1966年のアルバム『Revolver』の新しい空間オーディオミックスを制作している。

The Beatles REVOLVER Special Editions - Official Trailer

 また音源分離技術は、こうした音楽制作やDJの現場以外に、より消費者に近い場所で使用されているものもある。音楽ストリーミングサービスのカラオケ機能はまさにそのひとつだ。たとえば、LINE MUSICには楽曲のボーカルだけをオフにして、ユーザーの歌声を音源にミックス、再生させることでカラオケさながらの体験を楽しめる機能が搭載されている。そして、これにはソニーが開発した音源分離技術が使用されている。この機能は、クリエイティブの現場から離れたより大衆向けのものであるため、すでにもっとも日常的に使用されている音源分離技術の活用例と言えるだろう。ちなみに同様の機能はSpotifyやApple Musicといった競合サービスにも搭載されているが、両サービスは今のところこの機能にAIを活用しているか否かは公にしていない。しかし、昨今の音源分離におけるトレンドや技術の性質上、LINE MUSIC同様にAIが活用されていることは予想に難くない。

(出典:https://prtimes.jp/main/html/rd/p/000000004.000061313.html)

関連記事