音楽同位体 可不やバーチャル若大将で話題に CeVIO AI開発者に聞く、“声”を後世に残す音声創作ソフトの未来
「音楽同位体 可不」「Kizuna AI Original Singeroid “#kzn”」音楽で活躍するCeVIO AI
――最近ではツミキ feat. 可不の「フォニィ」などを筆頭に、CeVIO AIの歌声合成ソフトウェアを使ったヒット曲が多く生まれています。この盛り上がりはどう感じていますか?
大浦:ちょうど、いわゆるボカロブームが少し落ち着いたタイミングでCeVIO AIの発表があり、そこから現在はまたそういった音楽シーンが盛り上がっている状況だと思うのですが、そのタイミングで音楽をつくりはじめた若いユーザーの方々に、新しい道具として受け入れていただけたのかなと思っています。ボカロPの方々って色々な才能を持ち合わせていて、作詞作曲だけでなく、いかに神調教をするか、どんな絵師さんや映像作家さんをアサインするかなど様々な能力が求められます。その中でも調教(調声)については、CeVIO AIを使えばある程度障壁を下げる役割ができるのかな、と思っています。CeVIO AIは、クライアントさんごとの要望で再現度こそ変わってはいますが、基本的にはもとの声の再現を目指しているので、ざっくりと楽譜を入力しても、ある程度自然な歌声になりますので。
――中でも、<KAMITSUBAKI STUDIO>のバーチャルシンガー・花譜さんとのコラボレーションで生まれた「可不」は、非常に人気の高い歌声合成ソフトウェアになりました。
大浦:「可不」では、KAMITSUBAKI STUDIOのプロデューサーのPIEDPIPERさんが「本人っぽいもの」「少し幼くしたもの」「ケロらせたもの」の3つを出してアンケートを取られていましたよね。そのアンケートでは本人っぽいものの得票数が多かったと思いますが、実際には少し幼くしたものが起用されていて、花譜さんの歌声とは少し違うものになっています。
――PIEDPIPERさんはその差異を「音楽的同位体」という言葉で表現されていますね。
大浦:本当の意図は<KAMITSUBAKI STUDIO>の方々にしかわかりませんから、これは私自身の感想でしかないのですが、音楽的同位体「可不」は、花譜さんとは漢字も変わっていますし、他社さんだとキズナアイさんの「Kizuna AI Original Singeroid “#kzn” / CeVIO AI」も、キズナアイさんそのままの名前にはなっていません。こうしたものは、「オリジナルの存在意義を残したい」ということなのかなと推察しています。ご本人の歌声と歌声合成ソフトウェアを同一化してしまうと、技術が発達したときに、本人が歌っていない歌を本人のものとしてみなされてしまう可能性が出てきますし、何か意思に反した使われ方をする危険性もあるかもしれません。「似ているけれども違うもの」という形にすることで、ご本人のオリジナル性と、ユーザーさんによる創作の領域を分けて考えられているんだと思っています。
この辺りについては何もレギュレーションを決めたりせず、クライアントのみなさんが好きな形を選んでいただければと思っています。私たちとしては、クライアントさんがそれぞれの世界をつくっていただく余地を残しておきたい。また、CeVIO AIは最近ではフィーちゃん(CCD-0500[FEE])のようなVR関連のキャラクター/アバターの参画もありました。ですから、ボカロシーンだけでなく、VRやゲーム、バーチャルシンガーなど様々な分野で活用いただくためにも、それをひとつにまとめたくない、とも考えていました。この音声合成システムを「それぞれの座標で、好きに生かしていただきたい」と思っています。
声優や歌手の“声”を文化財として後世に残すことも可能
――「本人の声」と「歌声合成の声」にまつわるアイデンティティの問題は非常にデリケートで大切な部分だと思います。大浦さんはどんな未来を描いていますか?
大浦:私個人としては、その2つが上手く共存できる未来を探っていきたいと思っていますが、大事なのは「ご本人がどう思うか」です。声の持ち主の方々や所属事務所さんが嫌だというのなら、それを出すのはいいことだとは言えません。第一にご本人、故人の場合はご家族の意思を確認することは、音声合成技術が人と共存していく未来を考えるために重要だと思っています。
たとえば、CeVIOプロジェクトの製品ではありませんが、テクノスピーチで担当させていただいた加山雄三さんのバーチャル若大将の事例では、加山雄三さんの歌唱を音声合成で再現していきました。これは事務所の方にしかお渡ししておらず、スタッフの方々がコントロールできる環境下で使用するもので、加山さんの声を忠実に再現しました。
――加山さんの場合は、ちょうど体調を崩してリハビリに向かっている段階でのオファーだったと思います。そう考えると「自分の声を残す」という使い方も可能になりますね。それぞれの目的、使用する環境、使い方などで意味が大きく変わるように感じます。
大浦:最近は状況が変わってきているんですけれども、以前は「テクノスピーチです」といってタレントさんや声優さんの事務所にうかがうと、敵のような見方をされることも多くありました。ですが、使い方を間違えなければ、音声合成技術は、お互いにとっていいものになりえると思うんです。少なくとも、私はそういった方々とも共存していけたらと思っています。
――最近では『BangDream!』シリーズとCeVIO AIのプロジェクト「夢ノ結唱」も発表されました。ここではPoppin'Partyの戸山香澄をモデルにした「POPY」と、Roseliaの湊友希那をモデルにした「ROSE」の発売が決定しています。
大浦:様々な展開先のひとつとして「歌声合成」をカウントいただけて光栄でした。ゲームやアニメなど、『BangDream!』シリーズのメディアミックス展開は多くの方がかかわるような非常に大規模なものだと思うのですが、小さな企業の技術が、そういったものと同様にメディアミックスの展開先として認識していただけることがとても嬉しく思っています。
とにかく、私としては、AIによる音声合成技術や歌声合成ソフトウェアがもともとの声の持ち主の方々と仲間になれるような未来を模索していきたい、と思っています。ご本人と似ているけれども別の声/別の存在が、自分の代わりに番宣をしてくれたり、ご本人と一緒に何かをするということも可能です。実際に、花譜さんは音楽的同位体の「可不」とライブで共演していますよね。そういったものからも、何か新しい可能性が生まれるかもしれません。
――「相棒になってもらう」「自分の代わりになってもらう」など、最適な活用法は人によって大きく変わっていきそうですね。
大浦:たとえば、長く続くアニメ作品のキャラクターの声を担当されている声優さんが亡くなられた際、その方の声は、無形文化財と言えるほど非常に貴重なものだと思うんです。そういったときに、生前にご本人の同意がある場合に限ってだと思いますが、その声質をデータから再現して、後世に伝えていくという活用法もできるでしょう。若くして夭逝されたアーティストの方々にも、活用できるかもしれません。あくまでご本人本位で、文化財として声を残すという活用法も可能です。また、観光地のイメージキャラクターなどの声の部分を担当し、さとうささらがナレーションをしたりテーマソングを歌ったりするという事例も出てきています。様々な活用法が考えられると思っています。
――声帯はある意味消耗品でもあると考えると、使いようによっては、声の仕事をされる方が自分の仕事を長く続けるための手助けにもなるかもしれません。
大浦:そうですね。もし気になる方がいらっしゃったら、お声がけいただきたいです。そして、音声合成が自身の分身となって仕事をしてくれる相棒となったり、後世に残すべき文化財となったりするモデルケースを増やしていかなければいけない、と思っています。CeVIO AIは、コンシューマー向けに音声合成のクオリティを調整していますが、よりハイスペックなPC向けのものをつくってそれを事務所さんだけに渡すのであればより高いクオリティの音声合成も可能です。やはり大切なのは、「適切に活用していただくこと」だと思っています。