ボカロシーンに広がる「音声合成ソフトウェアの多様化」から生まれた新たな“創作論” いよわ×RED 対談

 2023年3月18日~21日、ボーカロイド文化の祭典『The VOCALOID Collection ~2023 Spring~』(通称:ボカコレ2023春)が開催される。

 ボカロ文化の再評価やさらなる発展に寄与してきた同イベントも、今回で6回目を迎えることなった。1回目から特集企画に携わっている編集の立場からすると、回を追うごとに感じている大きな流れがある。それは「音声合成ソフトウェアの多様化」だ。

 「ボカロ」=『VOCALOID』というのは概念として間違えてはいないが、2023年を生きる“ボカロP”たちは、UTAU、CeVIO、VOICEROID、NEUTRINO、SynthesizerVなど、あらゆる音声合成ソフトを使い、表現することが当たり前になっている。

 そこで今回は、『VOCALOID』とその他の合成音声ソフトの両方で楽曲を手掛ける若手クリエイター・いよわとREDの2人による対談を実施。音声合成ソフトの使い分けやテクニック、リアルな歌声とキャラクター的な歌声に宿るそれぞれの面白さ、二人の音楽制作におけるルーツを知れば、いまのボーカロイドシーンにさらなる深みや広がりが生まれていることに気づくことができるはずだ。(中村拓海)

「『CeVIO AI』や『VoiSona』と『VOCALOID』の違いは“人間らしいかどうか”」(RED)

――お2人はこれまで、対面でお話したことはあるんですか?

RED:お互いに作品はずっと見ていたと思うんですけど、お話するのは今日が初めてで。でも同じ空間にいたことはあったんですよね。いつの『THE VOC@LOiD M@STER(ボーマス)』でしたっけ。

いよわ:10月だったと思います。僕はそのときのボーマスにはサークル出展していなくて、お客さんとしていろんなCDを買いに行っていたんです。そのときにREDさんのサークルにも買いに行ったんですよ、ただの買い物客として(笑)。

RED:僕はそれをあとからSNSで知って、「ご挨拶できていない!」と思って焦りました(笑)。だから今日お会いして、まずはじめにそのことをお伝えしました。

――では、お互いにボカロPとして対面するのは今日が初めてなんですね。まずそれぞれにお伺いしたいのですが、ボカロと出会ったきっかけはどんなものだったんですか?

いよわ:僕は音ゲーでボカロ楽曲を聴いてからです。小学校中〜高学年で『太鼓の達人』に狂ったようにハマって、ゲームセンターに通いつめていた時期があるんです。1回プレイして、順番に並び直している間に前の人がプレイしているのをよく見ていたんですが、そこでじんさんの「チルドレンレコード」に出会って。「格好いい!」と思って、家に帰ってタイトルから色々調べていくうちに『カゲロウプロジェクト』にハマって、ほかのボカロ曲も聞くようになったのが始まりでしたね。

RED:僕はあまりいないタイプのような気がしてるんですが、元はというとバンド活動をしていたんです。でも「これから活動を頑張るぞ!」というタイミングでちょうどコロナ禍に突入してしまって……。活動がまったくできなくなってしまい「どうしよう」と思っていたときに、たまたまボーカロイドに出会って、自分でも制作してみようかなと思ったのが始まりでした。ボカロの文化をほぼ知らない状態でいきなり飛び込んでいったので、異世界にいきなり飛び込んだみたいな感覚で。先人たちが培ってきた十数年分の歴史を、2020年に一気に見て、すごく衝撃を受けました。

――コロナ禍が大きなターニングポイントだったんですね。

RED:そうなんです。『ボカコレ』の1回目が2020年だったと思うんですが、そこでいよわさんの作品を初めて聴かせてもらって、それにも衝撃を受けました。僕もいよわさんと同じように曲からイラスト、動画まですべて自分で制作してるんですが、それも「1000年生きてる」を見て、「『全部自分で作る』っていう方法があったんだ!」と思ってやってみたのがきっかけなんです。曲は作っていたんですけど、どう投稿しようか迷っていたタイミングだったので、いよわさんの作品との出会いは衝撃でしたね。

1000年生きてる / いよわ feat.初音ミク

いよわ:そうだったんですね、嬉しいです。REDさんの楽曲は、曲調も動画のスタイルも最初から自分のブランドをちゃんと持ってる印象があって、ただものじゃない感じがしていたので、バンドで活動されていたというのを聞いて「なるほどな」と思いました。

Dance in the Sleepless Night / 初音ミク

RED:実は僕の周りにも、元々バンドをやっていた人でコロナ禍や『ボカコレ』などをきっかけにボカロシーンに飛び込んだ人が何人かいるんです。それこそ、僕のサークルメンバーにもそういう人がいますし、いまのボカロシーンは元々音楽をやってきた人がどんどん飛び込みに来てるアツい環境なのかなと感じています。

いよわ:別の畑で活動している人の新たな選択肢としてボーカロイドが入ってくるようになったのは、ボカロ文化の広がりを感じますよね。そこからこれまでのボカロ文化にあまりなかったようなジャンルの曲を作る人が入ってきたりすると、もっともっと幅も広がっていくでしょうし、すごく刺激的でいいなと思います。

――2人の音楽的なルーツというと、どんなものがあるんですか?

いよわ:一番聴いていたのは、数多く存在するボカロ曲かもしれないですね。とくに、先程も言ったように『カゲロウプロジェクト』の楽曲には確実に影響されてます。あとは僕はキーボードを弾くんですが、ゲスの極み乙女の楽曲を耳コピをしていたのが曲のスタイルに反映されているように思います。川谷絵音さんのやっているバンドは全部好きなので、川谷さんの楽曲とボカロカルチャーをずっと食べ続けて、いまの自分ができていると思います。

――ゲスの極み乙女に影響を受けているというのはすごく腑に落ちます。ちゃんMARIさんのキーボードっぽさを感じるというか。

いよわ:少し前に『Nord Electro 6』という、ちゃんMARIさんと同じシリーズのキーボードを買ったんです。技術的には全然及ばないですが、確実に近い音がして、そこから得るインスピレーションも結構大きいので、影響はあると思いますね。

きゅうくらりん / いよわ feat.可不

RED:そこから唯一無二の曲ができているんですね。僕はBUMP OF CHICKENがすごく好きで、そこからバンドを始めたんですけど、それ以外だとダンスミュージックっぽいアプローチをするバンドも好きですね。Coldplayとか、異なる2つのジャンルを両立しているアーティストには惹かれる傾向があります。

いよわ:REDさんの曲からは洋楽っぽいエッセンスも感じますもんね。ギターはご自分で弾かれているんですか?

RED:弾いてます。

いよわ:REDさんの曲のギター、めちゃくちゃ良いですよね。そこからREDサウンドが生まれてる印象があります。

RED:ありがたいです。

――お2人は音作りへのこだわりも強いですか?

RED:僕は割と感覚派なんですよ。リバーブの空気感とかはすごく意識しているんですが、壮大な雰囲気が出るようにとか、砂漠みたいな雰囲気にしたいとか、そういう感じで作っています。

いよわ:音作りで言うと、僕は周りよりもDTMの知識が少ない状態でやってるかもしれないです。飛び道具的な音の使い方をするのが好きなんですが、それも正統派のサウンドで戦うとプロの音作りには絶対勝てないと思ったからで。技術的な善し悪しが分からないところに1人で突っ走ったらごまかせるかなみたいな(笑)。あとは僕、音を入れるときも打ち込みじゃなくて、キーボードで弾いた音をそのまま録って重ねていくんです。そこでたまたま生まれたフレーズを採用することもあって、そういうライブ感みたいなものも大事にしています。でも、最近になってシンプルに技術不足を感じるようになってきたので、音周りの勉強は今後の目標ではありますね。

RED:いよわさんは自分のことを感覚派かロジック派、どちらだと思いますか?

いよわ:感覚派のような気がしますね。たとえばコード進行とかテンポ感とか、土台になるところだけを先に作っておけば、あとはぶっちゃけ何を載せてもいいと思ってるんです。自分が聴いたときの“快、不快”に任せて曲を作ってる側面があるので、そういう意味では感覚に近い部分を使ってるのかなと。

RED:なるほど。いよわさんの曲を聴いていると、転調だったり音の重ね方だったり、この人はきちんと理論を学んできた人なのかなと思う一方で、めちゃくちゃ感覚派の熱いグルーヴを感じたりもして。どっちなんだろうとずっと気になっていたんです。

いよわ:耳コピ時代に学んだコードが活きてるかもしれないですね。キーボードのいいところって、コードの動き方が視覚的に分かりやすいことかなと思っていて。例えば「ここからこう進めばこんな感じになる」みたいな流れを掴んでくると、理論を感覚で理解できるようになるというか、自分の手癖が理論的に外れにくくなってくるのかなと思うんです。逆に言えば、自分の知らないコードは出てこないというデメリットもあるんですけど。

――身体で理論を覚えるという感じなんですね。REDさんは先程もご自身のことを感覚派だとおっしゃっていましたね。

RED:そうですね。コード進行にしても、「今どのコードが鳴ってますか」と言われたら「ルートはこれだけど、それ以外はよく分かりません」くらいの感じなんです。いよわさんは感覚でロジックを身につけたとお話されてましたが、それは僕が持ってない部分なので羨ましいです。ただただ尊敬ですね。

雷・々・来 / 知声

――お2人の共通点として、ボーカロイドだけでなく『CeVIO AI』などの音声合成ソフトを使った制作をしていることが挙げられます。それらを触ったときの最初の印象はいかがでした?

いよわ:『CeVIO AI』って音を打ち込んだら自動的にピッチが生成されて、それが線になって見えるじゃないですか。僕は「Mobile VOCALOID Editor」を使っているので、基本的にピッチを書いたりすることがないんです。なので、自動的に生成されたピッチが視覚的に見えるということは新鮮でしたね。あとは、打ち込んだ時点でほぼ完成系の歌い方になっているというのが今までにない感覚だと感じました。それでいて、微調整をしたいと思ったらいくらでもできる。こだわらない人は最初の時点で完結させても様になるし、こだわりたい人はとことん細かく詰めていけるという、融通の利きやすいソフトだなと感じました。

RED:ボーカロイドを使ってるときよりも、より“人とやり取りしてる感じ”があるというか……人にお願いして歌唱していただいてる感じがしました。人間らしい表現は『CeVIO AI』や『VoiSona』の方が向いてるのかなと思いますね。もちろん、ボーカロイドっぽい曲を作りたいときは人間らしくない方が上手くいく場合もあると思うので、どちらの方がいい、悪いという話ではないんですけど。そうやって使い分けられるのはいい時代だなと思います。ピッチをペンで書けるとか、結構衝撃的でしたよね。

いよわ:そうそう。なんとなく「こういう感じで歌ってほしい」と思ったものを実現できるのはすごくありがたいです。それを実際の歌手の方とやろうと思ったらスタジオレコーディングのディレクションに入らないといけないですが、パソコン1台でできてしまう。時代が進んでるなと思います。

――頭の中にあるボーカルをそのまま落とし込めるという。

いよわ:はい。音声合成ソフトって自分で歌わない人が使うソフトという側面が大きいと思うんですが、歌わない人もこんな感じに歌ってほしいみたいなイメージはあると思うので、歌の細かいところを調整できるという進化は嬉しいです。

――曲を作る際は、使う音声合成ソフトを決めてから作曲に取り掛かることが多いですか?それとも、曲を作り終えたときに歌声を決めていますか?

RED:僕は『CeVIO AI』の姉妹ブランドである『VoiSona』が提供している「知声」というボイスをよく使うんですが、「知声」には得意なテンポ感が存在する気がしていて。僕が作る曲はBPM130前後のものが多いんですが、その辺りをドンピシャで歌ってくれるんです。なので曲を作って、テンポ感で決めるという感じです。それぞれのボイスの得意な部分を活かして作っていますね。

いよわ:僕は最近、音声合成ソフトではない実際のアーティストさんや、特定のキャラクターのための書き下ろし楽曲を作る機会がすごく増えていて、合成音声ソフトで作るときも、そういった制作と同じ感覚で作ることが多くなった気がします。合成音声の声質だったり得意とするテンポを踏まえて、それが最大限活きる曲を書いてみるというやり方ですね。なので、そういう意味では声を先に決めることが増えたかもしれないですね。

――音声合成ソフトに歌ってもらう際の、”調声”において大切にしていることはありますか?

RED:僕が「知声」を使うときは人間らしさを出したいので、実際に画面の前で歌いながら調声しています。実際に自分で口を動かしてみると、意外と歌詞にはない発音や言葉を言っているなと気付けるんですよ。とくに「ん」と「っ」はより人間らしくなるツールだと思っているので、そこに気付けるように歌いながら調声しています。

――REDさんの曲の知声の歌声は本当にリアルですが、そんなに細かいこだわりがあったんですね。ブレスの入れ方も歌いながらチェックしていくんですか?

RED:ブレスの位置も実際に歌ってみて確かめています。息が苦しくなるようなメロディーだと、あまり楽曲が入ってこない気がするので、あえて隙間を作るというか。『初音ミク』でも同じように調声していたんですが、やっぱり『VoiSona』や『CeVIO AI』の方がより人間らしくなるなと思いますね。

ーーいよわさんはいかがでしょう?

いよわ:僕の場合、楽曲にストーリー性を持たせていることも多くて、映像にもそのストーリーの登場人物が出てくることがあるんです。ですが、その登場人物のキャラクター像が合成音声のキャラクターとは異なることも多いので、「もし登場人物がこの曲を歌うなら、きっとこんな感じの声」みたいなことをイメージして、それを音声合成ソフトに歌ってもらう感覚です。ある種、音声合成ソフトをCV(キャラクターボイス)として捉えている感じに近いかもしれないですね。

――楽器というよりは、どちらかというと一人のボーカルとして捉えている?

いよわ:楽器とボーカルのいいところを両方持ってきたのが、「ボーカロイド」や『CeVIO AI』なのかなって。ハイブリッドみたいな感じですよね。音声合成ソフトは自分でいろいろ要素を選び取ることができるのに、自分が操作できる領域の外側に、そのボイスライブラリが持つ歌声のスタイルがちゃんと存在している。人とコラボしてるような感覚になりながらも、自分の表現したい内容をちゃんと反映できるっていうのは、自分の作り方とも相性がいいなと感じます。

関連記事