5GでバーチャルYouTuberは大いに飛躍する? 現在の課題と「MonsterZ MATE」の挑戦から考察
バーチャルYouTuberとは何か。一言で表すのは難しいが、簡単に言うならlive2Dや3Dモデルの姿を使って活動するYouTuberである。それは、「YouTuberのバーチャル版」と言った方がわかりやすいかもしれない。彼らは我々の住む現実には存在せず、バーチャル空間から活動しているーーというパターンが多い。そこはそれぞれの言い分によって変わる。例えばキズナアイは、ほとんど常に真っ白なバーチャル空間にいるスーパーAIだし、赤月ゆには東京都文京区に住んでいる普通の吸血鬼である。結局彼らをバーチャルたらしめているのは「活動における外見が電子情報か否か」なのだろう。「バーチャルYouTuber」という言葉は我々から観測し、そう判断した相手に対する他称になりつつある。
いちいち気を使っていては無駄にハイコンテクストになっていく一方なので早々に言わせてもらうが、つまるところ彼らは「メタ」の境界線をゆらゆらと揺れているのである。「バーチャル」としての矜持を持ち続ける者もいれば、最初からメタを前面に押し出して行く者もいる。もちろんそこにある程度のマナーはあれどルールは存在しない。そこで最も困惑しているのは視聴者である、という事実は忘れないでおきたいところだ。
さて、それぞれで「メタ性」が変わってくるややこしいバーチャルYouTuberの世界だが、全てにおいて共通することもある。それは彼らが「主に通信を用いて活動している」ということである。
彼らの活動の基本はYouTube等に投稿する「動画」、もしくは各種プラットフォームを利用して配信する「生放送」だ。特に後者は界隈の中でも大流行していて、私がチャンネル登録している人々だけでも24時間常に誰かが生放送を行なっている。何故彼らが生放送に取り憑かれるのかーーという話はヘヴィな内容になるのでここでは割愛させてもらうが、とにかく私が言いたいのは生放送における「遅延」が全てのバーチャルYouTuberと視聴者を苦しめているという話である。
生放送は「ライブストリーミング」とも呼ばれ、常に通信を必要とする。そして配信者側から視聴社側へ伝達される映像・音声は速くてもおおよそ5秒〜ほどの遅延を経て到着する。先に言っておくがこれは「普通のこと」であり、例えばSHOWROOMなどで配信しているアイドルたちからすれば慣れっこだろう。しかしながらこの遅延はバーチャルYouTuberにとっては厄介であることこの上ない。
例えばバーチャルYouTuberが生放送でコラボ配信をしたいとする。同じ配信の中で二つのアバターを同時に動かしたいが、それには以下のような手順が必要となる。まず、discordなどの通話サービスで音声を繋げる。その後「デスクトップ共有」という機能を用いて自分のアバターが動いている姿をもう一方に送る。それを配信ソフト側でクロマキーなどの機能を使い背景を透過し、配信画面に表示させる。しかしながら映像の送信は音声よりもさらに遅延が大きいため、喋っている内容とアバターの動きが同期することは無い。喋り始めてから口が動くまで時間がかかるし、喋り終わった後はアバターの口がまだ動いている、という状態になってしまう。最近だとわざわざアバターを動かすより安定した配信を目指して立ち絵のみを使っている人も多い。
また他の例をあげると、音楽関係のことは遅延によってほぼ不可能になっていると言っていい。バーチャル世界でバンドとしてライブがしたくても、音声に遅延があればそれは音楽の体を成さない。結局のところ録音した音声を流すことしかできないのである。
結果としてバーチャルYouTuberは生放送でトークやゲームをすること以外にできることがない。そして音声の遅延によってトークのテンポも乱されてしまい、本来のポテンシャルを出しきれていないのが現状だ。
しかしこれらの問題を一手に解決する技術が生まれつつある。それが「5G」である。
5Gとは現在我々が携帯端末などで使用している「4G」に次ぐ新たな次世代無線通信システムだ。
この5Gを利用した時に発生するネットワーク遅延はおよそ1/1000秒以下。この程度であれば会話は一切の違和感なく行えるし、例えそれが音楽であろうとほぼ問題無いと言ってもいいだろう。この技術をアピールする為に行われたのがNTTドコモによる「FUTURE-EXPERIMENT.JP」という企画である。この企画の第一弾では女性歌手グループであるPerfumeのメンバーが東京、ニューヨーク、ロンドンという離れた場所で同時にパフォーマンスを行い、それらの映像を5Gを用いた通信で違和感なく一つに合成するということが行われた。
この技術がバーチャルYouTuberの世界に持ち込まれればどうなるか。コンテンツとしての質が底上げされるのは間違いないだろう。トークも音楽も、あらゆることを真にリアルタイムで行えるようになる。3D同士のコラボも、「動き」と「音声」、それを阻害する「遅延」があった為に、結局撮影自体は現実世界での同じ場所で行う必要性があった。しかしながら5Gの登場により、「移動」というコストをカットすることができる。自動的に撮影に回すことのできる時間が増え、コンテンツの加速へと発展していくだろう。