HYBE傘下のAIオーディオ企業Supertone、「Supertone Shift」の無料オープンベータ版を公開
HYBE傘下のAIオーディオ企業・Supertoneは4月15日、ゲームや映画、アニメなど各種コンテンツで活用できるAIベースのリアルタイム音声変換サービス「Supertone Shift」のグローバルオープンベータ版の提供開始を発表した。
「Supertone Shift」は、Supertoneがコンテンツ制作者やクリエイターの創作をサポートし、業務の利便性を高めるために開発したソリューションで、搭載された10個のキャラクター音声から一つを選択すると、ユーザーの発話がリアルタイムにキャラクターの声で送出されるようになっている。
今回のオープンベータ版は、Supertoneの公式ウェブサイト(https://product.supertone.ai/shift)から無料でダウンロードして利用することが可能。Supertoneは、6月26日までのオープンベータ期間を経て、今年下半期に「Supertone Shift」を正式ローンチする予定だ。
Supertoneは昨年11月、釜山 BEXCOで開かれた国際ゲーム展示会「GSTA2023」のB2Bブースに参加し、「Supertone Shift」をクローズドベータ形式で初めて公開。展示会では国内外の主要メディアから大きな注目を集め、数多くの来場者がブースを訪れた。
『Supertone Shift』は「自然な音声発話スタイル」「リアルタイムでの音声変換スピードの短縮」「わずか10秒でユーザーの声をキャラクターの声にカスタマイズする機能」の3つの面で高い技術力と利便性を誇っているという。
実際の人の発話に近い、自然で繊細な音声を実現できるのが特徴だ。Supertoneの独自に開発した音声合成基盤モデルNANSY(Neural Analysis & Synthesis)を基に作られた「Supertone Shift」は、ユーザーの音声を音色・発音・音高(ピッチ)・アクセントの4つの構成要素に素早く分析し、ユーザーとキャラクターの声をリアルタイムで変換する方式を適用しているため、機械音はもちろん、外部ノイズを排除し、リアルでクリーンな音声出力が可能だとか。
また、音声を素早く変換し、即時のコミュニケーションをサポートすることも可能。Supertoneは、音声が出力されて聞き手に届くまでの遅延時間を、聞き手が認識できないレベルである47ms(ミリ秒、1000分の1秒)まで短縮しており、世界的にも優れたレベルを実現している。
ユーザーの利便性も大幅に向上させており、「Supertone Shift」が音声分析のために提示する10秒程度のサンプルスクリプトをユーザーが読み上げると、選択したキャラクターへの音声変換がすぐに開始される。同時にカスタマイズも可能で、「Supertone Shift」はユーザーとキャラクターの音声の混合比率や感情の表現度合い、音の高低などの音声構成要素の値を細かく調整できる技術ツールを搭載し、ユーザーの好みや使用目的に合わせた音声を自由に生成することができる。
コンテンツクリエイターは「Supertone Shift」をコンテンツの多様性や完成度を高める創作ツールとして活用することが可能。VTuberや配信者、ポッドキャスト配信者などが個性的な声で視聴者に新しいリスニング体験を提供したり、ゲーマーやコスチュームプレイヤーがゲームキャラクターの声で他のユーザーと音声チャットを楽しんでゲームへの没入感を高めるなど様々な体験をサポートする。
「Supertone Shift」ダウンロードリンク:https://product.supertone.ai/shift
ボカロと人間の“間”で期待される、AIシンガーという可能性ーー『VX-β 作家ソン』レポート
『ARS presents VX-β 作家ソン(作家×ハッカソン) supported by YAMAHA VOCALOID β…