Geminiに音楽生成モデル「Lyria 3」搭載 GoogleがAIクリエイティブで目指す方向性とは

2月19日、Googleは同社のGeminiアプリに音楽生成モデル「Lyria 3」を搭載し、音楽生成機能のベータ版提供の開始を発表した。これによりGeminiでは、テキストでジャンルやムード、シーンを指示するだけで、歌詞やボーカルを含む30秒の楽曲が数秒で生成可能になった。
写真1枚からトラックを生むLyria 3の実力
Lyria 3はGoogle DeepMindが開発した音楽生成AIの最新モデル。テキストによるプロンプト入力に加え、写真や動画をアップロードして、その場面に合ったサウンドトラックを生成することもできる。生成された楽曲には、Googleの画像生成モデル「Nano Banana」によるカバーアートが自動で付与され、すぐに共有できる状態で提供される。テンプレートギャラリーも用意されており、あらかじめ用意されたスタイルを選んで詳細を追加するだけで、手軽に高品質なトラックを生成可能だ。
Googleによると、Lyria 3は従来モデルから3つの点で進化した。1つ目は、プロンプトに基づいて歌詞が自動生成されるようになったこと。2つ目は、スタイルやボーカルの特性、テンポといった要素を細かくコントロールできるようになったこと。3つ目は音質のリアルさと、音楽的な複雑さの向上だ。
著作権や安全性への配慮も見逃せない。生成されたすべての楽曲には、人間の耳には聞こえない電子透かし「SynthID」が埋め込まれる。SynthIDは音声の波形をスペクトログラム(周波数の時間変化を視覚化したもの)に変換し、その中の感知しにくい周波数帯域に電子透かしを埋め込む技術だ。MP3圧縮や再生速度の変更といった一般的な加工を施しても検出が可能で、AI生成コンテンツであることを事後的に識別できる。
さらにプロンプトに特定のアーティスト名が含まれた場合でも、そのアーティストを模倣するのではなく、似た雰囲気を持つ別のオリジナル楽曲が生成される。Googleは、トレーニングデータの詳細こそ明らかにしていないものの、利用規約やパートナー契約、適用法に基づき使用権を持つ音楽のみを使用していると説明している。
現時点では、Lyria 3は18歳以上のユーザーを対象に、日本語や英語を含む8言語で利用でき、Google AI Plus、Pro、Ultraのサブスクリプションユーザーは、より多くの楽曲を生成できる。
さまざまな実験的音楽AIツールを開発してきたGoogle
ちなみにGoogleの音楽AI開発は最近始まったものではない。2016年にAIで音楽やアート作品を創るプロジェクト「Magenta」を立ち上げ、以降さまざまな実験的ツールを公開してきた。2020年にはブラウザ上でAI音楽を生成できる「Lo-Fi Player」を、2023年1月にはテキストから音楽を生成する「MusicLM」を発表している。
また、2023年11月には初代Lyriaを搭載したYouTube Shorts向け音楽生成ツール「Dream Track」がテスト公開された。これはAIが生成した声と音楽スタイルで30秒のサウンドトラックを生成するもので、Charli XCXやCharlie Puthら9名のアーティストが実験的に参加した(現在はアメリカのクリエイターのみに提供されており、こちらにもLyria 3が搭載されている)。その後、2024年5月にはテキストや音声入力をもとに音楽を生成・編集できるプロ向け実験ツール「Music AI Sandbox」が、2025年4月にはLyria 2が相次いで公開された。






















