Geminiに音楽生成モデル「Lyria 3」搭載 GoogleがAIクリエイティブで目指す方向性とは
GeminiはSuno・Udioと何が違うのか
今回のLyria 3は、これまでGoogleが開発に取り組んできた音楽生成機能を、Geminiアプリに初めて直接統合したという点で注目に値する。Geminiにはすでに画像生成の「Nano Banana」、動画生成の「Veo」が組み込まれており、ここに音楽が加わったことで、テキスト・画像・動画・音楽を1つのアプリ内で生成できるクリエイティブなプラットフォームへと進化した。
この動きは、音楽生成AI市場の競争という観点からも興味深い。テキストから楽曲を丸ごと生成できるサービスとしては、ステム分離など音楽制作向けの専門機能を備えたSunoやUdioが機能面では先行している。
しかしGoogleは、競合各社のようにプロが求める専門的な音楽制作機能を充実させるよりも、一般層でも扱いやすい形で音楽生成を楽しめることをGeminiの強みにしているようだ。実際Googleは、傑作を目指すのではなく自己表現を楽しむためのツールだと説明している。その言葉からプロのクリエイター向けではなく、あくまで一般ユーザー向けの創造的表現のためのツールとして位置付けていることが窺える。
ただし、これはGoogleがプロ向け市場を諦めたということではない。これまでの音楽AI開発の取り組みを見れば、技術的なポテンシャルはむしろ専門用途にも十分応えられるレベルにある。それでも現時点でGoogleがGeminiに関して選んでいるのは、一般ユーザー向けのクリエイティブ統合プラットフォームとして普及させていく道だ。ここから生まれるのは、誰かを驚かせるためではなく、自分自身が楽しむためのクリエイティブだろう。
Geminiは、そんな誰もがAIでクリエイティブを作れる時代ならではの楽しみ方の答えのひとつを追求しながら今後さらに進化していく。今回の楽曲生成機能統合はそのことを強く印象づける出来事だった。
参考:
https://gemini.google/jp/overview/music-generation/?hl=ja
https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/
https://magenta.tensorflow.org/blog/2016/06/01/welcome-to-magenta/
https://magenta.tensorflow.org/lofi-player
https://blog.google/innovation-and-ai/products/musiclm-google-ai-test-kitchen/
https://deepmind.google/blog/transforming-the-future-of-music-creation/
https://deepmind.google/blog/music-ai-sandbox-now-with-new-features-and-broader-access/