6秒の動画が約25秒で完成 xAI「Grok Imagine Video 1.5」で生成速度が約2倍に高速化

 xAIは、画像から動画を生成するAIモデル『Grok Imagine Video 1.5』を、Imagine API上で一般提供開始したことを発表した。あわせて、grok.com/imagineおよびiOS/Androidアプリ向けに『Video 1.5 Fast』も展開している。

 本モデルは、同社の画像から動画への変換モデルとして最新版にあたるもので、モーション、物理表現、音声などあらゆる面で従来モデルから改善が図られている。音響効果、環境音、ダイアログは同一のパスで生成され、動きに合わせて配置される。スピーチはより明瞭になり、同期精度も向上したという。

 モーションと物理表現については、クリップ全体を通じて動きの一貫性が保たれ、歪みが減少。重量感や運動量がより自然に表現されるとしている。

 生成速度の面では、『Grok Imagine Video 1.5 Fast』が従来モデルの40秒以上から約25秒へと、生成速度をほぼ2倍に高速化。6秒・720pの動画を生成可能となっている。

 あわせて、クリエイティブワークフローを強化する新機能も今後数日かけて順次展開される。作業を整理できる「Projects」機能では、左サイドバーにプロジェクトが表示される。「Multiple agents」機能により、複数のプロンプトを並行して実行することが可能となる。「Search」機能では、ライブラリ内の画像や動画を検索して目的のクリップを見つけ出せる。

 Imagine Video 1.5はxAI APIにおいてプレビューを終了し、『grok-imagine-video-1.5』として一般提供される。開始画像を指定し、モーションを記述、解像度と尺を選択することで動画生成が可能だ。

AI動画生成を“みんなのもの”に OpenAIの撤退後、Googleが「無料」で仕掛ける意図を考える

OpenAIは動画生成AI「Sora」の提供終了を発表した。

関連記事