2024.02.17 07:00

OpenAI「Sora」にApple「Keyframer」……動画生成AIに続々と乗り出すビッグテック

　AI関連企業のOpenAIは2月16日、テキストから動画を生成するAIモデル「Sora」を発表した。

　「ChatGPT」などのAIモデルで知られるOpenAIによる最新の生成AIモデルこと「Sora」は、「テキストの指示から現実的で想像力豊かなシーンを作成できる」のが特徴だ。動画の長さは、最長1分間だ。

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq

— OpenAI (@OpenAI) February 15, 2024

　公開されたデモンストレーションは、「Sora」へと「ネオンと看板が煌めく東京のストリートを、スタイリッシュな女性が歩く」というプロンプトを入力した動画だ。看板の文字などは従来の画像生成AIなどと同様に崩壊気味だが、生成AIによるものとは思えない、非常にクオリティの高い映像に仕上がっている。

　「Sora」は文字からの動画の生成だけでなく、静止画に基づいてビデオを生成したり、既存のビデオの欠落したフレームを埋めたりすることもできる。現時点では「Sora」はOpenAIの社内を含め、アーティストやデザイナー、映画製作者など向けに限定的に公開されている。

　またAppleも、テキストで画像からアニメーションを生成化するための生成AIモデルを構築している。同社は2月8日、テキストにより画像からアニメーション化する生成AIモデル「Keyframer」を論文として発表した。

　「Keyframer」は「大規模言語モデル（LLM）を使用したアニメーション設計の強化」が目標とされており、ユーザーはWebサイト用のCSSアニメーションのコードを生成できる。なお、生成AIのベースとしてはOpenAIの「GPT-4」を利用している。

　「Keyframer」の特徴は、一度アニメーションを生成した後でも、ユーザーが必要なもの、あるいは削除したいものを記述して、デザインを変化させられることだ。「Keyframer」は限られた研究者がテストを続けている。

　今回発表された「Sora」と「Keyframer」は、現時点では一般向けには公開されていない。しかし、近い将来こうした技術が我々でも利用できるようになる可能性は高い。またひとつ、大きな“生成AIの波”が訪れそうだ。

〈Source〉
https://openai.com/sora
https://twitter.com/OpenAI/status/1758192965703647443
https://arxiv.org/pdf/2402.06071.pdf
https://www.theverge.com/2024/2/14/24072917/apple-keyframer-ai-animation-tool-2d-images-text-descriptions