2024.04.24 06:00

モナリザが歌い出す？　Microsoftが画像からリアルタイムで顔の動きを生成するツール公開

　Microsoft Research Asiaは人物の静止画（あるいは絵画）と音声ファイルから、話したり歌ったりする顔をリアルタイムで生成するAI（人工知能）モデル「VASA-1」を発表した。

　VASA-1では既存の静止画から、顔の表情や頭の動きを生成したり、スピーチや歌に合わせて適切な唇の動きを生成したりすることができる。公式サイトに掲載されたリアルなスピーチの生成動画は、まさに実際の人物が話しているようだ。

　VASA-1はYouTubeの動画から抽出された、有名人の会話をもとにした「VoxCeleb2」のデータセットでトレーニングされている。トレーニングでは実際の人物が使用されているが、モナ・リザのような絵画でも動作しているのが興味深い。

　Microsoft Research AsiaはVASA-1の利点について、教育の公平性を高めたり、コミュニケーションに困難を抱える人のアクセシビリティを改善するために使用できるとしている。また、会話用のAIキャラクターでVASA-1が使用できる可能性にも触れている。

　一方で、同論文ではこの技術が悪用されることにより、ディープフェイク動画が簡単に生成されてしまう危険性についても指摘している。技術が適切に使用されると確信するまでは、オンラインデモやAPIなどを含め、関連製品をリリースしないと表明している。

　有名人や絵画が歌うデモは実に楽しいが、悪用することも簡単にできてしまいそうなVASA-1。技術の発展だけでなく、安全な使用方法に関するガイドラインの制定が必須となりそうだ。

〈Source〉Microsoft via Engadget
https://www.microsoft.com/en-us/research/project/vasa-1/
https://www.engadget.com/microsofts-ai-tool-can-turn-photos-into-realistic-videos-of-people-talking-and-singing-070052240.html

“AI闇市”も誕生　テイラー・スウィフトのフェイク画像事件を機に考える「現状と対策」

生成AIの登場によって、テキストを入力してプロンプトさえ指定すれば、だれでも画像を制作することが可能となった。こうした“画像制作…

塚本直樹

IT·宇宙·フード·紛争地域ジャーナリスト／以前はドイツ、ウクライナ、現在はミャンマーにて取材／Yahoo!ニュースエキスパートにて執筆中

塚本直樹の記事一覧はこちら

モナリザが歌い出す？　Microsoftが画像からリアルタイムで顔の動きを生成するツール公開

“AI闇市”も誕生　テイラー・スウィフトのフェイク画像事件を機に考える「現状と対策」

にじさんじ・伊波ライの“才能”を紐解く

ニトリ、14畳対応のポータブルクーラー発売

仲里依紗、コストコの“愛用品”を紹介

『ラヴ上等』2、キーアート＆予告＆主題歌解禁

DIY系YouTuber、ドライバー1本で扉改善

『今日好き夏休み編』直前特別編レビュー

辻希美、子どもたちのため業スーで爆買い

かまいたち、最新冷感グッズを徹底レビュー

『イースVIII』10周年記念腕時計が一般販売

『パルワールド』第2の『原神』に？

PRODISTからW冷却ウェア新モデル登場

辻希美、子どもたちのため業スーで爆買い

辻希美、次男の“運動会弁当”がすごい

にじさんじ・伊波ライの“才能”を紐解く

ニトリ、14畳対応のポータブルクーラー発売

「IROKA」×「にじさんじ」コラボ開始

G TUNEからRyzen 7 7700X3D搭載PC登場

あの、ファン待望シール帳紹介動画に反響

Apple、iPhoneを国内で一斉値上げ

gowellがポケモンのトラベルグッズを発売

“AI闇市”も誕生 テイラー・スウィフトのフェイク画像事件を機に考える「現状と対策」

ユーモラスなAIって本当？ Xの注目機能「Grok」を試してみたらジョークがイマイチすぎた

Amazon、GoogleがAIスタートアップに巨額投資 GAFAMがしのぎを削るAI競争、今年の行方は？

世界最大級のSNSは赤字続き 米巨大掲示板・Redditの株式上場から見える“世知辛い事情”

脳波でPCを操作できる“脳直結インターフェイス”搭載 世界初「Neuralink患者」の動画が公開

ロックスターと過ごした記憶：櫻井敦司

カンザキイオリ、『サブスタンス』を語る

JOIとK、Lapwingと私たちの“類似性の正体”

SHINTANI × ISHIYAが明かす、噂の真相

橋本環奈、新スタイルの配信ドラマ

水溜りボンド・カンタ×倉本美津留対談

賃貸で作る“喫茶店風”の空間

10代ゲームクリエイターの執念

水溜りボンド・カンタ×倉本美津留対談

iPadの力を加速するESRのガジェット

賃貸で作る“喫茶店風”の空間

『ゆめみなな』革新的3Dライブ

【ゲームと都市】『ファイナルファイト』から『GTA3』『スパイダーマン2』へ “巨大都市”をめぐるゲームの記憶

重盛さと美「明日は我が身」 フワちゃんの復帰に“的確コメント”＆元HKT48が汚部屋披露 『ダマってられない女たち season3』#2

「うざいうざいうざい！」女子14名が人狼ゲームで激突、継続メンバーは果たして 『今日好き 夏休み編直前 大考察SP！』

にじさんじ・伊波ライの“才能”を紐解く たゆまぬ努力と愛される人間性をもつスペシャルなヒーロー

『道玄坂上ミステリ監視塔』

村井邦彦『続・村井邦彦のLA日記』

ISHIYA『BRUO／ノイズ』

福嶋亮大『メディアが人間である 21世紀のテクノロジーと実存』

“AI闇市”も誕生　テイラー・スウィフトのフェイク画像事件を機に考える「現状と対策」

ユーモラスなAIって本当？　Xの注目機能「Grok」を試してみたらジョークがイマイチすぎた

Amazon、GoogleがAIスタートアップに巨額投資　GAFAMがしのぎを削るAI競争、今年の行方は？

世界最大級のSNSは赤字続き　米巨大掲示板・Redditの株式上場から見える“世知辛い事情”

脳波でPCを操作できる“脳直結インターフェイス”搭載　世界初「Neuralink患者」の動画が公開

【ゲームと都市】『ファイナルファイト』から『GTA3』『スパイダーマン2』へ　“巨大都市”をめぐるゲームの記憶

重盛さと美「明日は我が身」フワちゃんの復帰に“的確コメント”＆元HKT48が汚部屋披露『ダマってられない女たち season3』#2

「うざいうざいうざい！」女子14名が人狼ゲームで激突、継続メンバーは果たして　『今日好き　夏休み編直前大考察SP！』

にじさんじ・伊波ライの“才能”を紐解く　たゆまぬ努力と愛される人間性をもつスペシャルなヒーロー

村井邦彦
『続・村井邦彦のLA日記』

ISHIYA
『BRUO／ノイズ』

福嶋亮大
『メディアが人間である　21世紀のテクノロジーと実存』