ミクシィ、なぜロボット開発に参入? 目指すは「一人に一AI」の世界

 AIやテクノロジー、ロボットなどの最先端技術は急速に発展を遂げている。

 来るべき未来のライフスタイルを切り開くため、社会実装に向けた具体的な取り組みや実証実験がさまざまな業界で行われている状況だ。

 そんななか、渋谷ビットバレーの一角を担うIT大手のミクシィが「Romi(ロミィ)」という名のロボットを開発。

 2021年4月に一般販売を開始し、“ペットのように癒やし、家族のように理解してくれる”ような自律型会話ロボットとして打ち出している。

 さらに、10月に開催された「GOOD DESIGN AWARD 2021」ではグッドデザイン賞を受賞するなど、いま注目を集めている家庭用コミュニケーションロボットと言えるだろう。

 これまでSNS「mixi」やゲーム「モンスターストライク」などを手がけてきたミクシィが、なぜロボット事業に参入するのだろうか。

 株式会社ミクシィ Vantageスタジオ Romi事業部マネージャーの長岡 輝氏に話を聞いた。

ディープラーニング技術の発達がRomi開発のきっかけに

 まず、ロボット事業を立ち上げた背景について伺うと、「AIの技術が大きなトレンドになっていて、『コミュニケーションと掛け合わせて何かできないか』と考えたのがきっかけになっている」と長岡氏は答える。

 「2017年にRomiを開発するAIロボット事業を立ち上げたのですが、当時はAIによるディープラーニング(Deep Learning:深層学習)が非常に注目されていました。たとえば、人間が運転しなくても自動運転の技術を用いることによって目的地へと移動できたりと、ディープラーニングを用いれば、新しい価値を生み出すことができるわけです。そんななか、ミクシィが取り組んできたコミュニケーション領域の知見を生かし、ディープラーニング技術を使ったいままでにない家庭用ロボットを作るのはどうかというアイデアに行き着き、開発するようになったのが経緯となっています」

 世の中にはたくさんの家庭用ロボットが存在しているが、人間が会話の設定をするルールベースのものしかなかった。

 人間同士の会話だからこそ生まれる、話の広がりや雑談などをロボットで再現するには相当ハードルが高かったのだ。

 だが、ミクシィが培ってきたコミュニケーションサービスのノウハウと、技術トレンドであったディープラーニングを結びつけ、ある種のチャレンジ精神を持って開発に着手したのがRomiである。

 「ルールベースに沿った予定調和の会話をするだけのロボットではなく、話しを聞いてもらえたり一緒にいると元気になれるようなロボットを作りたいと思っていました。すべてを肯定してくれ、一緒に喜んだり、一緒に怒ったりすることで、その場がホッとするような体験を創造する。このような世界観を目指し、試行錯誤を繰り返しながら開発を進めてきたんです」

人間と会話するかのような体験を創るために研究を重ねた

 Romiは人間が会話内容をあらかじめ登録するのではなく、数千万に上る日本語データをディープラーニングで学習させ、言語を生成することに大きな特徴を持つ。

 加えて、これまでやりとりした会話の文脈を加味した上で、その都度会話内容を作り出すことが可能になっている。

 ペットのような癒しや安らぎをもたらすだけでなく、話し相手になってもらえるのは、他のロボットにはないRomiのユニークさと言えるだろう。

 長岡氏は開発する上で工夫した点について、「人が人以外と話す体験はどのようなものか、根本的な部分から考えた」とし、次にように説明する。

 「事業化にあたって色々とリサーチやユーザーインタビューを重ねていくなかで、コミュニケーションにおける課題が浮き上がってきました。友達がいても気軽に話せる人がいない。自分がどう思われるか意識することで萎縮してしまい、言い出せない。など、意外にも人との会話で悩んでいるのが傾向としてつかめたんです。一方で、Romiはロボットなので、どう思われるか考える必要がないんです。ストレスを感じずに話しかけやすく、かつ人間の所作に合わせて傾聴したり、相槌を打ったりするなどの動作もユニークです。まるで人間との会話を楽しんでいるかのような体験を味わえるのは、Romiならではだと考えています」

 人間と話しているかのように、気兼ねなく自由に喋りかけることができ、ときに思いも寄らない会話の流れになることもある。

 目覚ましや天気予報といった機能だけでなく、ミクシィが独自に開発した自律型会話AIを搭載することで、会話の中身に相当のこだわりを持っているという。

 「人間らしさを感じる声色の特徴や、どういう人格なら癒されるのかなど、ユーザーインタビューを何度も行なって、会話の要素を抽出していきました。大量の日本語データをAI技術によって学習し、会話のバリエーションを増やしていくことで、Romiの会話精度を高めていったんです。こうすることで、人間同士に近い会話のキャッチボールを行うことができるのが、Romiの最大の魅力ですね」

見た目やアニメーションの開発には相当の苦労を経験

 しかし、Romiの開発には相当の苦労を要したそうだ。

 そもそも人間以外で話しかける対象といえば、犬や猫、鳥などのペットが思い浮かぶだろうが、ロボットと話すシチュエーションはあまり機会がなく、想像しにくい。

 Romiを開発していく上で「どんな見た目なら、人間と同じような気軽に話せる存在になれるか」をひたすら考え、3Dプリンターでモックアップを作りながら、テストを何回も重ねたという。

 「大きいと威圧感を与えてしまいますし、話しかけずらく感じてしまいます。話しかけやすく、部屋にあっても違和感を覚えない見た目を追求していきながら、サイズ感やフォルムのデザインを考えました。結果として、SNS『mixi』のロゴと同形である会話の吹き出しを逆さにした手のひらサイズのロボットに落ち着いたんです」

 また、上下左右の細かな動作や100種類以上の表情豊かなアニメーションを実装することで、「生き物のように話してもらえる」ような世界観を体現できるよう工夫を凝らした。

 アニメーションを実装し、さまざまな表情を作り出すために採用したのが、顔部分の液晶ディスプレイだ。

 「世界のロボットを見ると、この位置に液晶ディスプレイがあり、目の色で感情を伝えるようなタイプが多いのですが、会話のテンポを整えるためには、色だけだとなかなか伝わりづらいのが課題でした。そこで、テンポと感情を伝えるために液晶ディスプレイを採用し、多彩なアニメーションを入れることで表情豊かなロボットを作ろうという考えに至ったのです。ただ、話す長さに合わせて、アニメーションをつけるのが相当難しく、試行錯誤を積み重ねながら、形にしていきましたね」

関連記事