日本のAIは“キャラクター”で勝負! ソニー「AI MEETUP 2」イベントレポート:前編
ソニー・ミュージックエンタテインメントが主催するセミナー「AI MEETUP 2~AI キャラクター ビジネス最前線~」が9月19日、開催された。昨年10月に第1回が行われている当セミナー。その後アップデートされた情報なども盛り込みつつ、日本におけるAI(Artificial Intelligence:人工知能)とキャラクタービジネスの最新動向や、ソニーが取り組んでいるキャラクター事業についての詳細も語られ、盛りだくさんの内容となった。ここでは、イベントの内容を詳細に解説していく。
社会がAIを受容するために必要だった「キャラクター」
第1部ではAI開発者、三宅陽一郎氏が登壇。同氏はゲーム会社でリサーチャーとして勤務するかたわら、AIに関する著書を多数執筆しており、今回は「なぜAIは人と会話ができるのか」というタイトルで基調講演を行った。
社会に溶け込みつつあるAI。少子高齢化が進む日本においては、今後人の仕事をAIに任せなければ社会は維持できないと見られている。特定分野において自立した判断を可能にする「AI」と、オートメーションを可能にする「ロボット」、そしてそれを使役する「人間」の3者が協調することが不可欠であり、そのためにはお互いを理解するツールが必要だと、三宅氏は語る。それぞれとの対話に必要なコミュニケーションツールが「言葉」であり、言葉によるコミュニケーションはAIが社会に浸透していく際に動脈のような働きをするという。「AIの浸透に重要なのが『キャラクター』です。キャラクターには人の心を和らげる効果があります」。何も語らない無機質な鉄の塊ではなく、動物や人の形をしていることが与える心理的効果は大きいようだ。キャラクターを扱う方法を知ることは、これからAIを発展させるために不可欠だという。
AIに対する接し方は文化によって変わり、大きく捉えると西欧的な価値観においては「神様」を頂点とした縦の序列の中で、AIを人間の下位に置き、人がAIを使役する、というモデルを描くことが多い。これを三宅氏は「垂直的知能感」と定義している。SFなどに描かれる「AIの反乱」とは、この立場が逆転することによって危機を演出するものであると指摘する。対する東洋的な視点においては、人間とAIは仲間であり、創作においてはキャラクターとして、お互いを理解しながら共生する姿が描かれることが多い。これを三宅氏は「水平的知能感」と定義する。この価値観により産まれた製品を海外に持っていくと、非常に驚かれるという。「例えばソニーには『AIBO』という素晴らしい製品がありますが、あれは日本文化の中でこそ出来上がったものだと思います」
人間の無意識はただ情報の海ではなく、言語によって構造化されている。我々が世界を見るときは、常に言語によって世界を捉えており、一旦言語を覚えると、我々はその幅の中で世界を規定することになるという。一方、ゲーム内のキャラクターは「世界」をどう捉えているのか? 多くの場合、ゲーム内の世界には多数のシンボルがあり、キャラクターはこのシンボルを認識して、自身のいる世界を理解する。しかし、いきなりゲーム世界にポリゴンのキャラクターを配置しても、キャラクターは自身では行動をせず、世界に対してなんの執着も持たない。三宅氏はこれを、煩悩を全く持たず「解脱」している状態であると指摘する。
「僕の仕事というのは、キャラクターに『煩悩』を与えることです。憎しみや、慈しみ、食欲、飢えなどを覚えさせて、世界への執着を生むこと、キャラクターを堕落させることなんです。『あいつが敵だ、憎いやつだ』『あそこに水場がある』というような執着を持つことで、キャラクターは世界を認識します」
「敵」や「水」といったマテリアルを配置し、そこに執着するキャラクターを生むことは、やはり言語に基づいている。色のない世界に色を付け、ラベリングしていくことが言語の役割であると、三宅氏は語った。
「キャラクター」へのこだわりこそ日本の強み
では、AIは世界をどのように認識しているのだろうか。三宅氏は、「人間には『世界をダイレクトに認識できる能力』があり、これは現実世界に身体を持っているから可能なことである。対してAIは世界に根付いた身体を持っておらず、物事をどのように見ればいいのか、という判断基準を自身で作り出す能力がない」と語る。これを「フレーム問題」といい、人間が「フレーム(活躍する場所)」を与えてあげなければ、AIは世界を認識できないのだ。このフレームには例えば、「将棋」や「自動運転」、「会話」などが挙げられる。
フレームには時間と空間という2つの軸があり、この軸で世界を切り取って、AIの活躍する場所を囲ってあげる必要があるのだという。AIは自発的に取り組む問題を作ることはできず、フレーム外にある似たような問題すら解くことはできない。将棋の名人だとしても、囲碁を打つことはできず、経路検索ができるからといって絵を描けるわけではない。
こうしたフレームは現実社会においては「言語」によって構造化されていると、三宅氏は説明する。子どもが「りんご」と「きりん」という言葉しか知らない場合、父親を見ても「りんご」と呼称するかもしれない。我々人間はこの状態から学習を重ね、さまざまな単語を知り、世界をどんどん区切っていくことで、「認識」を得ていく。
AIの場合には、我々の言語体系を恣意的に押し付けることで認識を「与える」ことが可能になる。「机の上にノートパソコンやペットボトルがある」という世界にAIを放り込み、そこに存在するシンボルの名前と位置関係を言語によって「教える」ことで、AIは世界を理解できるようになっていく。「シンボルの関係性を一つ一つ与えていくことで、AIは賢くなります。言語構造が複雑になっていくとともに、知能も高まっていくので、『AIが高度な言語を操る』ということは、そのまま知能の高さを表しているのです」と三宅氏はまとめた。
AIが自然言語を処理するには「形態素解析」という過程を経るそうだ。これは自然言語のテキストから文法や単語の品詞を解析し、文字を意味ごとに分割していく作業であり、AIが言葉の意味を解き明かすうえで不可欠な技術だ。この分野で日本は海外に遅れをとっているが、反面、AIの普及における独自の強みを持っていると、三宅氏は語る。それこそがキャラクター文化だ。
「街中には多数のキャラクターが溢れています。日本ほどキャラクターを深く受容している国は他にありません」
日本人は「言葉をしゃべる存在が生き物の姿をしている」ということに強いこだわりを持つため、「キャラクターに言葉を話させる」ということおいて、日本は一番研究に適した国であるという。しかし現状、学会や海外の文化的土壌におけるキャラクター文化の弱さから、AI研究においてキャラクター文化は切り離されて扱われることが多いという。三宅氏はこれらを結びつけることで、キャラクター文化とAIの技術は双方飛躍的に向上するだろうと語った。
「キャラクターとAIの技術を結びつけ、双方発展させていくことが重要です。こういった設計概念は『エージェント指向』と呼び、今注目されています。現に実世界において『キャラクターとAIを結びつけよう』という試みは多く行われており、たとえばスマートスピーカなどもその1例として挙げられるでしょう。日本の活躍が強く期待できる分野であり、世界を驚かせるような製品がこれからも多数出てくると予想されます」
AIの分野において、「エージェント」という概念は古くからあり、例えば1989年にApple社が発表したプロモーションビデオ「Knowledge Navigator」では、コンピュータ上に存在する電子秘書がユーザの命令に答える、という「未来のコンピュータ」の姿を描いていた。20年以上が経過した現在、Googleの囲碁AI「Alpha Go」や、個人開発の将棋AI「Ponanza」、Google・Appleの開発する自動運転車のニュースなど、ユーザがAI技術を目にする機会も増えてきている。これまでのハードウェア・ソフトウェアの進化はめざましく、AIの自然言語処理技術とエージェント指向が再び結びつく時代に立ち会えるのは感慨深い。この交差路に日本独自のキャラクター文化が付加されたときの発展は図り知れず、期待は膨らむばかりだ。
■白石 倖介
コンピュータ専門誌の編集者を経て、フリーライターとして活動中。Mac・iOSに詳しい。写真も撮る。主にTwitterにいます。Twitter/Blog