2019.01.26 07:00

囲碁AIで脚光浴びたDeepMindの新AI「AlphaStar」、ゲーム『StarCraft II』のトッププロに圧勝

　囲碁のトッププレイヤーに勝利したAI「AlphaGo」を開発して、一躍脚光を浴びたDeepMindがまたひとつ偉業を成し遂げた。今回挑戦したのは、囲碁よりはるかに現実の世界を反映していると考えられるゲームで、ヒトのトッププロプレイヤーに勝利することであった。

ヒトから学び、自身を磨く

　Google傘下のAI企業DeepMindは25日、『StarCraft II』をプレイするAI「AlphaStar」がヒトのトッププレイヤーに勝利したことを伝える同社ブログ記事を公開した。同AIがプレイする『StarCraft II』とは、資源の生産とユニットの製造を行いながら勢力を広げるというリアルタイムストラテジーに分類されるゲームである。このゲームにおけるチェスや囲碁と大きく異なる特徴は、対戦者が交互にではなく同時にプレイするリアルタイム制にある。さらには対戦者のプレイ内容を完全には知りえない「不完全情報ゲーム」であるでもある。それゆえ、『StarCraft II』はAIがプレイするゲームとしてはチェスや囲碁よりはるかに難しいとされている。

　同AIを開発するために、2段階のAI学習が実行された。1段階目は、ヒトのプレイデータからプレイ戦略を学習することである。そして、2段階目ではヒトのプレイ戦略を学んだAIを複数作ったうえで、AIどうしでリーグ戦を行ってさらにプレイスキルを強化したのだ。リーグ戦に参加するAIは、それぞれ異なったプレイ戦略やプレイ目標が設定されることで、多様なプレイから学習できるようにした。こうしたリーグ戦を通して、ヒトのプレイ時間に換算すると200年に相当するプレイ経験を積ませた。そして、このリーグ戦で最高成績を収めたAIこそ「AlphaStar」なのである。

企業経営に応用できる？

　以上のようにして完成したAlphaStarは、二人のトッププロと5試合制の対戦を行った。その結果、いずれのトッププロにも5-0で圧勝した（以下の動画とトップ画像を参照）。対戦者のひとりであるTLOは、AlpahaStarはよく知られた戦略を使ううえに誰も考えつかなかった戦略もプレイすることを指摘している。また、もうひとりの対戦者であるMaNaは同AIに敗北したことで、自身のプレイスタイルが対戦相手のミスにつけこむものであることを再認識した、とコメントしている。このコメントから、裏を返せば同AIはつけこまれるようなミスをほとんどしない、と解釈することができる。

AlphaStar: The inside story

　テック系メディア『The Verge』は、同AIを報じた記事のなかで『StarCraft II』をプレイするAIを長年研究してきたDave Churchill氏のコメントを引用している。同氏はもっとも楽観的に予想したトッププロに勝利するAIの誕生時期より1年早い、といって同AIの功績を称えている。

　また科学技術系ニュースメディア『NewScientist』は、ニューヨーク大学でコンピュータ・サイエンスを教えるJulian Togelius准教授のコメントを紹介している。同氏によれば『StarCraft II』をプレイすることは企業を経営することに似ており、とりわけロジスティクスに関するビジネス戦略と類似している、とコメントして同AIのビジネスへの応用を示唆した。ちなみにロジスティクスとは、商品の生産から販売までの過程を最適化することを目指すビジネス戦略を意味する。