【特別対談】茂里憲之×香川愛生 カードゲームと将棋、AI時代に「勝つ人」の頭の中
トレーディングカードゲームの理論を「数理と心理」から解き明かした『カードゲームで本当に強くなる考え方』(ちくまプリマー新書)。本書の著者であり、MTG(マジック:ザ・ギャザリング)などで活躍するプロカードゲーマー・茂里憲之と、「女流棋界のカードゲーマー」としても知られる女流棋士・香川愛生に、「勝負の考え方」について語り合ってもらった。
AIが「よりよい手」を教えてくれる時代に、感覚とロジックをどう行き来するのか。運の要素があるカードゲームと、運がほとんどない将棋で、「勝つ人」は何を考えているのかーー。
感覚で戦う人ほど、本当はロジカル
香川愛生(以下、香川):茂里さんはとてもロジカルにカードゲームに向き合われてますよね。私はカードゲームも好きですが、運の要素など、将棋と違う考え方が必要となるとなかなか上達ができないことが多いので、この本はとっても勉強になりました。
茂里憲之(以下、茂里):ありがとうございます。カードゲームって確率を知っていると戦術を立てやすくなるし、言語化能力が高いほど実力も上がるので、どうしてもロジカルになってくるのかもしれません。
香川:最初に言ってしまうと、私、たぶん「感覚派」って言われるタイプなんです。
茂里:それ、めちゃくちゃいいですね。
香川:え、ありがとうございます! 将棋って、「感覚で戦っている競技」っていうイメージが持たれづらいゲームかなって思ってたので、なんだか嬉しいです。
茂里:機械学習を学んできた身としては、感覚の領域に特化した人と話すのはとても嬉しいです。むしろ「自分はロジカルだ」と思っている人ほど、実際にはそうでもないケースも多いので。「感覚で指している」と自覚されている香川さんは、逆にすごくロジカルな方なんだろうなと。
香川:そう言っていただけると心強いです。
茂里:将棋って「全知全能の神がいたらこう指すだろう」という最善手を、誰も知らない前提で戦っているゲームだと思っていて。結局は、言語化されていない感覚を頼りに指しているんじゃないかと。いかがでしょう。
香川:そうかもしれません。いま将棋界では、AIの示す指し手が大きな指標とされてきています。ただ、AIも「なぜその手が最善なのか」は教えてくれません。AIが示した手順から意味を咀嚼したり、言語化したりするのが、一つの課題とも言えますね。
AIと言語化
茂里:対局中継でも、棋士が指すたびにAIの評価値バーが動きますよね。
香川:そうなんです。着手するごとに左右に動いて。視聴者は盛り上がりますけど、今の手でなんで評価値が下がったんだろうって、人間の感覚と異なる場面も結構あるんですよね。
茂里:トッププロでもAIの手を説明するのは難しいんですね。
香川:最近、竜王戦で印象的な局面がありました。藤井聡太竜王に佐々木勇気八段が挑戦したシリーズの第4局で、AIの評価値としては佐々木八段がはっきり優勢、でも、次の一手があまりにも難しくて、長考に沈まれましたが、結果的に最善手を見出せなかったのです。
感想戦で佐々木八段は「自分の体感だと少し良いのかなと思っていたので、良くなる手順の組み合わせを見つけたかったんですけど、考えてもわからなかった」とおっしゃっていました。感覚として有利であることは感じられても、具体的に手順として落とし込むことはトップの先生でも難しいんです。
茂里:そのお話で思い出しました。ある心理学の本で読んだのですが、チェスの盤面をプロプレイヤーに覚えてもらって、途中で実戦で起こり得ないような完全にランダムな配置に入れ替えると、どんなに強い人でも元の局面を再現できなかった、という実験があるんです。実戦の延長線上にある局面なら戻せるのに、本当にランダムだと無理になる。
香川:それ知ってます! むかし将棋でも似たような企画がありました。同じように実戦の局面から駒をバラバラに配置したものを元に戻すものでしたけど、結果は失敗で。プロ棋士でも意味のある配置でないと覚えられないんですよね。
茂里:おそらくトッププロの方は、言葉になる前の段階の思考を処理しているのではないでしょうか。ある少数民族が、「鮮やか」とか「明るい」という言葉はあるけど、「赤」とか「青」のような具体的な色の言葉を持たない、みたいな話もあります。
何が言いたいかというと、人間は「言葉になる前の何か」で情報を処理しているんじゃないかと。その領域にAIの手がどんどん伸びてきているからこそ、「じゃあ自分はそれをどう自分の感覚や言葉として取り込んでいくのか」が、すごく大事になるのかなと思います。
香川:まさにそこが、今の将棋界の大きなテーマです。AIがない時代から指されてきた先生方は、すでに身につけている言葉や価値観が、逆に邪魔になることもあるんです。AI時代の新しい感覚をどう言語化するのか、どんな指し手を選んでいくべきなのか、そこにすごく苦心されている印象です。
AIが示す最善手って、対局中に見えるわけじゃないですし、研究で知ったとしても、いざ本番で同じ局面が来るとは限りません。だからこそ「これは何が良いのか」を自分の中で理屈や感覚に落とし込んでいく過程が、すごく重要になっている気がします。
AIが正しいとは限らない
茂里:いま将棋界は、AIの導入によって、これまで常識とされていた定跡が見直されているんですね。
香川:そうなんです。AIが初めて見つけた囲い(玉将を守る陣形)もあって。昔は「玉はとにかく深く、堅く囲うべし」とされていたのが、AIの登場で、「そこまで行かず、バランスよく戦況に応じて指し分けるほうがいい」という考え方が一例です。以前の感覚だったら絶対に選べないような手を、「最善だよ」とAIに言われて指させられている感覚は、正直まだ少し抵抗があります。
茂里:過去の天才棋士の一手も、AIですぐに検証できてしまいますよね。
香川:しかも、それで評価値がガクッと下がっちゃうと、やっぱり複雑な気持ちになりますね。
茂里:香川さんは、AIが示す最善手には納得感がありますか?
香川:あるときとないときと、という感じですね。というのも、盤面が苦しいときにAIが示す最善手って、必ずしも人間にとっての最善ではないとも感じるんです。
茂里:それは興味深いです。
香川:苦しい状況では「最善」が存在しないんです。なので、相手の読みにない手を選ぶとか、間違えやすい複雑な局面に誘導するとかを、逆転するためにひねり出さないといけません。そこは人間ならではの駆け引きだと言えると思います。
茂里:わかります。カードゲームも同様で、たとえばマジック:ザ・ギャザリング(以下、MTG)で2本先取のマッチ戦の場合、1本目や2本目なら「続くゲームで相手が一番ミスしそうな展開」を選ぶことがあります。
ほかにもデッキリストが公開されない試合だと、「普段は使われていないカードをあえて見せておこう」とか、「本当は入っていないカードで勝ちを狙っているように見せよう」とか、相手の認知を誘導する駆け引きをします。
香川:そんな熱い駆け引きが……! お互いが読む力があるからこそ、高度な読み合いが生まれるということなんですね。
AIの評価値と、自分の「感覚」がズレるとき
香川:そういえば、これはカードではないんですけど、ポケモンゲームの世界大会で、リアルタイム評価値が導入されるようになったんですよね。『将棋ウォーズ』のHEROZさんも開発に関わったAIで、対戦中に「今どっちがどれくらい優勢か」が数字で表示されるようになりました。
でも、運要素の高いカードゲームでリアルタイム評価値を出すのって、やっぱり難しいです、よね?
茂里:そうだと思います。というのも、運の要素があるゲームでの評価値は、何を前提にするかでその意味が変わってくると思っていて。カードゲームなら、山札の残り枚数や、次に引けるカードの質を勝率に組み込む仕組みが必要になってくる。
香川:なるほど。何を基準に見るかで、同じ状況でも評価は全然違ってきそうですね。
茂里:ポケカだったら、例えば「サイド落ち」(ゲーム中に必要となるカードがサイドにおかれること)がありますし、「ライブラリアウト」(山札のカードがすべてなくなって敗北すること)のように、相手のデッキを枯らして勝つプランもある。盤面だけを見れば攻めたほうが勝てそうでも、「山札の残り」や「相手のリソースの減り方」まで含めて評価すると、違う選択肢が最善になることもある。
ただ、そこまでをきちんと評価に組み込めるAIのシステムは、まだ開発が難しい気がします。固定されたデッキ同士なら分析しやすいですが、人間は対戦によってデッキ構成も変えてしまうので。
AIの意図を言語化するのは難しいということでしたが、香川さんご自身も、AIの評価値と自分の感覚がズレる瞬間って、やっぱりありますか?
香川:ありますね。自分では良い局面だと思ってAIにかけてみたら、評価は高くなかった、ということもありますし、対局中にはお互いに気づいていなかった手が実は存在していて、もしその手を選んでいれば展開は違っていたというケースもあります。そういう発見があるから、AI研究って勉強になるんですけど。
ただ茂里さんの本にも、負けたときに「本当に振り返るべきなのは『ああすれば良かった』ではなく、『どうしてそうできなかったのか?』」だと書かれていて、すごく大事な視点だと感じました。こういう考え方って、実は多くの人にとって難易度が高いと思うんですが、茂里さんはどうやってその境地にたどり着いたんですか?
茂里:うーん、僕の場合はもう単純に、確率のことをずっと考えていたからだと思います(笑)。カードゲームって、「別の手を指していれば勝っていたよね」という場面は山ほどあるんですけど、そのときに本当に大事なのは、「結果」じゃなくて「その選択をしたときの期待値」なんですよね。
友達と「別の手を打ってたら勝ってたよね」みたいな話をしていても、実は負けたけどその手を打ったほうが良かった、というケースもある。たまたま裏目を引いただけで、意思決定としては正しかった、みたいな。
香川:今のお話、すごくわかる気がして。具体的な場面があったら、聞いてみたいです。
茂里:二択でAを選ぶと30%で勝ってBを選ぶと70%で勝つという選択肢があったとき、Bを選ぶべきです。しかし結果的に低い確率が出てAを選んでいれば勝っていたということが確率のあるゲームではしょっちゅう起きます。他にも、自分がずっと練習してきたデッキと、大会直前にわかった、より強いけど練習が間に合うかわからないデッキのどちらを使うべきかという場合も、どちらが正解か判断するのは難しいです。
個別の結果だけを見ても次へ繋がらないからこそ、「なぜ自分はその選択をしたのか」を言語化しておくことが、あとで効いてくると思っています。
「変えるか、変えないか」本番でゆらぐ戦略
香川:なるほど。それって将棋でたとえると、序盤の指し方がカードゲームでいう「デッキ」に当たるのかなと思いました。どの戦型を採用して、どんな形を目指すのかは、相手の準備や自分の得意不得意を含めた駆け引き次第ですけど。
でも、対局の直前になって、「もし相手がこう来たらどうしよう」と急に不安になることもあります。研究のときはじっくり囲う想定だったけれど、「ここで攻められたらどうしよう」と本番で気づいてしまう場面ですとか。
そういう「想定外」が起きたとき、茂里さんはプランを「変えちゃう」タイプですか?
茂里:僕は……変えちゃう派ですね(笑)。
香川:おおー。茂里さんもそういう戦い方をされると聞くと、勇気づけられる気がします(笑)。準備していればしているほど、予定にない戦い方を選ぶのって勇気のいる選択かなとも思うのですが。
茂里:そうかもしれないですね。僕の場合は、ゲーム中に全く知らないことをする時はその場で考えはするんですが、練習中はむしろ「知らないこと」を試したほうがいいと思っています。自分の中で「7割うまくいきそうな、よく知っているパターン」と、「3割うまくいくかもしれない、新しいパターン」があったら、練習では3割のほうを選びたい。
香川:それはすごくよくわかります! 将棋でも、勝ちやすい形だけをなぞっていると、その先に新しい発見はなかなかないんですよね。本番では選ばないけれど、研究の段階では「ここでこんな手を指したらどうなるんだろう」とか、「この受け方は成立しないよな」とか、あえて悪そうな手も検証してみる。
勝っている局面でも「ここで詰めるとどうなるんだろう」とか、「相手が受け間違えてくれたら勝てそうだよな」という筋って結構あるので、それも研究だったら潰しやすい。逆に、「こう守れば大丈夫だろう」と思った手が、実は成立していなかった……みたいなことも、研究段階では起きますね。対局では滅多に出ない分岐まで掘るのは、練習だからこそできると思います。