そろそろ、モンテカルロ木検索第二回目。
対局型ゲームの例を挙げてみたいと思います。
なんといまさらな「三目並べ」!

3×3の9マスに、先手○・後手×を打って行き
縦横斜めで、三連を作ったほうが勝ち!と言うルール。
 えっと、交互に打ちますよ。
どちらも三連できずに、全部埋まれば引き分け!

映画でもありましたっけ?
人間は経験上、引き分けになることを知っていますね〜。
あれです、あれ。

で、最初に前のとき(上のほうにナンパの問題があります)と同じように
しらみつぶし法を使って考えて見ます。

その前に一つだけ約束事。
盤面に番地をつけます。
□□□      ABC
□□□  ⇒  DEF
□□□      GHI  と名前をつけておきますね。

 もう一つこれはちょっと知っているかたむき。
 回転対称・鏡面対称 は 考えないとします(後でやります)

さて、先手番は A,B,C,D,E,F,G,H,I の9箇所あります。
二手目後手番は 一手目以外の 8箇所に打てますね。
三手目は 二箇所減っているので 7箇所。
こうやって行くと、9手までで、
9×8×7×6×5×4×3×2×1=362880通り =(9!)9の階乗
もあります!
さすがに数が増えると、3人のときの6通りとは違って増えます><

が、しかし! これは三目並べです。
これよりもかなり少なくなるのは・・・
お分かりいただけますか?

少しだけ、ゲーム理論と言うものが登場します。
簡単に、すごく単純に、「自分から負けに行ってはいけない」
と、考えてください(ものすごく簡単にしていますのでわかってある方は突っ込まないでね)。

つまり、
1.A 2.B 3.D と、こうなったとします。   ○×□
このとき、4手目(後手の×)は!   ○□□
リーチを止めないと!ってことです。        □□□ こうなっています

4.G(左下)とやら無いと、負けです。
これでだいぶ、しらみつぶしでも数が減ります。
どれくらい減るか? スイマセン計算したくないです^^;

ってことで、今回はゲーム理論のほんの一歩だけ。

で、次回はフィードバックと言うのをお話しようかと思っています。
それでモンテカルロ木検索は全体像がでてくるかな?

実は1.A 2.B もうこれで勝負付いていますよ。 こういうのを順に追いかけて行きます。