物理学の代表的な模型の一つに「ランダム・ウォーク」というものがあります。これは、物体が乱雑にフラフラと動き回る現象を模型化したものであり、酔っ払いの歩き方に似ていることから「酔歩」と訳されます。
よく知られている例としては、鉱物の粉や花粉から出る微粒子が水中で不規則に動き回るブラウン運動が挙げられます。微粒子は多数の水分子の衝突によってランダムに力を受けるわけですが、その単位時間における合計は必ずしも零にはならず、微粒子の不規則な運動を引き起こします(カジノで儲かる人と損する人がいるのと同じことです)。この運動は「酔歩」として模型化でき、このことはアインシュタインの1905年の著名な論文の内の1本のテーマになっています。
「酔歩」では、微粒子の位置は確率的に決定され、その確率分布は、歩けば歩くほど、広がっていきます。このことは、外部ノイズによって、微粒子の位置情報がどんどん拡散して失われていくと言い換えることができます。また同時に、長い時間スケールで見れば、微粒子の位置情報が失われて、水と微粒子が混合した平衡状態になるということも意味しています。このように、ミクロとマクロを結ぶ模型として、物理学では「酔歩」をよく考えます。
将棋における評価値の動きは不規則であり、一見すると「酔歩」に近いようにも見えます。果たして、将棋は酔歩模型で説明できるのでしょうか? 今回は、このことを検証してみたいと思います。
まず、酔歩模型の種類としては、なるべく簡単に、一手ごとに正規分布に従う確率で評価値が上がったり下がったりするものを考えましょう。手番の違い等、細かいことは平均化されているとして気にしないことにします。
ただし、評価値の数値は、絶対値が小さい局面でも大きい局面でも一手ごとの動きが同じになる様に、生の数値Vではなく、
\[X = F(V)\]
と変換された変形評価値Xを用います。ここで、関数Fは、単調増加する奇関数で(F(-V) = - F(V))、|V|が大きいところでは傾きが零に近くなるような関数です(例えば、tanh)。変形評価値の規格化は、勝敗が決する値を±1とします。
この簡単な模型でシミュレートすると、実際の手数分布を再現することはできません。実際、唯一の変数である一歩の標準偏差を平均手数に合わせるように決めると、手数分布が広がりすぎて、実際の分布とは全く違った形の分布になってしまいます。
この原因は、序盤の手や必然手、終盤の手の取り扱い方にあると考えられます。序盤の指し手は双方が均衡を保つように指すため、酔歩のようには進行しません。また、必然手もスキップするようなものであるため、酔歩的ではありません。さらに、実質的に勝負がついた後も、すぐに終局するわけではなく、手を進めて形を作ってから(ソフトなら詰みまで指してから)投了となりますが、その間の指し手も酔歩にはなりません。
これらの非酔歩手は、酔歩模型とは切り分けて、まとめて取り扱うこととし、こちらも正規分布に従う確率で手数が決まると仮定しましょう。
結果的に、一歩の標準偏差A、非酔歩手数の平均Mと標準偏差Sの3つが調整可能な変数となります。これらの3つの変数は、手数分布の平均、標準偏差(平均からの2次モーメント)、平均からの3次モーメントを合わせるように決定することにします。
手数分布については、簡単のために、ガンマ分布を採用して比較を行います。ガンマ分布と手数分布の詳細については「手数分布はガンマ分布で近似できるか?」の記事をご覧ください。
実際に、棋士棋譜集(2015年11月版)とfloodgate棋譜集(2012~2015年版)において、比較を行った結果を下図に示します。青線がガンマ分布で、黒点がそれぞれ1億回のシミュレーションの結果です。
さすがに3つの変数で調整すれば、大体は合わせることができます。未調整の量である平均からの4次モーメントについては、両者ともガンマ分布と4%弱の違いがあります。
具体的に、変数の値は、棋士棋譜集(上図)では、A = 0.2474、M = 95.46、S = 21.72となり、floodgate棋譜集(下図)では、A = 0.2262、M = 107.4、S = 25.13となっています。
棋士よりもソフトの方が非酔歩手数の平均が12手ほど大きいのは、投了方法の違いに依るものと思われます。また、酔歩の一歩の標準偏差が少ない(酔歩部分の手数が3手ほど長い)のは、その分だけ互いの読み筋が合っているためだと考えられます。この解析が正しいとすれば、以上の2つの要因が合わさって、棋士棋譜集よりもfloodgate棋譜集の平均手数が大きくなっていると解釈できます。
結果的に、上記の模型が正しいとして、形勢が揺れ動く酔歩部分は平均して1局で21~24手程度ということになります。この解析が妥当であるかは難しいところですが、解析結果を見ると、そんな感じもしてきます。
以上、今回は、将棋の手数分布が酔歩模型で説明できるかを検証しました。結果として、もし酔歩模型が妥当であるとするならば、酔歩部分は平均して1局で21~24手程度だということが分かりました。
コメント