これまで「手数と投了 2:棋士の投了手数」「手数と投了 4:floodgateにおける投了手数」の記事において、いくつかの棋譜集における投了手数の分布を示してきました。これらの分布の形状には何か見覚えがあるような気がしていたのですが、よくよく考えてみたら、ガンマ分布に近いのではないかと思い至りました。もしかすると、筆者以外にもそのように感じられた方は多いかもしれません。そこで今回は、本当に手数分布がガンマ分布に近いのかをざっくりと比較検証してみたいと思います。(いつも以上に)ギークな話になるかもしれませんが、興味のある方はご一読ください。
ガンマ分布というのは、正の変数xに対して、\[f(x) = N x^{k - 1} e^{- x / t}\]という関数で書き表せる連続分布のことです。Nは規格化係数であり、形状母数kと尺度母数tは、平均mと標準偏差sから、\[k = \frac{m^{2}}{s^{2}},~~ t = \frac{s^{2}}{m}\]のように決定されます。この分布は平均と標準偏差のみで決まり、他に余分な変数を含んでいません。
比較する手数分布は、棋士棋譜集(2015年11月版)とfloodgate棋譜集(2012~2015年版)から、レート差200以内で256手までの投了棋譜に限定し、先手勝利と後手勝利とに分けて規格化を行って得られたものです。それぞれの棋譜集については、以下の記事をご覧ください。
- 棋士の棋譜整理とレート算出:棋士棋譜集(2015年11月版)
- floodgateの棋譜整理とレート算出:floodgate棋譜集(2012年版)
- floodgateの棋譜整理とレート算出:floodgate棋譜集(2013年版)
- floodgateの棋譜整理とレート算出:floodgate棋譜集(2014年版)
- floodgateの棋譜整理とレート算出:floodgate棋譜集(2015年版)
両者を同時にプロットすると以下のようになります。青線がガンマ分布で、黒点が手数分布です。ここで、棋士棋譜集(2015年11月版)は、棋譜数41855、平均116.1、標準偏差27.88となっており、floodgate棋譜集(2012~2015年版)は、棋譜数98565、平均131.7、標準偏差32.41となっています。
グラフを見ると、ピークの部分で手数分布がガンマ分布をやや上回っており、精密に一致しているとは言えないようです。ただ、分布の概形はそれなりによく一致しており、形状フィット用の変数を含まない分布としては、それなりに優秀なのではないかと思われます。この結果を見る限り、近似として、正規分布を使うのならば、代わりにガンマ分布を使った方がよいということは言えそうです。
以上、ざっくりとした比較でしたが、やはり「手数分布はガンマ分布に近い」ということが分かりました。お手軽に手数分布の近似値がほしいという場合には、ガンマ分布を使ってみるといいかもしれません。
コメント