前回までの記事では、棋士棋譜集における投了手数を解析しました。今回は、コンピュータ将棋対局場floodgateの棋譜における投了手数を解析したいと思います。今回の解析は、「手数と投了 2:棋士の投了手数」のfloodgate版に対応しています。

ここで用いるのは、floodgate棋譜集(2012~2015年版)です。それぞれの詳細については、以下の記事をご参照ください。

まずは、規格化された頻度分布を以下に一覧します。規格化は、棋士棋譜集の場合と同様に、先手勝利と後手勝利の棋譜が同数相当になるように行われています。後手勝利の方が先手勝利よりも平均手数が約1手ほど大きくなるというのも、棋士棋譜集の場合と同じです。

floodgate_tesuu_normalized_hindo

平均や標準偏差は棋士棋譜集と異なりますが、分布の概形は似たような形になっています。ただ、棋士棋譜集の場合と比べて、少しグラフのガタつきが目に付きます。2015年版を除き、対象棋譜数は今回の方が多いので、本来はガタつきが減ってもおかしくないのですが、実際にはそうなっていないようです。

次に、平均と標準偏差に注目すると、全ての投了棋譜における値は以下のようになっています。

  • 2012年版:平均 125.3、標準偏差 32.0 (棋譜数 57339、最大手数 572)
  • 2013年版:平均 127.9、標準偏差 32.5 (棋譜数 79377、最大手数 528)
  • 2014年版:平均 124.5、標準偏差 32.8 (棋譜数 55925、最大手数 873)
  • 2015年版:平均 123.4、標準偏差 32.6 (棋譜数 33783、最大手数 272)
  • 2012~2015年版の算術平均:平均 125.3、標準偏差 32.5

ここで注意しなければならないのは、棋士棋譜集の最大手数389手に比べて、2012~2014年版の最大手数が大きくなっているという点です。これは、外れデータの影響がより大きく効いてくる可能性を示しています。2015年版のみ、最大手数が少ないのは、2015年2月1日より、持ち時間が「15分切れ負け」から「10分+秒読み10秒(1秒未満切捨て、256手引き分け)」に変更されているためです。

外れデータの影響を弾くために、投了手数の範囲を30手以上250手以下に限定して計算してみると、以下のようになります。

  • 2012年版:平均 124.8、標準偏差 30.6 (棋譜数 57137)
  • 2013年版:平均 127.2、標準偏差 30.9 (棋譜数 79018)
  • 2014年版:平均 124.0、標準偏差 31.1 (棋譜数 55747)
  • 2015年版:平均 123.3、標準偏差 32.4 (棋譜数 33753)
  • 2012~2015年版の算術平均:平均 124.8、標準偏差 31.3

結果的に、2012~2014年版の平均投了手数においては、外れデータの影響が約0.5手分ほどあったようです。

さらに、注意しなければならないのは、対局者間のレート差の影響です。基本的に、レート差の離れた強者が弱者に勝つ場合には手数が短くなる傾向があり、逆にレート差の離れた弱者が強者に勝つことは稀です。棋士棋譜集の場合には、9割弱がレート差200以内の対局であり、結果的にレート差が平均手数に与える影響は小さなものでした。しかしながら、floodgate棋譜集においては5割弱がレート差200以上の対局となっており、レート差の影響は無視できないものになっています。

レート差の影響を抑えて棋士棋譜集の結果と比較するため、上記の投了手数の範囲限定に加えて、さらにレート差200以内の対局に絞ると、以下のようになります。

  • 2012年版:平均 128.7、標準偏差 31.5 (棋譜数 27578)
  • 2013年版:平均 133.2、標準偏差 32.0 (棋譜数 36231)
  • 2014年版:平均 132.0、標準偏差 32.5 (棋譜数 21035)
  • 2015年版:平均 132.2、標準偏差 33.2 (棋譜数 13608)
  • 2012~2015年版の算術平均:平均 131.5、標準偏差 32.3

結果的に、レート差を絞ると、平均投了手数が約7手ほど伸びることになりました。

以下では、この投了手数の範囲とレート差を限定した場合の結果を解析します。棋士棋譜集の結果と比較する際には、棋士棋譜集の方も同様に限定した場合の結果を用いて比較します。

まず、投了手数の平均に注目すると、年毎にばらつきはあるものの特に目立った傾向は見られません。年を重ねる毎に参加者の棋力は向上しており、また、2015年2月には持ち時間も変更されているわけですが、それらの平均手数への影響は小さいようです。

棋士棋譜集の平均投了手数である約116手と比較すると、おおよそ16手ほど大きくなっています。この結果は、投了の“作法”の違いに由来するものと考えられます。すなわち、棋士が投了する局面でもコンピュータは投了せず、ほとんどは合法手がなくなるまで指し切るため、コンピュータの方が平均的に16手ほど多く指すということになるということです。ただし、棋士同士とコンピュータ同士とで、そもそも詰みまで指し切った時の平均手数が異なるということも十分に考えられるため、棋士の投了の判断について、この結果から直接的に何かを言うことはできません。この点について知りたいのであれば、例えば、棋士の投了局面からコンピュータ同士で指し継ぎをさせて統計をとるなど、更に詳細な研究を行う必要があるでしょう。

次に、投了手数の標準偏差を見てみると、棋士棋譜集における標準偏差が約28手であったのに対して、平均で4手ほど大きくなっています。この結果が何に由来するのかは難しいところです。もしかすると、floodgateの方が多様な対局が行われているということを示唆しているのかもしれませんし、棋士の投了判断に平均手数を意識した要素がある(すなわち、手数が短い時には投了が遅くなる等の傾向がある)ということを示唆しているのかもしれません。この結果からだけでは何とも言えません。

棋士棋譜集の際に解析した長手数のテール部分については、2015年2月以降は256手ルールのために存在せず、それ以前も15分切れ負けであったため、解析する意義に乏しいと思われます。なので、ここでは取り扱いません。

以上まとめると、floodgate棋譜集の投了手数においては、長手数の外れデータの影響、並びに対局者間のレート差の影響が大きいため、それらの影響を抑えて解析する必要があります。投了手数の範囲を30手以上250手以下、レート差200以内に限定した場合、平均投了手数はおおよそ132手で、棋士棋譜集よりも約16手ほど大きくなっています。また、標準偏差は約32手で、棋士棋譜集よりも約4手ほど大きくなっているということも分かりました。

今回の結果は、floodgateのシステムや参加者に依存したものであり、多種多様なコンピュータが対局しているというデータ上の利点がある反面、データ的なノイズや歪みが大きいという弱点もあります。次回は、均質な環境下における自己対局による棋譜データを用いた解析を行います。

-------------------

追記:2016年版について(2017年1月7日)

2016年版については以下の記事をご参照ください。

全ての投了棋譜における結果は、

  • 2016年版:平均 133.2、標準偏差 32.6 (棋譜数 22795、最大手数 255)

となっており、投了手数の範囲を30手以上250手以下に限定した場合は、

  • 2016年版:平均 133.1、標準偏差 32.3 (棋譜数 22766)

となっており、さらにレート差200以内の対局に絞った場合は、

  • 2016年版:平均 143.1、標準偏差 33.8 (棋譜数 9667)

となっています。

2016年版は、標準偏差はほぼ変わっていませんが、平均手数が10手ほど大きくなっています。この原因は後の記事で分析します。

2016年版の全ての投了棋譜の規格化された頻度分布は下図のようになっています。

floodgate_tesuu_normalized_hindo_2016