コンピュータ将棋基礎情報研究所

コンピュータ将棋に関する基礎的な情報を収集し、分析し、発表する所です。英語名称はLaboratory for Fundamental Information on Computer Shogi (LFICS)。

カテゴリ: 論稿

ブログ開始時に最初に立ち上げた本シリーズですが、思いの外、長期連載になってしまいました。

手数という簡単な情報も、調べていくと様々な将棋の性質と関係していることが分かり、話が拡がると同時に、少しずつ理解が深まってきた感じがします。

最初の「手数と投了 2:棋士の投了手数」では、棋士棋譜集の手数分布について整理しました。特に、外れデータや規格化について、注意深く議論を行いました。

続いて、「手数と投了 3:棋士の未投了率における長手数テールと冪乗則」では、棋士棋譜集の手数分布の長手数部分に冪乗則が現れることを示しました。この原因は未だに謎です。256手ルールだと長手数部分は消えてしまうため、コンピュータ将棋での検証も容易ではないと思われます。

次に、「手数と投了 4:floodgateにおける投了手数」では、floodgate棋譜集の手数分布を整理して、棋士棋譜集との平均手数の違いを明らかにしました。しかしながら、floodgateの平均手数は今後も大きく変わりそうです。

また、「手数と投了 5:自己対局における投了手数」では、BonanzaとAperyの自己対局棋譜における平均手数を解析し、自己対局においては平均手数が大幅に上昇することを示しました。また同時に、思考時間の増加により、平均手数が伸びるという傾向も示しました。

さらに、「手数と投了 6:様々な連続対局における投了手数」では、BonanzaとAperyの様々な連続対局における平均手数を解析し、平均手数が読みの類似性を反映していることを明らかにしました。

この新たな知見に基づき、「手数と投了 7:floodgateにおける投了手数 改」では、改めてfloodgate棋譜集の平均手数の詳細を再解析し、平均手数とレートとの間の詳細な関係構造を明らかにしました。

手数については、まだまだ他に論点もあるでしょうし、また、本シリーズから派生したコラム記事も多数ありますが、区切りもいいところですので、本シリーズは一旦ここで締めたいと思います。

なお、当初予定していた投了条件の評価値閾値の話は、評価値と勝率との関係から議論した方がよいと思い直しましたので、改めて別のところで論じたいと思います。

前回の記事「手数と投了 6:様々な連続対局における投了手数」では、様々な連続対局における棋譜データを解析し、平均手数にはソフト間の“主張”の対立が反映されていることを示しました。すなわち、読み筋が合う(読みの類似性が高い)程、平均手数が長くなる傾向があるということです。今回は、その点を踏まえて、改めてfloodgate棋譜集の平均手数の詳細を再解析してみたいと思います。

今回、特に注目するのは、floodgate棋譜集(2012~2016年版)における平均手数(読みの類似度)とレート(両対局者の平均レート)との関係です。この関係を調べることで、全体の平均値からは見えない詳細な関係構造が明らかになり、また、2016年版における平均手数の大幅な上昇の原因も推測できるようになります。

手法としては、両対局者の平均レートをレート100刻みの区間に分割して(2000~2100、2100~2200等)、区間内の平均手数とレートの平均を算出します。採用するのは、30~230手まで、レート差200以内の対局に限ります。

2012~2015年版の結果を下図に示します。区間内のデータ数が10個以上の結果のみを黒点で表示し、また、レート500刻みの区間における平均を青線と青字で示しています。

mrate-tesuu_m

各点はばらついているものの、500刻みの区間の平均で見ると、大まかな傾向があることが分かります。2000~2500の区間では平均よりやや高めの平均手数であり、2500~3000の区間では平均手数が低くなり、3000~3500の区間では平均手数が高くなります。

2000~2500の区間は、弱くしたGPSやBonanza系統のソフトが多い領域であり、これらのソフトの読みの類似度が比較的に高いことから、少し高めの平均手数になっているようです。

2500~3000の区間は、種類の豊富なソフトが混在している領域であり、全体的に読みの類似度が下がり、平均手数が低くなっています。ソフトの“進化論”として眺めると、この領域は様々な手法が試行されている混雑期だと言えるかもしれません。

3000~3500の区間になると、読みの類似度が上がり、平均手数が上昇します。これは必ずしも同系統のソフトが増えているというわけではなく、異なるソフト間の読みの類似度も向上しているようです。この領域においては、現在の枠組みにおける手法の可能性がやや煮詰まってきているのかもしれません。

これらの傾向は、下図の2016年版の結果でも明確に現れています。

mrate-tesuu_m_2016

特に、3000~3500の区間の平均手数が大きく向上し、また、新しく出現した3500~4000の区間の平均手数はさらに増えています。そして、これらの区間の棋譜が増えたことが、全体の平均手数の向上の原因となっています。

この結果は、同系統のオープンソースソフト(Apery系、技巧)の放流が増えていることを差し引いても、レート上昇と読みの類似度との間に正の相関があることを示唆しています。この相関関係は“ある枠組みの中で最適化を目指していくと手法の詳細に依らずに類似性が増していく現象”として解釈できるかもしれません。

以上、今回は、floodgate棋譜集の平均手数の詳細を再解析しました。平均手数(読みの類似度)は対局者のレートに依存した詳細な構造を持っており、特にレート3000以上の領域においてはレート上昇と読みの類似度との間に正の相関が見られることが分かりました。

もしこの原因が手法の最適化にあるのだとすれば、今後もこの傾向は進んでいくと思われます。256手ルールの改善等も必要になるかもしれません。また、もしかすると新たな枠組みが開発されて、再び平均手数が大きく下がる混雑期に戻るという可能性もあります。未来のことは誰にも分かりません。

この論稿シリーズは一旦ここで締めたいと思います。次の記事でまとめます。

前回の記事「手数と投了 5:自己対局における投了手数」では、自己対局による棋譜データを用いた解析を行い、自己対局の平均手数がfloodgate棋譜集の平均手数を10手以上も上回ることを示しました。今回は、様々な連続対局の結果を解析することで、より詳細な分析を行いたいと思います。

ソフトの設定は全て前回の記事と同じです。それぞれ先後を入れ替えて500局ずつの計1000局の対局を行っていますが、解析に用いる棋譜は投了終了の棋譜のみです。

それぞれ勝敗数に依って推定レート差dRを算出し、高レート者が勝った棋譜の平均手数が(M + K dR)、負けた棋譜の平均手数が(M - K dR)となるMとKを求めて、レート補正項まで含めて平均手数を計算します。Mは勝敗数を五分にそろえた時の平均手数に対応します。Kはレート補正項の係数であり、「floodgateにおける手数とレート差:棋士との違いは?」の記事で分析した通り、floodgate棋譜集では、おおよそ-0.025程度の値となるものです。

まずは、Bonanza(6.0)で先手と後手で別々に秒読みの秒数を変えた場合の結果を示します。表の記法は、例えば、「B04」なら「Bonanzaの秒読み4秒」という意味です。

  • B04-B01: 145.2 - 0.02664 dR(棋譜数: 975、dR: 194.4)
  • B04-B02: 144.3 - 0.02895 dR(棋譜数: 968、dR: 93.3)
  • B04-B04: 145.4 + 0.00000 dR(棋譜数: 958、dR: 0.0)
  • B04-B08: 146.3 - 0.02414 dR(棋譜数: 961、dR: -115.0)
  • B04-B16: 145.0 - 0.02952 dR(棋譜数: 968、dR: -217.7)

平均手数Mは、おおよそ145手で一定しています。この145手というのは、前回の記事で示したBonanzaの秒読み2秒/4秒の時の自己対局の平均手数(145.2手/145.4手)に近い値になっています。

レート補正項の係数Kは、おおよそ-0.025強の値となっており、floodgate棋譜集の場合と大体一致しています。同じ秒数同士の対局の場合(B04-B04)は自己対局と同じですので、レート補正項はありません。

以上の結果から、Bonanzaについては、持ち時間/ハード性能の違う者同士の対局においても、通常的なレート補正項が付くだけで、基本的には自己対局と変わらない平均手数となることが分かります。

次に、Apery(wcsc25_bmi2)で同様の実験を行った場合の結果を示します。表の記法は、例えば、「A04」なら「Aperyの秒読み4秒」という意味です。

  • A04-A01: 140.2 - 0.02050 dR(棋譜数: 960、dR: 596.5)
  • A04-A02: 146.6 - 0.02669 dR(棋譜数: 951、dR: 236.5)
  • A04-A04: 150.1 + 0.00000 dR(棋譜数: 933、dR: 0.0)
  • A04-A08: 151.3 - 0.02761 dR(棋譜数: 913、dR: -209.9)
  • A04-A16: 151.2 - 0.03294 dR(棋譜数: 940、dR: -373.6)

平均手数Mは、A04-A01の時には、前回の記事で示したAperyの秒読み1秒の自己対局の平均手数(141.8手)に近い値になっており、A04-A02の時には、秒読み2秒の自己対局の平均手数(148.5手)に近い値になっており、その他は、秒読み4秒の自己対局の平均手数(150.1手)に近い値になっています。どうやら平均手数Mは、秒数が小さい方の自己対局の平均手数に近い値になっているようです。

レート補正項の係数Kは、おおよそ-0.025強に近い値となっており、floodgate棋譜集のものに近い値になっています。A04-A01とA04-A16の結果でズレが大きくなっているのは、レート差が大きく、強者が負ける棋譜が少ないため、誤差が大きくなっているのだと思われます。同じ秒数同士の対局の場合(A04-A04)は自己対局と同じですので、レート補正項はありません。

以上の結果から、Aperyにおいても、持ち時間/ハード性能の違う者同士の対局は、通常的なレート補正項が付くだけで、基本的には自己対局と変わらない平均手数となることが分かります。

上記のBonanzaとAperyの結果を見る限りでは、持ち時間/ハード性能は、探索の深さやレート差を変えるものの、本質的に自己対局の性質を変えるものではないということが推察されます。

それでは、BonanzaとAperyの両者を対局させた場合には、どうなるでしょうか?

まずは、Aperyの秒読みを2秒に固定して、Bonanzaの秒読みの秒数を変化させた時の結果を示します。表の記法は、基本的に上と同じですが、最後に、Aperyの勝利棋譜の平均手数(A)とBonanzaの勝利棋譜の平均手数(B)を追加しています。

  • a02-b02: 132.0 + 0.01660 dR(棋譜数: 991、dR: 305.0、A: 137.1、B: 127.0)
  • a02-b04: 134.4 + 0.03117 dR(棋譜数: 993、dR: 240.4、A: 141.9、B: 126.9)
  • a02-b08: 135.9 + 0.05022 dR(棋譜数: 988、dR: 177.1、A: 144.8、B: 127.0)
  • a02-b16: 136.7 + 0.14255 dR(棋譜数: 987、dR: 80.6、A: 148.2、B: 125.2)

平均手数Mは、自己対局の時に比べておおよそ10手ほど下がり、floodgate棋譜集の結果に近づいてきています。また、Bonanzaの秒読みの秒数を増やすほど、大きくなる傾向が見られます。これは、平均手数AとBの値を見てみると、Bonanzaが強くなるほど、Aperyの勝利棋譜の平均手数Aが大きくなっている一方で、Bonanzaの勝利棋譜の平均手数Bは、僅かに下がる傾向が見えるものの、ほとんど変わっておらず、このAとBの感受性の差が結果的に平均手数M(AとBの平均値)の上昇傾向に反映されていることが分かります。

ここで、問題なのはレート補正項の方です。レート補正項の係数Kは全てプラスの値になっており、また、絶対値も大きく変わっています。これは、レート補正項がまともに機能していないことを意味しています。

この理由は、AとBの値を見れば明らかであり、Aperyが勝つ時には長手数がかかり、Bonanzaが勝つ時には短手数で終わるという系統的な傾向があるためです。AとBを別々に見れば、レート差による変動は平均的には通常のレート補正項と同じ傾向を示しています。

この系統的な傾向は、新旧ソフトの評価関数の違いに由来するものと思われます。Aperyの方が評価関数の精度が高く、大局観に優れているため、長手数の将棋に強くなっており、一方で、大局観で劣るBonanzaは読みの量で勝負して、Aperyの読み抜けを咎めて短手数で勝つ場合が多くなっているのではないかと推測できます。棋士で例えると、Aperyはベテランの強豪棋士、Bonanzaは若手の新鋭棋士と言った感じでしょうか(この例えが妥当であるかは、棋士の方の棋譜も同様に解析して比較しないと分かりませんが)。こういうデータにも、単にレートの上昇だけではないコンピュータ将棋の進化の形跡が伺えます。

次は、Bonanzaの秒読みを8秒に固定して、Aperyの秒読みの秒数を変化させた時の結果です。表の記法は、上表と同じです。

  • b08-a01: 138.4 - 2.03315 dR(棋譜数: 989、dR: 6.7、A: 151.9、B: 124.8)
  • b08-a02: 135.9 + 0.05022 dR(棋譜数: 988、dR: -177.1、A: 144.8、B: 127.0)
  • b08-a04: 133.3 + 0.02247 dR(棋譜数: 994、dR: -304.2、A: 140.2、B: 126.5)
  • b08-a08: 134.1 + 0.00674 dR(棋譜数: 999、dR: -401.7、A: 136.8、B: 131.4)

この場合でも、基本的な傾向は上表と同じになっています。Bonanzaの方を強化しているのか、Aperyの方を強化しているのかの方向性の違いがあるだけです。

上の2つの表において、持ち時間が倍数の関係になっているのは、a02-b02とb08-a08(4倍)、a02-b04とb08-a04(2倍)、b08-a01とa02-b16(2倍)の3つです。

この3つの組み合わせにおいて、それぞれの平均手数を比較してみると、a02-b02とb08-a08の一組を除いて、持ち時間が増えるほど平均手数が減っています。a02-b02とb08-a08の組についても、Aの平均手数は減っており、増えているのはBの平均手数だけですが、ここではレート差が大きいため、Bの平均手数は棋譜数が少なく(それぞれ146局と90局)、あまり信用できる数字ではありません。

自己対局においては、持ち時間が増えるほど平均手数が増える傾向がありましたが、BonanzaとAperyの対局においては、そのような関係性は見られませんでした。このことは、floodgate棋譜集において平均手数の増加が見られていないことと整合しています。もしかすると、持ち時間が増える(もしくはレートが上がる)ほど平均手数が増えるというのは、自己対局に限定された話なのかもしれません。

以上、今回は、様々な連続対局における棋譜データを解析しました。先後の持ち時間/ハード性能に差をつけた対局では、探索の深さやレート差は変化するものの、本質的には自己対局の性質は変わらないということが分かりました。一方で、評価関数の違うソフト同士の対局では、平均手数が、自己対局の時に比べておおよそ10手ほど下がり、floodgate棋譜集の結果に近い値になることが分かりました。その時の平均手数には、ソフトごとに系統的な傾向が存在しており、また、持ち時間との間の正の相関も見られませんでした。平均手数には、評価関数の違いによる“主張”の対立が大きく反映されるようです。

さて、自己対局や様々な連続対局の棋譜データを解析することによって、平均手数についての理解が少し深くなってきました。次回は、改めて、floodgate棋譜集の平均手数の詳細を再解析してみたいと思います。

前回の記事「手数と投了 4:floodgateにおける投了手数」では、floodgate棋譜集の投了手数を解析し、30手以上250手以下、レート差200以内に限定した場合、平均投了手数が約132手となることを示しました。今回は、均質な環境下における自己対局による棋譜データを用いた解析を行います。

用いたソフトは、Bonanza(6.0)とApery(wcsc25_bmi2)です。Bonanzaは代表的な古典ソフトであり、Aperyは比較的新しい現代ソフト(2016年現在)になります。新旧ソフトの比較ができるように選びました。

用いた設定は以下の通りです。持ち時間は無しで秒読みのみとし、256手で引き分けになるようにしています。CPUはi7-4770K、メモリは16GBです。

  • Bonanza(6.0)
  • USI_Hash: 1024
  • USI_Ponder: False
  • Search_Control: Time
  • Limit_Time_Strict: True
  • Limit_Depth: 1
  • Limit_Nodes: 1000
  • Use_Book: True
  • Book_Type: Narrow
  • Resign: 32596
  • Threads: 1
  • Apery(wcsc25_bmi2)
  • apery_wcsc25_bmi2
  • USI_Hash: 1024
  • USI_Ponder: False
  • Best_Book_Move: False
  • Book_File: book/20150503/book.bin
  • Byoyomi_Margin: 500
  • Emergency_Base_Time: 200
  • Emergency_Move_Horizon: 40
  • Emergency_Move_Time: 70
  • Eval_Dir: 20150501
  • Max_Book_Ply: 32767
  • Max_Random_Score_Diff: 0
  • Max_Random_Score_Diff_Ply: 0
  • Max_Threads_per_Split_Point: 5
  • Min_Book_Ply: 32767
  • Min_Book_Score: -180
  • Minimum_Thinking_Time: 1500
  • MultiPV: 1
  • OwnBook: True
  • Skill_Level: 20
  • Slow_Mover: 100
  • Threads: 1
  • Use_Sleeping_Threads: False
  • Write_Synthesized_Eval:False

まずは、Bonanzaで秒読みの秒数を変えた時の結果を示します。各々1000局ずつの対局を行っていますが、今回用いる棋譜は投了終了の棋譜のみです。

  • 1秒: 平均143.3手(棋譜数965、標準偏差28.2)
  • 2秒: 平均145.2手(棋譜数965、標準偏差28.0)
  • 4秒: 平均145.4手(棋譜数958、標準偏差27.8)
  • 8秒: 平均147.9手(棋譜数963、標準偏差27.7)

平均手数は145手程度であり、floodgate棋譜集の約132手を約13手も上回っています。

また、秒読みの秒数が増える(読みが深くなる)と平均手数が大きくなる傾向も見られます。これは、評価関数が同じであることと探索の性質から、互いの読みが深くなる分だけ評価値の変動が抑えられて、結果的に平均手数が伸びたものと推測できます。この推測に基づけば、一般的に探索が深くなるほど、自己対局の平均手数は長くなるものと予測できます。

手数が定跡ファイルに依存している可能性もあるため、Bonanzaの定跡ファイルを宮本定跡改良版3に置き換えた場合も同様にやってみました。

  • 1秒: 平均141.4手(棋譜数976、標準偏差28.4)
  • 2秒: 平均141.8手(棋譜数973、標準偏差29.2)
  • 4秒: 平均142.2手(棋譜数969、標準偏差28.6)
  • 8秒: 平均145.3手(棋譜数968、標準偏差29.1)

この場合には、全体的な傾向は同じですが、平均で約2.8手ほど平均手数が小さくなります。やはり定跡ファイルにより、数手程度は変わるようです。定跡ファイルをさらに厳選すれば、勝率との相関はさておき、平均手数をもっと大きく変えることも可能だと思われます。

次に、Apery(wcsc25_bmi2)の場合の結果を示します。

  • 1秒: 平均141.8手(棋譜数943、標準偏差31.4)
  • 2秒: 平均148.5手(棋譜数948、標準偏差32.1)
  • 4秒: 平均150.1手(棋譜数933、標準偏差32.5)
  • 8秒: 平均153.8手(棋譜数901、標準偏差31.2)

1秒の結果は除き(この他でもAperyの1秒はイレギュラーな結果が多くなっています)、Bonanzaよりも、それぞれ3手以上、大きくなっています。また、秒読みの秒数が増えた時の平均手数の増分もBonanzaより大きくなっています。このデータにおいて、平均手数が増えると投了決着が減っているのは256手ルールのためです。一般的に、平均手数と投了決着の割合との間には負の相関があります。

Aperyは合法手がなくなるまで指す一方で、Bonanzaは詰みの数手前に投了することがあるため、平均手数の差の一部は投了手法の違いによるものですが、秒読みの秒数が増えた時の増分はそれだけでは説明がつきません。長時間のAperyには手数を長引かせる要素があるようですが、それが探索に由来するものなのか、評価関数に由来するものなのか、それとも両者の組み合わせによるものなのかは分かりません。

秒読みの秒数が増えた時の平均手数の増分は、BonanzaでもAperyでも、探索の深さ(秒数2倍で約1手弱ほど深くなる)に対して線形よりもやや大きく、非線形性を示しています。もし、ミニマックス原理に基づいて探索の深さの分だけ決着が先延ばしされるというだけの話であるのならば、この関係性は線形であるはずなのですが、実際にはそうなっていません。これについては仮説も考えられるのですが、それについてはまた別の機会に記したいと思います。

さて、ここでの最大の問題は、全ての状況において、自己対局の平均手数がfloodgate棋譜集の平均手数の約132手を10手以上も大きく上回っているという点です。

この原因としては、自己対局では評価関数が基本的に同じであるため、読み抜けによる決着が起こりにくい(読み抜け自体はあっても、相手がそれを咎めることができない)ということが考えられます。また、評価関数の違いによる“主張”の対立も起こらないため、均衡局面が長く続きやすいということも要因として考えられます。

以上、今回は自己対局による棋譜データを用いた解析の結果を示しました。自己対局の平均手数は、ソフトの種類、定跡ファイル、探索の深さ等に依存しており、それぞれ数手以上は変動することが分かりました。特に、探索の深さについては非線形な正の相関があるようです。また、自己対局の平均手数は、ソフトの新旧や棋力によらず、floodgate棋譜集の平均手数を10手以上も上回ることが分かりました。

自己対局における平均手数の大幅な上昇の原因を解析するには、もっと様々に条件を変えた場合の実験を行ってみる必要があります。次回は、その結果を示します。

-------------------

追記:技巧による自己対局(2017年1月26日)

設定は以下の通りです。

  • 技巧(20160606)
  • gikou_win_20160606
  • USI_Hash: 1024
  • USI_Ponder: False
  • BookMaxPly: 50
  • ByoyomiMargin: 100
  • DrawScore: 0
  • FischerMargin: 12000
  • MinBookScoreForBlack: 0
  • MinBookScoreForWhite: -180
  • MinThinkingTime: 1000
  • MultiPV: 1
  • NarrowBook: False
  • OwnBook: True
  • SuddenDeathMargin: 60
  • Threads: 1
  • TinyBook: False

技巧(20160606)による1000局の自己対局の投了手数は以下のようになりました。

  • 1秒: 平均162.7手(棋譜数874、標準偏差32.8)
  • 2秒: 平均167.0手(棋譜数880、標準偏差31.3)
  • 4秒: 平均172.2手(棋譜数834、標準偏差33.2)

平均手数は160手を超えており、思考時間を増やすとさらに大きくなっています。このことから、技巧の読み筋が安定しており、長く局面を均衡に保っていることが分かります。

また、自己対局は256手ルールで行っていますが、平均手数の大幅な上昇により、256手を超える対局も1割を超えています。

前回までの記事では、棋士棋譜集における投了手数を解析しました。今回は、コンピュータ将棋対局場floodgateの棋譜における投了手数を解析したいと思います。今回の解析は、「手数と投了 2:棋士の投了手数」のfloodgate版に対応しています。

ここで用いるのは、floodgate棋譜集(2012~2015年版)です。それぞれの詳細については、以下の記事をご参照ください。

まずは、規格化された頻度分布を以下に一覧します。規格化は、棋士棋譜集の場合と同様に、先手勝利と後手勝利の棋譜が同数相当になるように行われています。後手勝利の方が先手勝利よりも平均手数が約1手ほど大きくなるというのも、棋士棋譜集の場合と同じです。

floodgate_tesuu_normalized_hindo

平均や標準偏差は棋士棋譜集と異なりますが、分布の概形は似たような形になっています。ただ、棋士棋譜集の場合と比べて、少しグラフのガタつきが目に付きます。2015年版を除き、対象棋譜数は今回の方が多いので、本来はガタつきが減ってもおかしくないのですが、実際にはそうなっていないようです。

次に、平均と標準偏差に注目すると、全ての投了棋譜における値は以下のようになっています。

  • 2012年版:平均 125.3、標準偏差 32.0 (棋譜数 57339、最大手数 572)
  • 2013年版:平均 127.9、標準偏差 32.5 (棋譜数 79377、最大手数 528)
  • 2014年版:平均 124.5、標準偏差 32.8 (棋譜数 55925、最大手数 873)
  • 2015年版:平均 123.4、標準偏差 32.6 (棋譜数 33783、最大手数 272)
  • 2012~2015年版の算術平均:平均 125.3、標準偏差 32.5

ここで注意しなければならないのは、棋士棋譜集の最大手数389手に比べて、2012~2014年版の最大手数が大きくなっているという点です。これは、外れデータの影響がより大きく効いてくる可能性を示しています。2015年版のみ、最大手数が少ないのは、2015年2月1日より、持ち時間が「15分切れ負け」から「10分+秒読み10秒(1秒未満切捨て、256手引き分け)」に変更されているためです。

外れデータの影響を弾くために、投了手数の範囲を30手以上250手以下に限定して計算してみると、以下のようになります。

  • 2012年版:平均 124.8、標準偏差 30.6 (棋譜数 57137)
  • 2013年版:平均 127.2、標準偏差 30.9 (棋譜数 79018)
  • 2014年版:平均 124.0、標準偏差 31.1 (棋譜数 55747)
  • 2015年版:平均 123.3、標準偏差 32.4 (棋譜数 33753)
  • 2012~2015年版の算術平均:平均 124.8、標準偏差 31.3

結果的に、2012~2014年版の平均投了手数においては、外れデータの影響が約0.5手分ほどあったようです。

さらに、注意しなければならないのは、対局者間のレート差の影響です。基本的に、レート差の離れた強者が弱者に勝つ場合には手数が短くなる傾向があり、逆にレート差の離れた弱者が強者に勝つことは稀です。棋士棋譜集の場合には、9割弱がレート差200以内の対局であり、結果的にレート差が平均手数に与える影響は小さなものでした。しかしながら、floodgate棋譜集においては5割弱がレート差200以上の対局となっており、レート差の影響は無視できないものになっています。

レート差の影響を抑えて棋士棋譜集の結果と比較するため、上記の投了手数の範囲限定に加えて、さらにレート差200以内の対局に絞ると、以下のようになります。

  • 2012年版:平均 128.7、標準偏差 31.5 (棋譜数 27578)
  • 2013年版:平均 133.2、標準偏差 32.0 (棋譜数 36231)
  • 2014年版:平均 132.0、標準偏差 32.5 (棋譜数 21035)
  • 2015年版:平均 132.2、標準偏差 33.2 (棋譜数 13608)
  • 2012~2015年版の算術平均:平均 131.5、標準偏差 32.3

結果的に、レート差を絞ると、平均投了手数が約7手ほど伸びることになりました。

以下では、この投了手数の範囲とレート差を限定した場合の結果を解析します。棋士棋譜集の結果と比較する際には、棋士棋譜集の方も同様に限定した場合の結果を用いて比較します。

まず、投了手数の平均に注目すると、年毎にばらつきはあるものの特に目立った傾向は見られません。年を重ねる毎に参加者の棋力は向上しており、また、2015年2月には持ち時間も変更されているわけですが、それらの平均手数への影響は小さいようです。

棋士棋譜集の平均投了手数である約116手と比較すると、おおよそ16手ほど大きくなっています。この結果は、投了の“作法”の違いに由来するものと考えられます。すなわち、棋士が投了する局面でもコンピュータは投了せず、ほとんどは合法手がなくなるまで指し切るため、コンピュータの方が平均的に16手ほど多く指すということになるということです。ただし、棋士同士とコンピュータ同士とで、そもそも詰みまで指し切った時の平均手数が異なるということも十分に考えられるため、棋士の投了の判断について、この結果から直接的に何かを言うことはできません。この点について知りたいのであれば、例えば、棋士の投了局面からコンピュータ同士で指し継ぎをさせて統計をとるなど、更に詳細な研究を行う必要があるでしょう。

次に、投了手数の標準偏差を見てみると、棋士棋譜集における標準偏差が約28手であったのに対して、平均で4手ほど大きくなっています。この結果が何に由来するのかは難しいところです。もしかすると、floodgateの方が多様な対局が行われているということを示唆しているのかもしれませんし、棋士の投了判断に平均手数を意識した要素がある(すなわち、手数が短い時には投了が遅くなる等の傾向がある)ということを示唆しているのかもしれません。この結果からだけでは何とも言えません。

棋士棋譜集の際に解析した長手数のテール部分については、2015年2月以降は256手ルールのために存在せず、それ以前も15分切れ負けであったため、解析する意義に乏しいと思われます。なので、ここでは取り扱いません。

以上まとめると、floodgate棋譜集の投了手数においては、長手数の外れデータの影響、並びに対局者間のレート差の影響が大きいため、それらの影響を抑えて解析する必要があります。投了手数の範囲を30手以上250手以下、レート差200以内に限定した場合、平均投了手数はおおよそ132手で、棋士棋譜集よりも約16手ほど大きくなっています。また、標準偏差は約32手で、棋士棋譜集よりも約4手ほど大きくなっているということも分かりました。

今回の結果は、floodgateのシステムや参加者に依存したものであり、多種多様なコンピュータが対局しているというデータ上の利点がある反面、データ的なノイズや歪みが大きいという弱点もあります。次回は、均質な環境下における自己対局による棋譜データを用いた解析を行います。

-------------------

追記:2016年版について(2017年1月7日)

2016年版については以下の記事をご参照ください。

全ての投了棋譜における結果は、

  • 2016年版:平均 133.2、標準偏差 32.6 (棋譜数 22795、最大手数 255)

となっており、投了手数の範囲を30手以上250手以下に限定した場合は、

  • 2016年版:平均 133.1、標準偏差 32.3 (棋譜数 22766)

となっており、さらにレート差200以内の対局に絞った場合は、

  • 2016年版:平均 143.1、標準偏差 33.8 (棋譜数 9667)

となっています。

2016年版は、標準偏差はほぼ変わっていませんが、平均手数が10手ほど大きくなっています。この原因は後の記事で分析します。

2016年版の全ての投了棋譜の規格化された頻度分布は下図のようになっています。

floodgate_tesuu_normalized_hindo_2016

このページのトップヘ