最後まで粘り強く指す人、早投げの人、棋士には様々なタイプの人がいると言われています。それらはどのように統計量として現れてくるのでしょうか? また、粘り強さと棋力との間には何か関係があるのでしょうか?
今回は棋士棋譜集(2015年11月版)に基づいて分析します。この棋譜集の詳細については「棋士の棋譜整理とレート算出:棋士棋譜集(2015年11月版)」をご参照ください。
まず、30手以上200手以下の投了決着の棋譜に限定して、リスト上の各棋士について、勝ちの棋譜と負けの棋譜を区別してそれぞれの平均手数を算出します。ここで手数の範囲を限定するのは外れデータの影響を抑えるためです。勝ちの棋譜については、投了したのは相手の棋士であり、そのタイミングは相手次第でバラバラのはずです。一方で、負けの棋譜については、投了のタイミングに棋士の個性が反映されていると推測できます。
結果として、勝ちの棋譜については各棋士の平均手数の平均は115.0で標準偏差は5.2となり、負けの棋譜については平均は114.4で標準偏差は6.8となりました。平均と標準偏差については解説記事「平均と標準偏差:それって不偏推定値?」をご覧ください。ここで、平均が棋譜全体の手数の平均よりも僅かに下がっているのは手数の範囲を限定しているためです。また、勝ちの棋譜と負けの棋譜の平均が僅かに異なっているのはリスト外の棋士がいるためです。
この結果で注目するべきなのは、標準偏差の違いです。標準偏差の値は負けの棋譜の方が勝ちの棋譜よりも1.6大きく、これは投了のタイミングについての棋士の個性が現れていると考えられます。つまり、投了の個性が平均化されて消えてしまう勝ちの棋譜よりも、反映されている負けの棋譜の方が棋士ごとのばらつきが大きいというわけです。
それでは、平均手数とレートとの間には相関関係はあるのでしょうか?
勝ちの棋譜については、平均手数とレートとの相関係数は-0.445であり、弱い負の相関があるようです。線形回帰を行うと、\[T = -0.0181 R + 142\]となっています。ここで、Tは平均手数、Rはレートです。大雑把に言うと、レートが100上がると、平均手数が2手弱くらい下がるということになります。相関係数と線形回帰については以下の解説記事をご覧ください。
つまり、「強い人は勝つ時はあっさり勝つ」という傾向が見られるということです。この原因としては、「強い人は中終盤の寄せが鋭く、相手に中々粘らせない」というようなことも考えられますし、また、「強い人には“信用”があるために相手が無駄に粘ってこない」というようなことも考えられます。この結果からだけでは、傾向が見られるというだけで、原因を解析することまではできません。
一方で、負けの棋譜については、平均手数とレートとの相関係数は0.109であり、非常に弱い正の相関があるかどうかというところです。勝ちの棋譜と同様に線形回帰を行うと、\[T = 0.00578 R + 106\]となっています。つまり、粘る人の方が強いという傾向が僅かに見えないわけではないですが、勝ちの棋譜の場合と比較すると、相関係数の絶対値も小さく、線形回帰の係数の絶対値も小さいため、関係性としては相対的にとても弱いと考えられます。このデータによると「将棋は粘ればよいというものではない」ということのようです。
さて、上記の結果を踏まえて、棋士の粘り度を見るにはどのような値を計算して比較すればよいのでしょうか?
棋士ごとに時代や得意戦法等の違いによって平均手数が異なるため、負けの棋譜と勝ちの棋譜の平均手数の比を取るというのがまず考えられますが、これだと上で示したようにレートとの相関があるため(実際に相関係数は0.480)、棋力の差が結果に反映してしまいます。線形回帰の結果を用いて補正するというやり方も考えられますが、方法が徒に複雑になりますし、そもそもレートについての信用性にもやや疑問がありますので、あまり優れたやり方とは言えないでしょう。
そこで、個々の平均手数の差には目を瞑って、投了負けの棋譜の平均手数を115で割った値を「粘り度」として定義することにします。ここで、115は全体の平均手数ですが、棋譜集ごとに値を変えるのも徒に煩雑にするだけなので、定義の上では定数という事で固定しました。この「粘り度」は上で示したように棋力との関係は弱いですが、棋士ごとの平均手数の差の影響については考慮されていません。
「粘り度」の棋士ランキングは、以下の資料に記します。
以上、棋譜集を各棋士ごとに勝ちの棋譜と負けの棋譜に分類して、それぞれの平均手数を算出することにより、棋士の粘りと棋力との関係、並びに「粘り度」をどう定義したらよいのかということを考えました。勝ちの平均手数は棋力と弱い負の相関があり、棋力には相手の粘りを抑える作用がある可能性が考えられます。一方で、負けの平均手数は棋力との関係がとても弱く、そのまま「粘り度」の測定に利用できるだろうということが分かりました。
今回は棋士棋譜集(2015年11月版)に基づいて分析します。この棋譜集の詳細については「棋士の棋譜整理とレート算出:棋士棋譜集(2015年11月版)」をご参照ください。
まず、30手以上200手以下の投了決着の棋譜に限定して、リスト上の各棋士について、勝ちの棋譜と負けの棋譜を区別してそれぞれの平均手数を算出します。ここで手数の範囲を限定するのは外れデータの影響を抑えるためです。勝ちの棋譜については、投了したのは相手の棋士であり、そのタイミングは相手次第でバラバラのはずです。一方で、負けの棋譜については、投了のタイミングに棋士の個性が反映されていると推測できます。
結果として、勝ちの棋譜については各棋士の平均手数の平均は115.0で標準偏差は5.2となり、負けの棋譜については平均は114.4で標準偏差は6.8となりました。平均と標準偏差については解説記事「平均と標準偏差:それって不偏推定値?」をご覧ください。ここで、平均が棋譜全体の手数の平均よりも僅かに下がっているのは手数の範囲を限定しているためです。また、勝ちの棋譜と負けの棋譜の平均が僅かに異なっているのはリスト外の棋士がいるためです。
この結果で注目するべきなのは、標準偏差の違いです。標準偏差の値は負けの棋譜の方が勝ちの棋譜よりも1.6大きく、これは投了のタイミングについての棋士の個性が現れていると考えられます。つまり、投了の個性が平均化されて消えてしまう勝ちの棋譜よりも、反映されている負けの棋譜の方が棋士ごとのばらつきが大きいというわけです。
それでは、平均手数とレートとの間には相関関係はあるのでしょうか?
勝ちの棋譜については、平均手数とレートとの相関係数は-0.445であり、弱い負の相関があるようです。線形回帰を行うと、\[T = -0.0181 R + 142\]となっています。ここで、Tは平均手数、Rはレートです。大雑把に言うと、レートが100上がると、平均手数が2手弱くらい下がるということになります。相関係数と線形回帰については以下の解説記事をご覧ください。
つまり、「強い人は勝つ時はあっさり勝つ」という傾向が見られるということです。この原因としては、「強い人は中終盤の寄せが鋭く、相手に中々粘らせない」というようなことも考えられますし、また、「強い人には“信用”があるために相手が無駄に粘ってこない」というようなことも考えられます。この結果からだけでは、傾向が見られるというだけで、原因を解析することまではできません。
一方で、負けの棋譜については、平均手数とレートとの相関係数は0.109であり、非常に弱い正の相関があるかどうかというところです。勝ちの棋譜と同様に線形回帰を行うと、\[T = 0.00578 R + 106\]となっています。つまり、粘る人の方が強いという傾向が僅かに見えないわけではないですが、勝ちの棋譜の場合と比較すると、相関係数の絶対値も小さく、線形回帰の係数の絶対値も小さいため、関係性としては相対的にとても弱いと考えられます。このデータによると「将棋は粘ればよいというものではない」ということのようです。
さて、上記の結果を踏まえて、棋士の粘り度を見るにはどのような値を計算して比較すればよいのでしょうか?
棋士ごとに時代や得意戦法等の違いによって平均手数が異なるため、負けの棋譜と勝ちの棋譜の平均手数の比を取るというのがまず考えられますが、これだと上で示したようにレートとの相関があるため(実際に相関係数は0.480)、棋力の差が結果に反映してしまいます。線形回帰の結果を用いて補正するというやり方も考えられますが、方法が徒に複雑になりますし、そもそもレートについての信用性にもやや疑問がありますので、あまり優れたやり方とは言えないでしょう。
そこで、個々の平均手数の差には目を瞑って、投了負けの棋譜の平均手数を115で割った値を「粘り度」として定義することにします。ここで、115は全体の平均手数ですが、棋譜集ごとに値を変えるのも徒に煩雑にするだけなので、定義の上では定数という事で固定しました。この「粘り度」は上で示したように棋力との関係は弱いですが、棋士ごとの平均手数の差の影響については考慮されていません。
「粘り度」の棋士ランキングは、以下の資料に記します。
以上、棋譜集を各棋士ごとに勝ちの棋譜と負けの棋譜に分類して、それぞれの平均手数を算出することにより、棋士の粘りと棋力との関係、並びに「粘り度」をどう定義したらよいのかということを考えました。勝ちの平均手数は棋力と弱い負の相関があり、棋力には相手の粘りを抑える作用がある可能性が考えられます。一方で、負けの平均手数は棋力との関係がとても弱く、そのまま「粘り度」の測定に利用できるだろうということが分かりました。
コメント