以前のコラム記事「棋士の粘りと棋力:強い人は粘らせない?」では、各棋士ごとに平均手数を算出してレートとの相関関係を解析し、棋力には相手の粘りを抑える作用があるかもしれないという可能性を示しました。今回の記事では、さらに踏み込んで、棋士の棋譜におけるレート差と手数との間の相関関係を解析します。もしも両者に強い相関があるのであれば、平均手数から棋力を推測するなんてこともできるようになるかもしれません。
今回の解析で用いるのは、棋士棋譜集(2015年11月版)です。この棋譜集の詳細については「棋士の棋譜整理とレート算出:棋士棋譜集(2015年11月版)」をご参照ください。
まずは直接的にレート差と手数との間の相関係数と線形回帰の計算をしてみましょう。外れデータを弾くため、30手以上200手以下の投了決着の棋譜に限定し、さらに、レート値が必要であるため、両対局者共にリストにある棋譜に限定して解析を行います。レート差については、勝者のレートから敗者のレートを引いた差を用います。相関係数と線形回帰については以下の解説記事をご覧ください。
結果として、相関係数は-0.1114となり、回帰直線は\[T = -0.02403 dR + 115.8\]となりました。ここで、Tは手数、dRはレート差です。相関係数の絶対値は大きくはないですが、サンプル数が47021であることを考えると、相関がないとは言えません。勝者と敗者のレート差についての負の相関ですので、「強い方が勝つ時は手数が短い」「弱い方が勝つ時は手数が長い」という直感に合致した結果になっています。レート差100ごとに手数が2手強くらい変わるというのは、以前のコラム記事の結果ともおおよそ整合しています。
もう少し詳細に見るために、レート差を0を原点にして10刻みの区間に区切って、その中で手数とレート差のそれぞれ平均を取るという“疎視化”を行ってみることにします。こうすることで、雑音的な細かな情報が平均化されて消えて、本質的なことが見やすくなります。ここで注意してほしいのは、レート差の区間の刻みを10としたこと(つまり疎視化のやり方)には人為性があり、この値を変えると以下の結果の詳細が変わってくるということです。ただし、詳細にこだわらなければ、大まかな結果としては変わりません。
疎視化された平均手数と平均レート差(黒点)を下図に示します。
図を見るとレート差があまり大きくない範囲では強い負の線形相関が見られます。実際にレート差が-200以上200以下の範囲で線形回帰を行ってみると、相関係数は-0.9434となり、回帰直線(青線)は\[T = -0.02604 dR + 115.8\]となります。レート差100に対して手数が2.5手程度というのは疎視化前の結果とおおよそ一致しています。
レート差が200以上の領域では、平均化の時のデータ数が減るためにばらつきが大きくなっていますが(ただし、表示しているのはデータ数が10以上のもののみ)、回帰直線(青線)の外挿でも当てはまりはそんなに悪くはなさそうです。この図から「強い方が勝つ時はレート差分だけ手数が短い」という傾向が見て取れます。
一方で、レート差が-200以下の領域については、少し事情が異なっています。この領域は「レート差が離れた弱者が勝つ」という「番狂わせ」の領域であり、データ数も少なく、ばらつきは大きいのですが、それに加えて回帰直線(青線)の外挿よりも全体的に手数が下がっており、単純に「弱い方が勝つ時はレート差分だけ手数が長い」とは言えなくなっています。もしかすると「番狂わせ」の対局は、強者側の大ポカ等、通常の対局とはやや異なるメカニズムで決着していることが多いのかもしれません。
以上まとめると、レート差が-200以下の「番狂わせ」の領域を除くと、レート差と手数との間には負の相関があることが分かりました。大雑把に言うと、レート差100ごとに平均手数は2.5手くらい変わってくるようです。自分より少し強い人と対局すると、負ける時はあっさり負けるのに、勝つ時には粘られて中々勝てないというのは我々もしばしば体験することでありますが、棋士の棋譜にもそういう傾向が見られるというのは興味深いですね。
コメント