将棋の強さや力量(棋力と言う)というのは客観的、定量的にどのように決定したらいいのでしょうか? これを棋力のレーティング(評価、格付け)の問題と言います。レーティングの手法には様々なものが提案されていますが、ここでは物理学者であるアルパド・イロ教授が考案したイロレーティングについて解説します。この手法は、最もシンプルな方法であり、また、コンピュータ将棋対局場floodgateでも活用され、国際チェス連盟(FIDE)の公式レーティングにも採用され、将棋倶楽部24等でも簡易版が用いられている等、最も普及している方法でもあります。コンピュータ将棋でレーティングやレートという場合には通常、イロレーティングのことを意味しており、欠かすことのできない重要な概念になっています。

最初は一般論としてどのように将棋の強さを測ったらいいのかを考えてみましょう。

AとBが非常に多くの対局を行ってAが勝率0.7(70%)だったとします。この時、AはBよりも強いということが推測されます。しかし、本当にAはBよりも強いのでしょうか? 単に相性がよかっただけで、例えば、Cとの三者の間でじゃんけんの関係になっているのかもしれません。ここで「相性」は棋力とは全く無関係に存在しているものとします。

この「相性」の問題はBを個人から多数の同等の棋力を持つ個人からなる集団に置き換えると解決できます。「そんな集団どうやって用意するの?」という話ですが、これはあくまでも理論上の話なので、例えばパラレルワールドから召還してくるとしましょう。また、多数の集団を作る際には集団間の相性もないように配慮することとします。Aが均質な棋力持つ集団Bに対して無数に対局して勝ち越せば、仮にBの中に相性の悪い人がいて一部に負け越していたとしても、AはBの中の誰よりも強いということができます。同様にCもDも全て集団化していくと、個々の相性の問題を抜きにして、勝率から強さを測ることが可能になります。以下では、そのような架空の集団の概念を暗黙に導入することで、相性の問題を抜きにして話を進めていきます。

さて、AがBに対して勝率\[E_{AB}\]であり、BがCに対して勝率\[E_{BC}\]である時、Cに対するAの勝率\[E_{AC}\]はどうなるでしょうか? 相性の問題はもうないので、この問題は何らかの関係性によって一意に答えが決まるはずです。後で説明しますが、この関係性さえ分かれば、そこから敷衍して棋力の尺度を決めることができます。

この問題は以下のように書き換えることができます:「\[F(E_{AC}) = F(E_{AB}) \cdot F(E_{BC})\]となる正の単調増加関数F(E)を求めよ」。ここで式中の中点は、交換則と結合則を満たせばいいのですが、ただの掛け算とします。勝率の定義から\[E_{AA} = \frac{1}{2}~~,~~~ E_{BA} = 1 - E_{AB}\]です。BとCをそれぞれAに置き換えると\[F(1 / 2) =F(1 / 2) \cdot F(1 / 2) = 1\]となり、CのみをAに置き換えると\[F(E_{AB}) \cdot F(E_{BA}) = 1\]となります。これは\[F(E_{AB}) = \frac{f(E_{AB})}{f(E_{BA})}\]とおけば自動的に満たされます。F(E)は単調増加関数なので値が分かれば、対応するEを一意に求めることができます。ここでは\[F(E_{AB})\]のことをBに対するAの「一般化オッズ」と呼ぶことにします。

交換則と結合則を満たせばいいのならば、掛け算でなくても足し算でもいいのではないかということになりますが、これは両辺の対数を取ると実現できます。\[G(E) = \log[F(E)]\]とすると、\[G(E_{AC}) = G(E_{AB}) + G(E_{BC})\]の形に書き直せるわけです。ここでは、\[G(E_{AB})\]のことをBに対するAの「一般化レート」と呼ぶことにします。

ここまでくると察しのいい読者の方はもう気付かれたと思いますが、これらの「一般化オッズ」や「一般化レート」は棋力の尺度に利用することができます。「Bに対する」の部分のBを平均的な選手に置き換えて省略すると、Aの「一般化オッズ」や「一般化レート」になります。後は値の原点と数字の単位(スケール)を定めればいいだけです。特に「一般化レート」は、差の値が意味を持つため、間隔尺度になります。つまり、上記の数学的な記述は強さの順序尺度を勝率間の関係式によって間隔尺度に直す作業だったわけです。イロレーティングでは、レートの原点を1500とし、スケールはレートが200違う時に勝率が約75%になるように調整します。これらは慣習的な決まりで、特に数学的に意味がある数字ではありません。

残る問題はF(E)やG(E)の関数形を決定することですが、これは数学的に普遍的に決まるものではなく、ゲームや選手の性質によって決まるものです。ですので、統計データから慎重に推定するというのが最も真面目なやり方でしょう。これは十分な量の棋譜があって、統計の専門家(※筆者は違います)が分析すれば、そんなに難しいことではないと思います。一度、floodgateの棋譜でデモンストレーションしてみても面白いかもしれません。筆者はこの辺の研究に詳しくないので、どの程度の先行研究があるのかは知りません。機会があれば、その辺も調べてご紹介できればと思います。

さて、ここで物理学者のイロ教授は、統計学的な推定に頼ることなく、一つの大胆でシンプルな仮説を導入しました。多少の粗らがあってもシンプルな方が実用的で普遍的であるというのは、よくあることです。そして、そういうモデル化は物理学者が最も得意とするところなのです。

(以下の記事に続く)