前回までは、「住人のレートに上限や下限が存在しない」と仮定した場合の議論をしてきました。結果として、イロレーティングの頑強性が明らかになり、システムの安定性が示されることになりました。今回は、これまでスキップしてきた境界に関する問題を考えます。
あらかじめ結論について述べておくと、これまでの記事がイロレーティングの有効性を示唆するものであったのに対して、今回の記事ではイロレーティングの一つの問題点が提示されることになります。それ故、今回の記事の結論について言及する際には、仮定や条件などをよく確認された上で、くれぐれも慎重な取り扱いをお願いします。
さて、前々回の記事「イロレーティングの散歩道 3:ゆらぎのある非理想世界」において導いたように、実力レート\[R_{e}\]のE君が、表示レート\[R_{W}\]の相手に勝つ確率は、\[P_{\lim}(R_{e}, R_{W}) = \int_{R_{\min}}^{R_{\max}} d{R_{w}}~ \rho_{w}(R_{w}; R_{W})~ E(R_{e} - R_{w})\]と表せます。ここで、E(dR)はレート差を引数とするイロレーティングの勝率式であり、\[\rho_{w}(R_{w}; R_{W})\]は、住人の実力レートが\[R_{w}\]の時の表示レートの確率分布です。
イロレーティングの更新式によると、E君の表示レートが\[R_{E}\]の時、一回の対局において動くレートの期待値は、\[Q(R_{e}, R_{E}, R_{W}) = K [ P_{\lim}(R_{e}, R_{W}) ( 1 - E(R_{E}, R_{W}) )\] \[- ( 1 - P_{\lim}(R_{e}, R_{W}) ) E(R_{E}, R_{W}) ]\]となります。この式は、右辺を展開すると、\[Q(R_{e}, R_{E}, R_{W}) = K [ P_{\lim}(R_{e}, R_{W}) - E(R_{E}, R_{W}) ]\]と書き換えられます。
これをさらにE君の表示レート、並びに対局相手の表示レートについて順に期待値をとると、\[M(R_{e}) = \int_{- \infty}^{+ \infty} d{R_{W}}~ \rho_{W}(R_{W})~ \int_{- \infty}^{+ \infty} d{R_{E}}~ \rho_{E}(R_{E})~ Q(R_{e}, R_{E}, R_{W})\]となり、これは平衡状態(無限回のシミュレーションに対応)においては0にならなければなりません。ここで、それぞれの確率分布は総和が1になるように規格化されています。
前回までの記事では、E君の表示レートの確率分布は平均が実力レートの正規分布であると考えてきました。ここでは、平均を実力レートに限定せずに一般化して、平均\[R_{m}\]の正規分布:\[\rho_{E}(R_{E}) = \frac{e^{(R_{E} - R_{m})^{2} / (2 s_{e}^{2})}}{\sqrt{2 \pi}}\]であると考えてみましょう。ここで、分布の標準偏差は自己無頓着条件下では住人の標準偏差と一致し、\[s_{e} = s_{w}\]となります。
この時、上に記したMの平衡条件式は\[M(R_{e}) = K \int_{- \infty}^{+ \infty} d{R_{W}}~ \rho_{W}(R_{W})~ [ P_{\lim}(R_{e}, R_{W}) - P_{\infty}(R_{m}, R_{W}) ] = 0\]と書き換えることができます。
もし、前回までの仮定のように住人のレートに上限や下限が存在しないとするならば、\[P_{\lim}(R_{e}, R_{W}) = P_{\infty}(R_{e}, R_{W})\]となるため、上の平衡条件式は\[R_{m} = R_{e}\]という自明解を持ちます。すなわち、E君の表示レートの平均が実力レートに一致するのならば、対局相手の選び方に依らずに平衡条件式が満たされるというわけです。対局相手の選び方によっては自明解以外の非自明解が存在する可能性もありますが、非自明解はあくまでも非常に特殊な場合に限定されるでしょうから、前回までの記事で平均を実力レートに置いていたことの正当性が確かめられます。
しかしながら、上限や下限が存在する場合には話が変わってきます。この場合には、平衡状態(無限回のシミュレーションに対応)において、E君の表示レートの平均が実力レートからズレてきてしまうのです。このズレは、上の平衡条件式から分かるように、対局相手の表示レートの確率分布(すなわち、対局相手の選び方)に依存しています。
さらに、E君の分布にズレが生じるということは、自己無頓着条件も壊れてしまいます。自己無頓着であるためには、E君の分布がズレるのと同様に住人の分布もズレると考えなくてはなりません。ここでは詳細は記しませんが、この場合、勝率の式にさらなる修正が必要になります。
境界が存在する場合の表示レートの平均と実力レートとの差を以下に示します。黒線がE君の分布のみがズレている場合の結果で、赤線が自己無頓着な場合の結果です。レートの上限は2000、下限は1000としています(黄色線)。今回の場合には、境界があること自体が重要で、その値自体はさほど重要ではありません。一応、境界値を変えた場合の結果も記事の最後に付記しておきます。また、対局相手の選び方は、前回までの記事と同様に、E君の実力レート±Sの範囲内の表示レートから一様ランダムに選んでいます。すなわち、確率分布としては、範囲内では一定で、その他はゼロという分布です。
まずは、E君の分布のみがズレている場合の結果(黒線)に注目しましょう。これは、上で記した平衡条件式をそのまま解いた結果ということになります。
グラフの黒線は、境界の真ん中(1500)において正負を反転させた対称形になっており、上半分では表示レートの平均が過大となる方向にズレて、下半分では逆方向にズレています。この対称性のため、ズレの総和は境界の値に関係なく0となり、このことは、イロレーティングにおいて全てのレートの総和が変わらないということと整合しています。また、E君の実力レートが境界から十分に(Sと標準偏差の和程度)離れていれば、ズレは小さくなり、その時の結果は前回までの結果をよく再現していると言えます。
このズレの原因は、境界付近の表示レートにおける過大・過小レート者の偏りにあります。もし、境界がなければ、ある表示レートの対局相手の中には過大レート者と過小レート者が偏りなく混在しています。しかしながら、例えば、上限より上の表示レートの対局者を考えると全てが過大レート者となっており、そこには過小レート者は存在しません。このように、境界付近では、揺らぎによって実力レートより上に上がってきて過大になる人と下がってきて過小になる人との数のバランスが崩れているわけです。結果的に、上限付近の表示レートの相手を選んで戦えば、過大レート者との対局が増えるので、自らのレートも過大となり、下限付近では逆に過小レート者との対局が増えるので、自らのレートも過小となってしまいます。
この傾向は、自己無頓着な結果(赤線)において、より顕著になります。特に、黒線では境界付近に留まっていたズレが、赤線では全体に波及しています。これは、ズレによって過大・過小レート者の偏りが増幅されるからです。
この計算では特に突飛な仮定をしているわけではありません。E君や住人は自らのレートに近い者からランダムに選んで対局をしているだけです。しかし、その結果として、過大・過小レート者に偏って対局していることになり、表示レートの平均と実力レートとがズレてしまうのです。分かりやすい極端な例を考えると、例えば、E君の実力レートが上限+100だとして、自らの実力レート±100の表示レートから無作為に対局相手を選ぶことにすると、その領域の実力を持つ者はいないので、ゆらぎによって過大レートになった者を狙い打ちにしているのと同じことになってしまうというわけです。
これを是正するために、対局者の選択のレート幅を広げるということも考えられますが、上図を見てもらえれば分かる通り、Sを400まで広げても是正するどころか、もっと悪化してしまいます。ただし、Sを400まで広げると、実力レートが境界付近の時には、本来はほとんど存在しない極端な過大・過小レート者を相手にしているという計算になっているため、仮定が不自然になっており、その辺りではやや過剰な数値が出ていると考えるべきでしょう。
以上の結果から、イロレーティングには上位者の表示レートを過大にし、下位者の表示レートを過小にする性質があると言えます。そのズレは境界に近いほど大きく、最大で100程度のようです。
今回の解析に直接的に関係あるかは分かりませんが、このような現象はネット将棋の界隈でも議論されており、レートの部分的な“インフレ”等と呼ばれているようです。ただ、私の個人的な言語感覚では、“インフレ”という言葉は、全体の平均の上昇を表すの相応しいという感じがしており、「レート平均の数値的な上昇」、もしくは「参加者全体の平均的な棋力の減少」に限定して使うのがよいのかなと思っております。なので、今回のように「ゼロサムで上位者が下位者のレートを吸い上げている」というような現象に対しては、“搾取”という言葉(マルクス主義経済学に由来するカビの生えた用語ですが)が相応しいのではないかと考え、副題に用いました。
さて、このシリーズでは、イロレーティングの詳細な性質について、様々な解析を行ってきました。まだ取り上げていない課題は多々ありますが、本シリーズはここでいったん締めたいと思います。
最後の記事でシリーズ全体をまとめます。
- 次の記事:「イロレーティングの散歩道 6:まとめ」
- インデックス:「イロレーティングの散歩道 1:序論と目次」
-----------------------------
レートの上限3000、下限0とした場合の結果:
コメント
コメント一覧 (2)
楽しんでいただけたのなら、何よりです。