コンピュータ将棋基礎情報研究所

コンピュータ将棋に関する基礎的な情報を収集し、分析し、発表する所です。英語名称はLaboratory for Fundamental Information on Computer Shogi (LFICS)。

カテゴリ: 論稿

このシリーズでは、擬似乱数を用いたシミュレーション計算により、イロレーティングの詳細な性質を調べました。

イロレーティングの散歩道 2:理想世界の散策」では、実力レートと表示レートが一致している理想世界を散策し、軌跡の頻度分布がほぼ正規分布(中心極限定理)となること、また、その標準偏差がおおよそKの平方根に比例し、K = 16の時には37.5程度、K = 32の時には53.5程度になることを示しました。

イロレーティングの散歩道 3:ゆらぎのある非理想世界」では、表示レートにゆらぎのある非理想世界を散策し、ゆらぎが大きくなると軌跡の標準偏差が僅かに増加すること、また、イロレーティングがゆらぎに対して頑強であることを示しました。

イロレーティングの散歩道 4:自己無撞着な世界と安定性」では、散策者の動きと住人のゆらぎとの間に矛盾が生じない自己無撞着条件を考え、システムの安定性を確認し、また、自己無撞着条件下における標準偏差の値が理想世界のものとあまり変わらないことを示しました。

イロレーティングの散歩道 5:境界による“搾取”の問題」では、世界の住人のレートに上限や下限の境界のある場合を考え、境界には「上位者の表示レートを過大にし、下位者の表示レートを過小にする」という性質があること、また、そのズレは境界に近いほど大きく、最大で100程度になることを示しました。

今回のシリーズは、ここで終わりとなりますが、また機会がありましたら、続編を書くことがあるかもしれません。

前回までは、「住人のレートに上限や下限が存在しない」と仮定した場合の議論をしてきました。結果として、イロレーティングの頑強性が明らかになり、システムの安定性が示されることになりました。今回は、これまでスキップしてきた境界に関する問題を考えます。

あらかじめ結論について述べておくと、これまでの記事がイロレーティングの有効性を示唆するものであったのに対して、今回の記事ではイロレーティングの一つの問題点が提示されることになります。それ故、今回の記事の結論について言及する際には、仮定や条件などをよく確認された上で、くれぐれも慎重な取り扱いをお願いします。

さて、前々回の記事「イロレーティングの散歩道 3:ゆらぎのある非理想世界」において導いたように、実力レート\[R_{e}\]のE君が、表示レート\[R_{W}\]の相手に勝つ確率は、\[P_{\lim}(R_{e}, R_{W}) = \int_{R_{\min}}^{R_{\max}} d{R_{w}}~ \rho_{w}(R_{w}; R_{W})~ E(R_{e} - R_{w})\]と表せます。ここで、E(dR)はレート差を引数とするイロレーティングの勝率式であり、\[\rho_{w}(R_{w}; R_{W})\]は、住人の実力レートが\[R_{w}\]の時の表示レートの確率分布です。

イロレーティングの更新式によると、E君の表示レートが\[R_{E}\]の時、一回の対局において動くレートの期待値は、\[Q(R_{e}, R_{E}, R_{W}) = K [ P_{\lim}(R_{e}, R_{W}) ( 1 - E(R_{E}, R_{W}) )\] \[- ( 1 - P_{\lim}(R_{e}, R_{W}) ) E(R_{E}, R_{W}) ]\]となります。この式は、右辺を展開すると、\[Q(R_{e}, R_{E}, R_{W}) = K [ P_{\lim}(R_{e}, R_{W}) - E(R_{E}, R_{W}) ]\]と書き換えられます。

これをさらにE君の表示レート、並びに対局相手の表示レートについて順に期待値をとると、\[M(R_{e}) = \int_{- \infty}^{+ \infty} d{R_{W}}~ \rho_{W}(R_{W})~ \int_{- \infty}^{+ \infty} d{R_{E}}~ \rho_{E}(R_{E})~ Q(R_{e}, R_{E}, R_{W})\]となり、これは平衡状態(無限回のシミュレーションに対応)においては0にならなければなりません。ここで、それぞれの確率分布は総和が1になるように規格化されています。

前回までの記事では、E君の表示レートの確率分布は平均が実力レートの正規分布であると考えてきました。ここでは、平均を実力レートに限定せずに一般化して、平均\[R_{m}\]の正規分布:\[\rho_{E}(R_{E}) = \frac{e^{(R_{E} - R_{m})^{2} / (2 s_{e}^{2})}}{\sqrt{2 \pi}}\]であると考えてみましょう。ここで、分布の標準偏差は自己無頓着条件下では住人の標準偏差と一致し、\[s_{e} = s_{w}\]となります。

この時、上に記したMの平衡条件式は\[M(R_{e}) = K \int_{- \infty}^{+ \infty} d{R_{W}}~ \rho_{W}(R_{W})~ [ P_{\lim}(R_{e}, R_{W}) - P_{\infty}(R_{m}, R_{W}) ] = 0\]と書き換えることができます。

もし、前回までの仮定のように住人のレートに上限や下限が存在しないとするならば、\[P_{\lim}(R_{e}, R_{W}) = P_{\infty}(R_{e}, R_{W})\]となるため、上の平衡条件式は\[R_{m} = R_{e}\]という自明解を持ちます。すなわち、E君の表示レートの平均が実力レートに一致するのならば、対局相手の選び方に依らずに平衡条件式が満たされるというわけです。対局相手の選び方によっては自明解以外の非自明解が存在する可能性もありますが、非自明解はあくまでも非常に特殊な場合に限定されるでしょうから、前回までの記事で平均を実力レートに置いていたことの正当性が確かめられます。

しかしながら、上限や下限が存在する場合には話が変わってきます。この場合には、平衡状態(無限回のシミュレーションに対応)において、E君の表示レートの平均が実力レートからズレてきてしまうのです。このズレは、上の平衡条件式から分かるように、対局相手の表示レートの確率分布(すなわち、対局相手の選び方)に依存しています。

さらに、E君の分布にズレが生じるということは、自己無頓着条件も壊れてしまいます。自己無頓着であるためには、E君の分布がズレるのと同様に住人の分布もズレると考えなくてはなりません。ここでは詳細は記しませんが、この場合、勝率の式にさらなる修正が必要になります。

境界が存在する場合の表示レートの平均と実力レートとの差を以下に示します。黒線がE君の分布のみがズレている場合の結果で、赤線が自己無頓着な場合の結果です。レートの上限は2000、下限は1000としています(黄色線)。今回の場合には、境界があること自体が重要で、その値自体はさほど重要ではありません。一応、境界値を変えた場合の結果も記事の最後に付記しておきます。また、対局相手の選び方は、前回までの記事と同様に、E君の実力レート±Sの範囲内の表示レートから一様ランダムに選んでいます。すなわち、確率分布としては、範囲内では一定で、その他はゼロという分布です。

r_e-dr_2000-1000

まずは、E君の分布のみがズレている場合の結果(黒線)に注目しましょう。これは、上で記した平衡条件式をそのまま解いた結果ということになります。

グラフの黒線は、境界の真ん中(1500)において正負を反転させた対称形になっており、上半分では表示レートの平均が過大となる方向にズレて、下半分では逆方向にズレています。この対称性のため、ズレの総和は境界の値に関係なく0となり、このことは、イロレーティングにおいて全てのレートの総和が変わらないということと整合しています。また、E君の実力レートが境界から十分に(Sと標準偏差の和程度)離れていれば、ズレは小さくなり、その時の結果は前回までの結果をよく再現していると言えます。

このズレの原因は、境界付近の表示レートにおける過大・過小レート者の偏りにあります。もし、境界がなければ、ある表示レートの対局相手の中には過大レート者と過小レート者が偏りなく混在しています。しかしながら、例えば、上限より上の表示レートの対局者を考えると全てが過大レート者となっており、そこには過小レート者は存在しません。このように、境界付近では、揺らぎによって実力レートより上に上がってきて過大になる人と下がってきて過小になる人との数のバランスが崩れているわけです。結果的に、上限付近の表示レートの相手を選んで戦えば、過大レート者との対局が増えるので、自らのレートも過大となり、下限付近では逆に過小レート者との対局が増えるので、自らのレートも過小となってしまいます。

この傾向は、自己無頓着な結果(赤線)において、より顕著になります。特に、黒線では境界付近に留まっていたズレが、赤線では全体に波及しています。これは、ズレによって過大・過小レート者の偏りが増幅されるからです。

この計算では特に突飛な仮定をしているわけではありません。E君や住人は自らのレートに近い者からランダムに選んで対局をしているだけです。しかし、その結果として、過大・過小レート者に偏って対局していることになり、表示レートの平均と実力レートとがズレてしまうのです。分かりやすい極端な例を考えると、例えば、E君の実力レートが上限+100だとして、自らの実力レート±100の表示レートから無作為に対局相手を選ぶことにすると、その領域の実力を持つ者はいないので、ゆらぎによって過大レートになった者を狙い打ちにしているのと同じことになってしまうというわけです。

これを是正するために、対局者の選択のレート幅を広げるということも考えられますが、上図を見てもらえれば分かる通り、Sを400まで広げても是正するどころか、もっと悪化してしまいます。ただし、Sを400まで広げると、実力レートが境界付近の時には、本来はほとんど存在しない極端な過大・過小レート者を相手にしているという計算になっているため、仮定が不自然になっており、その辺りではやや過剰な数値が出ていると考えるべきでしょう。

以上の結果から、イロレーティングには上位者の表示レートを過大にし、下位者の表示レートを過小にする性質があると言えます。そのズレは境界に近いほど大きく、最大で100程度のようです。

今回の解析に直接的に関係あるかは分かりませんが、このような現象はネット将棋の界隈でも議論されており、レートの部分的な“インフレ”等と呼ばれているようです。ただ、私の個人的な言語感覚では、“インフレ”という言葉は、全体の平均の上昇を表すの相応しいという感じがしており、「レート平均の数値的な上昇」、もしくは「参加者全体の平均的な棋力の減少」に限定して使うのがよいのかなと思っております。なので、今回のように「ゼロサムで上位者が下位者のレートを吸い上げている」というような現象に対しては、“搾取”という言葉(マルクス主義経済学に由来するカビの生えた用語ですが)が相応しいのではないかと考え、副題に用いました。

さて、このシリーズでは、イロレーティングの詳細な性質について、様々な解析を行ってきました。まだ取り上げていない課題は多々ありますが、本シリーズはここでいったん締めたいと思います。

最後の記事でシリーズ全体をまとめます。

-----------------------------

レートの上限3000、下限0とした場合の結果:

r_e-dr_3000-0

前回の記事「イロレーティングの散歩道 3:ゆらぎのある非理想世界」では「表示レートにゆらぎのある非理想世界」を考え、E君を外部の世界から召還して、E君の軌跡の標準偏差とゆらぎの標準偏差との関係を明らかにしました。

しかしながら、わざわざE君を外部から召還する必要はあったのでしょうか? 理想世界の場合には、実力レートと表示レートが異なる部外者がいないとそもそも話にならないため、E君の召還は必須でした。しかし、非理想世界の場合には、元から実力レートと表示レートが異なっているため、部外者に限らず、内部の任意の住人にE君という名前を付けても、同様のシミュレーションができ、同様の結果が得られるはずです。

「別にE君が外部の人でも内部の人でもどっちでもいいだろ」と思われるかもしれませんが、もしE君が内部の住人である場合には一つ大きな制約が発生します。それは、「E君の揺らぎ」と「住人の揺らぎ」とが一致しなければならないということです。前回の記事の記法で書けば、\[s_{e} = s_{w}\]でなければならないということであり、もし一致しなければ、「E君が内部の住人である」という仮定との間に矛盾が生じてしまうことになります。

このような矛盾がない世界を自己無撞着(セルフ・コンシステント)な世界と言います。自己無撞着な世界においては揺らぎの標準偏差と軌跡の標準偏差とは一致しており、その条件から標準偏差の値も定まります。揺らぎの標準偏差を手で与えなくてもいいという点において、この世界は自律的だと言えます。また、イロレーティングの機構に由来する揺らぎを矛盾なく取り込んでいることから、最初に考えた理想世界と比べて、かなり現実に近い世界になっていると考えることができるでしょう。

実際に、前回の結果から、自己無撞着な世界における標準偏差を求めてみましょう。

scw_s-d

上の図は前回のものと同じですが、自己無撞着条件:\[s_{e} = s_{w}\]を表す直線(緑線)が書き加えられています。計算結果が回帰直線でよく近似されていると考えると、回帰直線と緑線との交点が自己無撞着な世界における標準偏差ということになります。例えば、S = 100、K = 16の時には、\[s_{e} = s_{w} = 0.0005132 s_{w} + 37.68\]ですので、求める標準偏差は37.70になります。同様に、S = 100、K = 32の時は53.90となり、S = 400、K = 16の時は37.64となり、S = 400、K = 32の時は53.69となります。

前回の記事で「これ以上の先を示しても、あまり意味がない」と書いたのは、この自己無撞着条件のことがあったからです。

さて、ここでは首尾よく交点が求まったわけですが、もしもイロレーティングが揺らぎに対して頑強ではなく、関係が非線形的に大きく変化するというような場合には、交点を持たないという状況も考えられます。そのような状況では、「自己無撞着条件を満たす解が存在しない」という事になるため、自己無撞着な世界は安定的に存在できずに崩壊してしまいます。そして、「自己無撞着な世界が崩壊する」ということは、「これまでの暗黙の仮定が成立しなくなる」ということを意味しており、「システムが想定通りに機能しない」ということを示しています。このため、安定性は非常に重要であり、システムには安定性を確保するための頑強性が必要になるわけです。その点で、今回の結果を見る限りでは、イロレーティングは非常によくできたシステムであると言うことができます。

記事の最後に少しネタばらしをしておくと、実は、前々回から今回までの一連の手法は、理論物理学で物質を研究する際の常套手段の一つであり、言わば、将棋における手筋のようなものなのです。特に、システムの安定性の部分は物理学的にもとても重要であり、不安定性は、例えば、固体が液体になったり、磁石の磁力がなくなったりするような物質の様相の変化(相転移)と深く関係しています。また、最初にE君を部外者として導入した手法は、物理学では摂動的方法と呼ばれ、最も基本的な研究手法に当たります。こうしたステップを踏まずに、いきなり複雑なシミュレーションを組んで計算したらこうなりましたというような流儀もあり、そちらの方が効果的であるという状況もあるのですが(結果だけが大事な場合や系が複雑すぎて単純化が機能しない場合など)、やはり物事を深く理解しようという場合には、時間をかけて、段階的に多角的に掘り下げていくという流儀が基本になるのではないかと筆者は考えております。

以上、今回は自己無撞着な世界を考えて、安定性を確認し、矛盾が生じないような標準偏差の値を計算しました。結果的に、イロレーティングの頑強性により、自己無撞着な世界の標準偏差の値は理想世界のものとあまり変わらないということが分かりました。

次回は、これまでスキップしてきた境界の問題について考えます。

前回の記事「イロレーティングの散歩道 2:理想世界の散策」では「実力レートと表示レートが一致している理想世界」を考えました。今回は「表示レートにゆらぎのある非理想世界」を考えます。

非理想世界では、住人の表示レートは実力レートの周りを揺らいでいます。中心極限定理が成立していると仮定すると、その確率分布は実力レートを平均とする正規分布になります。以下では、確率分布が正規分布となっている非理想世界を考えましょう。

この世界では、表示レートと実力レートが異なるため、表示レートで選出した対局相手に対する勝率も理想世界のものとは異なってきます。実際に、表示レートは一緒でも、その中には様々な実力レートの住人が混じっているため、勝率を求めるには確率分布を用いて期待値を計算しなければなりません。

具体的に数式で表すと、実力レート\[R_{e}\]のE君が、表示レート\[R_{W}\]の相手に勝つ確率は、\[P_{\lim}(R_{e}, R_{W}) = \int_{R_{\min}}^{R_{\max}} d{R_{w}}~ \rho_{w}(R_{w}; R_{W})~ E(R_{e} - R_{w})\]となります。ここで、\[E(dR) = \frac{1}{1 + 10^{- dR / 400}}\]は、前回の記事でも用いたイロレーティングの勝率式であり、\[\rho_{w}(R_{w}; R_{W}) = N e^{- (R_{w} - R_{W})^{2} / (2 s_{w}^{2})}\]は、住人の実力レートが\[R_{w}\]の時の表示レートの確率分布(正規分布)です。下付き添え字が小文字の時は実力レート、大文字の時は表示レートという記法にしています。下式中の\[s_{w}\]は標準偏差に対応する定数であり、また、係数Nは規格化条件:\[\int_{R_{\min}}^{R_{\max}} d{R_{w}}~ \rho_{w}(R_{w}; R_{W}) = 1\]によって決定されます。

ここで、式中の積分の上限と下限は、世界の住人の実力レートの上限と下限の境界を意味しているわけですが、とりあえず今回はスキップして、\[R_{\min} \to - \infty,~ R_{\max} \to + \infty\]としておいて、境界の問題については後の記事で改めて取り扱うことにします。

この場合の勝率を\[P_{\lim}(R_{e}, R_{W}) = P_{\infty}(R_{e}, R_{W})\]と書くとすると、\[P_{\infty}(R_{e}, R_{W}) = \int_{- \infty}^{+ \infty} \frac{d{z}}{\sqrt{2 \pi}} \frac{e^{- z^{2} / 2}}{1 + 10^{(s_{w} z - R_{e} + R_{W}) / 400}}\]となり、この関数はレート差\[R_{e} - R_{W}\]のみに依存します。ここで、\[z = \frac{R_{w} - R_{W}}{s_{w}}\]という積分変数の変換を行いました。

また、\[s_{w} \to 0\]の極限を取ると、確率分布はディラックのデルタ関数となるため、\[P_{\lim}(R_{e}, R_{W}) \to E(R_{e} - R_{W})\]となります。つまり、揺らぎが小さい極限では、数式上においても理想世界に戻るということです。

勝率\[P_{\infty}(R_{e}, R_{W})\]を下図にプロットします。黒線は理想世界の極限で、赤線が\[s_{w} = 100\]の場合です。

elo_syouritu

前回の記事を思い起こしてもらうと、標準偏差が100というのは結構大きな揺らぎであるわけですが、黒線と赤線との差はそんなに大きくありません。言い換えると、イロレーティングの勝率の式は揺らぎに対して、かなり頑強(ロバスト)であるということが分かります。これはシステムにとって非常に重要なことであり、揺らぎに対して大きく結果が変わってきてしまうようでは、システムを安定的に運用していくことはできません。

また、基本的な傾向として、揺らぎが大きいほど、勝率はレート差に依らずに5割の方向に近づいていく傾向があることが分かります(黒線と赤線の違い)。実際に、ここでは具体的に表示はしませんが、揺らぎの標準偏差\[s_{w}\]が大きくなるほど、勝率の線は5割に近づき、平らになっていきます。

このような傾向は一般化することができ、一般的に揺らぎやノイズが大きくなるほど、勝率は5割の方向に近づいていくという傾向があります。その極端な例が「レート差に依存せずに全て勝率5割」という“デタラメ”世界です。このような“デタラメ”世界では、イロレーティングはランダムウォーク(酔歩)となり、E君の軌跡の標準偏差は対局数の平方根に比例して、対局数が増えると発散してしまいます。今回の場合には、どんなに揺らぎを大きくしても、「勝率はレート差に対して単調増加関数である」ということが数学的に保障されているため、完全にランダムウォークになることはありませんが、揺らぎを大きくすると近似的にそれに近づいていく(すなわち、E君の軌跡の標準偏差が増加する)だろうということは予測できます。

さて、前回と同様に、この世界にE君を召還して対局してもらいましょう。シミュレーションのやり方は基本的に前回と同じで、勝敗判定時の勝率の計算式が上記のものに変わっただけです。対局数も前回と同様に1億です。

結果的に、軌跡の頻度分布がほぼ正規分布となるところは前回と同じになりますが、分布の標準偏差の値が変わってきます。揺らぎの標準偏差を変えた時の分布の標準偏差の変化を下図にプロットしました。また、線形回帰を行い、それぞれの回帰直線を記しました。線形回帰については「データから線を引く 2:線形回帰と最小二乗法」の解説記事をご覧ください。

niw_s-d

回帰直線の傾きが全て正であることから、「揺らぎが大きくなると軌跡の標準偏差が増加する」という上述の予測が正しいことが確認できます。また、傾きの値がとても小さいことから、イロレーティングが頑強であることも同時に確認できます。さらに、それぞれの回帰直線を比較すると、傾きのK依存性は小さいようですが、Sに対しては正の相関がありそうです。この傾きのS依存性は、上で示した勝率の図に見られるように、レート差の絶対値が大きい方が揺らぎによる勝率のずれが大きくなっているためと考えられます。

この図では横軸が65までを表示していますが、さらに先はどうなっているのかと思われる方もいるかもしれません。しかし、実はこれ以上の先を示しても、あまり意味がないのです。このことは次回の記事で論じましょう。

以上、今回は「表示レートにゆらぎのある非理想世界」を考えました。結果として、揺らぎが大きくなると軌跡の標準偏差が僅かに増加するということが明らかになり、また、イロレーティングが揺らぎに対して頑強であるということも分かりました。

次回は、今回は所与の定数としていた「揺らぎの標準偏差」について、改めて考えてみたいと思います。

このシリーズでは、擬似乱数を用いたシミュレーション計算により、イロレーティングの詳細な性質を解析していきます。ここで、擬似乱数というのは「コンピュータ上で生成される擬似的な乱数」のことであり、厳密には乱数ではないものの実用上は乱数として取り扱うことができる数列のことです。擬似乱数には様々なものがありますが、ここではRKISSを使います。

一般的に、乱数を用いた計算手法のことを、カジノで有名なモナコ公国の地区名にちなんで、モンテカルロ法と言います。モンテカルロ法は物理学や工学等の分野で盛んに使われている手法であり、モンテカルロ積分、確率過程の計算、アニーリング最適化など、様々な用途のものがあります。本シリーズで用いるのは、各対局を勝率による確率過程とした時のシミュレーション計算です。

今回は、まず手始めとして、最も理想的な世界を考えてみましょう。すなわち、全ての勝率はイロレーティングの式:\[E(dR) = \frac{1}{1 + 10^{- dR / 400}}\]からレート差dRのみで決まっており、さらにレートの情報がみんなに正確に共有されている「“実力”レート=“表示”レート」という世界です。

ある人(イロ教授にちなんでE君としましょう)がこの世界にやってきて、多数の対局を行ったとします。E君は外から来た人なので、例外的に実力レートと表示レートが異なっていてもかまいません。この時、E君の表示レートの動きはどうなるでしょうか? 表示レートはイロレーティングによって決定されますので、その動きを観測すれば、イロレーティングの性質をうかがい知ることができるかもしれません。

このように「一人のテスト者の動きを観察することによって世界全体の仕組みを考察する」という手法は理論物理学などでよく用いられます。例えば、物質の中の一つの粒子の運動を微視的な物理法則に従って理論的にシミュレートすることで、その物質の性質を分析できるといったような具合です。

今回の場合には、実力レートから勝率を算出して、擬似乱数によって勝敗をシミュレートしていくわけですが、その前に一つだけ、対局相手をどのように選ぶのかという規則を決めなければなりません。今回は「E君の実力レート±S」の範囲内の表示レート(理想世界では実力レートに等しい)からランダムに選ぶことにします。範囲を定めるSの値は100と400の2パターンで計算して比較してみましょう。

E君の実力レートについては、対局相手に困らないのであれば、どの値であっても同じ結果が得られます。なので、ここでは仮に1500としておきます。ただし、今回の対局相手の選び方では、E君のレートが世界の上限や下限の境界に近い場合に相手がうまく選べないという問題が発生してしまいます。この境界にまつわる問題に関しては、ここではスキップして、後で非理想世界を考える時に改めて取り扱うことにします。

イロレーティングのシステムでは、表示レート\[R_{W}\]の対局相手に対して表示レート\[R_{E}\]のE君が勝つと、\[K~ E(R_{W} - R_{E})\]だけE君の表示レートが上がり、負けると、\[K~ E(R_{E} - R_{W})\]だけ下がることになります。このルールに従って、多数の対局をシミュレートして、E君の表示レートの動きを観測します。

まずは、軌跡の頻度分布を下図に示します。頻度の分類のやり方は、各対局終了時の表示レートの小数部を四捨五入することで整数値として分類しています。対局数は1億、Kの値は16であり、頻度分布の規格化(すなわち、縦軸のスケール)は任意です。

iw_hindo_r-h

上図の頻度分布は、Sが100の場合、400の場合共に、誤差の範囲内でほぼ正規分布になっています(2次と4次のモーメントの関係性から確認)。誤差を除けば、分布の形は対局数には依りません。標準偏差は、S = 100の時は約37.7、S = 400の時は約37.5です。標準偏差に僅かな違いはありますが、大雑把に言えば、Sに依らずに大体同じ分布になると考えることができるでしょう。そもそも理想世界を考えている時点で大雑把なモデルなので、ここではあまり細かなことにこだわっても益はありません。

次に、分布の標準偏差とKとの関係性を下図に示します。これも対局数は1億です。

iw_k_k-d

Sが100の場合、400の場合共に、おおよそ平方根になっています(青線は最小二乗曲線)。この関係性も、誤差を除けば、対局数には依りません。また、ここでは詳細は記しませんが、Kの値に依らずに誤差の範囲内でほぼ正規分布になっていることも確認できます。

この結果は、一見すると、「Kはレートの移動の“歩幅”を決めている量であるため、Kが大きくなるほど、レートが大きく揺らいで、分布の標準偏差が大きくなる」と解釈できそうですが、実際にはそんなに単純ではありません。というのは、一回の対局の平均移動距離はSの値にも依っており、Sが100の時には約7.79、400の時には約5.70となっているのですが(対局相手とのレート差が離れているほど平均移動距離が少ないため)、Kと違ってSの方は標準偏差に与える影響は小さく、単純に「平均移動距離によって標準偏差が決まる」というわけではないのです。従って、この標準偏差のK依存性はイロレーティングの仕組みを直接的に反映したものであると考えることができます。

以上まとめると、理想世界の散策では、軌跡の頻度分布はほぼ正規分布(中心極限定理)となり、その標準偏差はおおよそKの平方根に比例するということが分かりました。大雑把に言うと、標準偏差は、K = 16の時には37.5程度、K = 32の時には53.5程度です。これらのことは、イロレーティングというものをよく知る上で最も基礎的な知識の一つとなります。

さて、今回は「実力レートと表示レートが一致している理想世界」を考えましたが、実際には両者は必ずしも一致していないのが普通です。次回は「表示レートにゆらぎのある非理想世界」を考えてみましょう。

このページのトップヘ