チェスにおけるコンピュータを用いた不正解析の第一人者は、ニューヨーク州立大学バッファロー校コンピュータ科学技術科の准教授であるKenneth W. Regan教授だと言われています。彼はFIDE認定のチェスのインターナショナルマスターでもあります。

今回は、Regan教授のwebサイト「Measuring Fidelity to a Computer Agent」(コンピュータソフトに対する忠実度の測定)から、チェスにおける不正解析がどのように行われているのかを紹介します。ちなみに、Fidelity(忠実度)というのは工学分野でよく用いられる概念であり、2つの物や情報がどの程度、似ているか、一致しているかを何らかの手法で定量化した指標のことです。

まず、基本的な方針は「The Parable of the Golfers: Why a high match% to Rybka is usually not evidence of cheating, unless...」(ゴルフのたとえ話:チェスソフトとの高い一致率が何で通常は不正の証拠とならないのか、証拠となる場合というのは……)に記されています。

記事では最初にゴルフのホールインワンの例を挙げて、稀な事と異常な事との違いを説明しています。ホールインワンは五千回に1回の確率らしく、稀な現象です。しかしながら、一万人がスイングを行えば、2回程度は出現するものであり、そのような状況での出現は異常ではなく、邪悪な陰謀によるものとは言えません。

ちなみに、日本には、ホールインワン時に祝賀会等を開く慣習があり、その費用負担をカバーするためのホールインワン保険というものがあるようです(※筆者はゴルフをしないのでよく知りません)。ホールインワンは通常は“同組プレーヤーとキャディーの現認で成立”するようですが、それでも不正を疑われる場合もあるらしく、統計的な不正調査も行われているようです。

続いて、Regan教授は異常な事の例として、“目星”を付けた10人がスイングをした時にホールインワンが出たという場合を挙げています。これは500回に1回の確率ですので、“民事裁判”基準でも異常だと判定できると書かれています(※この基準はアメリカのものだと思われますが、筆者は専門外なので分かりません)。

つまり、沢山の事例を集めれば稀な事が起こっているのは当たり前であり、異常かどうかを判定するには適切に“目星”を付けなければならないというわけです。

ここで、Regan教授のポリシーが提示されます。

“目星”は、物理的、もしくは観察的な不正の証拠のみによって付けられなければならない。その作業は、チェスの解析やソフトとの統計的一致についての考察等とは独立して行われる必要がある。

というものです。そして、「統計解析でできるのは、明確な“目星”がついている場合に、不正の証拠を支援することのみである」という立場が示されます。また、「申し立てられた不正手段により、どれくらいのレート上昇の利益があるのかも統計手法によって見積もることができる」と記しています。

さらに、「根拠のない不正の告発は“目星”には使えない」と注意し、そのような取るに足らない告発が頻出するようになったきっかけとなる出来事として“Toiletgate”事件を挙げています。ここで、“Toiletgate”事件というのは、2006年の世界チェス選手権で起こった事件です。詳しくは、記事の最後に簡単な時系列を付記しています。

実際に異常かどうかを統計的に判定する基準(有意水準)については、明確な“目星”がついている場合には、“民事裁判”基準により、標準偏差の2倍以上(片側で40分の1、両側で20分の1)でよいとし、そうでない場合には、工業や素粒子物理の例から、標準偏差の3.5~5倍以上が必要だとしています。

この有意水準に関する議論については、やや不十分であると筆者には感じられます。「人間の値打ち 1:不正判定における許容リスク」の記事に記したように、このような基準を議論する際にはリスク工学的な観点が不可欠だと思われますし、また、本来、基準というのは、天下り的に与えられるべきものではなく、社会的な合意によって決められるべきものだと考えられるからです。例として挙げられている工業や素粒子物理における基準にしても、それぞれ理由があって、その数値が採用されているわけであり、その背景を無視して数値のみを持ってくるのは少し乱暴に感じられます。

以上のRegan教授のポリシーについては様々な感想があるかと思います。「妥当だ」という方もいるでしょうし、「もっと厳しくてもいい」という方もいるでしょうし、「民間が不正を“捜査”することの限界」を感じる方もいるでしょうし、「これだからベイジアン(主観確率論者)は」と感じる物理学者もいるかもしれません。しかしながら、彼の手法が現場で鍛えられた実践的な方法であることは確かであり、その経験は尊重されるべきでしょう。

さて、以上のポリシーに基づき、実際に統計的な解析を行うには、

  1. 定められた方法により、データを取得する。
  2. 取得したデータを統計解析する。

ということをしなければなりません。次回は、Regan教授が推奨するデータ取得の方法を紹介します。

-------------------

付記:“Toiletgate”事件

“Toiletgate”事件とは、2006年の世界チェス選手権(クラムニク対トパロフ戦)で起こった事件です。時系列を簡単にまとめると、以下のようになります。

  1. クラムニクの2勝0敗2分の第4局後、トパロフ側が「クラムニクのトイレへの離席が不自然に多すぎる」と抗議し、「この懸案事項に取り組まないのであれば選手権を放棄するだろう」と示唆する。
  2. 不服申立て委員会は、申し立ての離席回数には誇張があるとしながらも、スムーズな大会運営のために個室トイレのみ両者の使用を禁止すると裁定する。
  3. これに対し、クラムニク側は「休憩室は狭く、クラムニクは歩くのを好むのでトイレを使っている」「また、対局中に大量の水を飲まなければならない」「クラムニクがトイレを自由に使える権利を尊重しない限り、この選手権の対局は停止する」等として、元の対局条件に固執する声明を公表する。
  4. 第5局までに委員会の裁定が覆らなかったため、クラムニクは対局を拒否し、不戦敗となる。また、クラムニク側の抗議書が期限内に提出されないという手違いもあった。
  5. その後の話し合いで、元の対局条件に戻されることが合意され、委員会は退陣となったが、不戦敗の裁定が覆ることはなかった。
  6. 不戦敗の裁定についてクラムニクは法的措置を示唆するが、最終的にクラムニクが選手権に勝利したため、実行されなかった。
  7. また、第7局の際にトパロフ側は「クラムニクの指し手のチェスソフトとの一致率が不自然に高い(平均78%)」という声明を公表しており、さらに後のトパロフのインタビューでは「個室トイレにネットワークケーブルが見つかった」「脅迫を受け、選手権中に身の危険を感じた」等の発言があり、物議を醸した。

この件では、不正疑惑の告発が委員会に対して直接的に行われずに記者会見を通して行われたことや告発内容に誇張が含まれていたり、告発の根拠が明確でなかったりしたことが問題視されました。特に最後の部分の「一致率」については、データが恣意的であるとして、Regan教授は否定的であるようです。