女子卓球レーティング

囲碁将棋などで有名な実力計算方式である"イロレーティング"を卓球に応用し、ITTFランキングでは測れない「実力」を試算しました。イロレーティングをもとに、トーナメントドローに応じたモンテカルロシミュレーションを加えた勝敗予想を提供します。さらにイロレーティングを超える「AIレーティング」を開発しています。

【テクニカル】イロレーティング計算精度とK値の関係

イロレーティング計算は、その特性上、過去のある時点までで計算したレーティングをもとに、その時点の直後の試合で「答え合わせ」が可能です。その試合はすでに行われているため、イロレーティングを使った予想と、実際の試合結果を比べることができるためです。この特性を使って、イロレーティングの計算精度を、時点を少しずつ変えることで、連続的に調べることができます。

また、イロレーティング計算においては、K値を32(新規プレイヤーでは128)と定義しました。このK値はWikiによれば16または32が推奨されており、対象となるモデルにより最適な値が変わるそうです。K値を変えて計算精度を確認することで、最適なK値が判明します。

K値を変えながら、3年分の有効全試合に渡って計算精度を調べた結果が、こちらです。

K値 16 32 64 128
K値(新規プレイヤー) 64 128 256 512
〜1000試合 65% 66% 66% 66%
1001〜2000試合 68% 69% 69% 68%
2001〜3000試合 69% 69% 72% 72%
3001〜4000試合 70% 71% 74% 73%
4001〜5000試合 68% 70% 72% 71%
5001〜6000試合 71% 72% 74% 73%
6001〜7000試合 75% 76% 76% 76%
7001〜8000試合 71% 71% 72% 73%
8001〜9000試合 71% 74% 76% 76%
9001〜10000試合 72% 74% 76% 74%
10001〜11000試合 74% 74% 77% 75%
11001〜12000試合 71% 73% 73% 73%
12001〜13000試合 75% 78% 79% 78%
13001〜14000試合 79% 80% 81% 80%

なお、新規プレイヤーのK値は一律4倍としていますが、この値を変えても結果への影響はわずかでした。また、試合数が増える方が精度がよくなる傾向がありますが、これはイロレーティングが実力相応の値に収束するまでに、それなりの試合数が必要であるからです。

これだけ見ると、K値 = 64において、わずかながら最も計算精度が高いことがわかります。一方、このブログでの試合結果予測は、通常、ワールドツアーの本戦のみで行っており、対象試合をそこに絞った結果が重要です。

その結果がこちらです。イロレーティングの更新は全試合を対象にしつつ、結果評価のみワールドツアー本戦に絞ってみました。

K値 16 32 64 128
K値(新規プレイヤー) 64 128 256 512
〜100試合 65% 66% 71% 71%
101〜200試合 58% 63% 64% 67%
201〜300試合 71% 72% 71% 68%
301〜400試合 65% 67% 70% 69%
401〜500試合 72% 71% 72% 69%
501〜600試合 71% 71% 71% 72%
601〜700試合 77% 78% 76% 76%
701〜800試合 72% 76% 76% 75%
801〜900試合 72% 77% 80% 82%
901〜1000試合 75% 77% 73% 72%
1001〜1100試合 78% 78% 80% 80%
1101〜1200試合 73% 73% 75% 73%

これを見ると、K値=32と=64の精度が、K=64がほんのわずかに優位ではありますが、ほぼ同レベルであることがわかります。K値はWikiによれば16または32が推奨されているため、無理して大きいK値をとるのではなく、K=32というこれまでの方針を維持することにします。

なお、その時の予想精度は概ね70〜80%であることがわかりました。ブログタイトルでは85%を誇っていますが、一時的な値だったようです。この値は重要で、今後、AIを活用した新たな予想モデルを作成する時の、モデルの良否を判定する基準になります。