2019.11.01

クライミングの能力を項目反応理論（IRT）で推定する

趣味のボルダリングにおいて、常に議論の的になるのが課題のグレード（難易度）。「Aジムの3級はBジムの4級くらいだ」といった会話は日常茶飯事であり、グレードは多分にセッターやジムのクセといった主観に左右される。それでいいんか、という話。

そこで、試験の採点などで使われる**項目反応理論（Item Response Theory: IRT）**を用いて、クライマーの能力（実力）と課題の難易度を客観的に推定できないかと考え、実装してみた。

IRTは、テストの正誤データから「受験者の能力」と「問題の特性（難易度や識別力）」を同時に推定する統計モデルだ。従来の素点による評価と異なり、以下のメリットがある。

これをクライミングに当てはめると、「どの課題を完登したか」というデータから、クライマーの真の実力と、課題の本当の辛さを算出できることになる。

今回作成したリポジトリでは、2パラメータ・ロジスティックモデル（2PLモデル）を採用し、勾配降下法を用いてパラメータを推定している。

EMアルゴリズムで、クライマーの能力推定と課題の特性推定を交互に繰り返し、収束させていく。

こちらが詳細わりと予想通りいった感。さすがアダム・オンドラ。

このモデルがうまく機能すれば、以下のようなことが可能になる。

実際には「トライ数」や「登れた時のコンディション」など変数は多いが、完登・未登というシンプルなバイナリデータだけでも、統計的に見えてくるものは多い。現在はIFSCのワールドカップデータなどを用いて実験しているが、アプリ化してデータを集めたい。