競馬結果予測 – タイム予測

2022年2月4日

目的

単勝を予測するために、タイムを予測するモデルを作成する

アプローチ

特徴量として、’枠番’, '馬番’, '馬齢’, '斤量’, '馬体重’, '場体重増減’, '距離(m)’, 'レース月’を利用してみる。

LightGBMを使ってモデルを作成する。

競馬データは、Kaggleで公開されているデータセットを利用させていただく。
このデータセットには、1986/01/05 – 2021/07/31のレース結果が含まれている。
JRA日本中央競馬会データ
https://www.kaggle.com/takamotoki/jra-horse-racing-dataset

結果

予想タイムの平均誤差は1.98秒であった。

SHAP値は以下のようになった。

レースタイムには距離の影響が一番大きい。
続いて、レース月、馬齢、斤量であった。

結論

平均誤差は1.98秒では実用は難しそうなので改善の必要がある。