競馬結果予測 – 直近4レース

2022年2月4日

目的

前回、単勝を予測するためにタイムを予測するモデルを作成した。
今回はこのモデルを改善する。

アプローチ

今回は過去4レースの成績を特徴量として追加する。

競馬データは、Kaggleで公開されているデータセットを利用させていただく。
このデータセットには、1986/01/05 – 2021/07/31のレース結果が含まれている。
JRA日本中央競馬会データ
https://www.kaggle.com/takamotoki/jra-horse-racing-dataset

結果

予想タイムの平均誤差は1.06秒であった。
着差と秒数の対応表を参考にすると、6-7馬身分の誤差 )なので、まだまだ改善の必要がある。