競馬結果予測 – タイム予測
目的
単勝を予測するために、タイムを予測するモデルを作成する
アプローチ
特徴量として、’枠番’, '馬番’, '馬齢’, '斤量’, '馬体重’, '場体重増減’, '距離(m)’, 'レース月’を利用してみる。
LightGBMを使ってモデルを作成する。
競馬データは、Kaggleで公開されているデータセットを利用させていただく。
このデータセットには、1986/01/05 – 2021/07/31のレース結果が含まれている。
JRA日本中央競馬会データ
https://www.kaggle.com/takamotoki/jra-horse-racing-dataset
結果
予想タイムの平均誤差は1.98秒であった。
SHAP値は以下のようになった。
レースタイムには距離の影響が一番大きい。
続いて、レース月、馬齢、斤量であった。
結論
平均誤差は1.98秒では実用は難しそうなので改善の必要がある。
ディスカッション
コメント一覧
まだ、コメントがありません