1/23中山レース予測の振り返り
目的
前回予測した1/23中山レースの結果を振り返りながら、予測モデルの課題と改善方針を考える。
予測結果
これは第1レースの予測と実際のタイムである。
予測下位層の馬が実際は入賞している。
タイムも1.3-1.5秒誤差が出ている。
予測で1位だった トーアコンゴウ が再下位になっているのも気になる。
着順 | 枠番 | 馬番 | 馬名 | タイム | 予測タイム | 予測順位 |
---|---|---|---|---|---|---|
1 | 6 | 12 | ハクサンパール | 72.6 | 74.2284 | 14 |
2 | 7 | 13 | ミニョンルミエール | 72.7 | 74.0915 | 11 |
3 | 7 | 14 | ルプランドル | 72.7 | 74.234 | 15 |
4 | 8 | 15 | トラストパッキャオ | 72.9 | 74.0902 | 10 |
5 | 1 | 2 | ゲキザル | 73.2 | 73.7685 | 5 |
6 | 4 | 7 | ルワンジュ | 73.2 | 73.7377 | 2 |
7 | 6 | 11 | マイアミュレット | 73.5 | 73.75 | 3 |
8 | 1 | 1 | ペイシャクィンビー | 74 | 74.1365 | 12 |
9 | 3 | 5 | シンキングセンティ | 74.4 | 74.1731 | 13 |
10 | 2 | 3 | ファインバローロ | 74.4 | 74.546 | 16 |
11 | 5 | 9 | アムルム | 74.5 | 74.0721 | 8 |
12 | 3 | 6 | サンブルッキングズ | 74.7 | 73.7565 | 4 |
13 | 5 | 10 | チェリーアルプス | 74.9 | 74.0797 | 9 |
14 | 4 | 8 | ダイユウシェリー | 77 | 73.9872 | 6 |
15 | 8 | 16 | デルマエキドナ | 77 | 74.0697 | 7 |
16 | 2 | 4 | トーアコンゴウ | 81 | 73.7178 | 1 |
考察
各特徴量がどれくらい予測に影響を与えているのかウォーターフォール図にしてみる。
まず実際に上位入賞した3馬のウォーターフォール図を見てみる。
ハクサンパールとルプランドルに関しては斤量の影響がおかしい気がする。
一般的に斤量が小さくなるほど、タイムは良くなっていくはずなのだが、予測では斤量51がタイムを+0.45秒している。
このレースの平均斤量が約54なので、斤量51はタイムが良くなる方向に影響するべきであった。
訓練データ中の何かしらの制限付きレース結果に予想結果が影響を受けているのかもしれない。
ミニョンルミエールに関しては今回の予測モデルにない特徴量がよりタイムを縮める要素として隠れていると思う。
次に予想着順1番だったトーアコンゴウの予測値のウォーターフォール図を見てみる。
こちらも斤量の影響が反対方向に作用していた。
改善案
まとめると下記の2点の改善点が判明した。
- 斤量の影響が直感とあっていない
- 他の特徴量も考慮する必要がある
斤量に関しては訓練データに制限付きレースのカテゴリタイプを追加してみようと思う。
その他の特徴量としては血統データをなんとか数値化してモデルに入力したいと思う。
ディスカッション
コメント一覧
まだ、コメントがありません