2022/2/5 東京 レース予測 改善
目的
前回予測したレース結果を振り返り、次のモデルの改善点を洗い出した。
- 5走に満たない馬のデータ考慮
- 休養期間がある馬のデータ考慮
これらのデータを訓練データに追加したモデルを作成したので、前回のモデルと比べてみる。
第1レース
2022年02月05日 東京レース 第1レース 3歳未勝利の予測結果を比較した。
ヴィブラフォン、オーロラアーク、ランパデールの予測順位が前回よりも上位になった。
このレース予想家のコメントによると、ヴィブラフォンはパワーがあり砂適性は高いということであった。
競馬におけるパワーの意味合いが分からなかったので調べてみた。
このブログを参考にすると、パワーとは「最高速に一瞬で到達させる能力の高さ」という解釈になる。
このパワーに関する指標をモデルに組み込むことができれば、予測精度が上がると思われる。
着順 | 馬名 | タイム | 予測着順 (前回) | 予測タイム (前回) | 予測着順 (改良版) | 予測タイム (改良版) |
---|---|---|---|---|---|---|
1 | ヴィブラフォン | 1:26.2 | 10 | 1:29.55 | 4 | 1:32.52 |
2 | オーロラアーク | 1:26.4 | 12 | 1:30.22 | 6 | 1:32.77 |
3 | ランパデール | 1:27.1 | 15 | 1:30.83 | 10 | 1:33.61 |
4 | ビッグロジールーフ | 1:27.3 | 13 | 1:30.50 | 2 | 1:31.70 |
5 | ベストスマイル | 1:27.3 | 3 | 1:28.37 | 3 | 1:32.33 |
6 | パーチル | 1:27.5 | 9 | 1:29.54 | 7 | 1:32.92 |
7 | クーシフォン | 1:28.1 | 8 | 1:29.49 | 1 | 1:31.66 |
8 | ハクサンセーラー | 1:28.1 | 1 | 1:27.67 | 13 | 1:33.96 |
9 | ラブミーディザイア | 1:28.2 | 11 | 1:29.90 | 9 | 1:33.30 |
10 | フラッシュサンダー | 1:28.3 | 5 | 1:28.77 | 12 | 1:33.88 |
11 | リュウノアン | 1:28.4 | 16 | 1:31.01 | 8 | 1:32.97 |
12 | ライズザトーチ | 1:28.6 | 2 | 1:27.71 | 14 | 1:34.00 |
13 | ベロア | 1:28.6 | 6 | 1:29.02 | 15 | 1:34.05 |
14 | キネンビ | 1:29.5 | 14 | 1:30.80 | 5 | 1:32.67 |
15 | ピオニール | 1:31.0 | 7 | 1:29.15 | 11 | 1:33.72 |
16 | ナツイチバン | 1:33.2 | 4 | 1:28.56 | 16 | 1:34.15 |
第2レース
2022年02月05日 東京レース 第2レース 3歳未勝利の予測結果を比較した。
ニシノスーベニアが読み切れなかったのは良いとして、1番人気ニシノコニャックを上位に予測できていないのはどうなのだろうか。モデル的にはニシノコニャックが入賞しないのが分かっていたのかもしれない。
着順 | 馬名 | タイム | 予測着順 (前回) | 予測タイム (前回) | 予測着順 (今回) | 予測タイム (今回) |
---|---|---|---|---|---|---|
1 | ニシノスーベニア | 1:20.3 | 8 | 1:22.07 | 15 | 1:27.86 |
2 | モンサンレジャンド | 1:20.6 | 6 | 1:21.80 | 4 | 1:24.94 |
3 | ナンデフェスティヴ | 1:20.7 | 4 | 1:21.15 | 2 | 1:24.30 |
4 | メルト | 1:20.9 | 2 | 1:21.10 | 1 | 1:24.24 |
5 | サイキョウノオンナ | 1:21.0 | 15 | 1:23.22 | 12 | 1:27.24 |
6 | ファームラヴ | 1:21.0 | 11 | 1:22.26 | 6 | 1:26.08 |
7 | ニシノコニャック | 1:21.1 | 1 | 1:20.97 | 9 | 1:26.34 |
8 | ペイシャブライティ | 1:21.3 | 12 | 1:22.53 | 5 | 1:25.30 |
9 | パイツィーレン | 1:21.3 | 13 | 1:22.57 | 7 | 1:26.17 |
10 | フィーカ | 1:21.5 | 10 | 1:22.25 | 8 | 1:26.20 |
11 | オリーヴベリー | 1:21.6 | 5 | 1:21.17 | 3 | 1:24.80 |
12 | ネクタリス | 1:21.6 | 3 | 1:21.14 | 14 | 1:27.75 |
13 | アポロウェイラーズ | 1:23.5 | 7 | 1:21.96 | 11 | 1:26.98 |
14 | シンソーブ | 1:23.7 | 16 | 1:23.34 | 10 | 1:26.43 |
15 | ジャンヌデュモン | 1:23.9 | 9 | 1:22.09 | 16 | 1:27.89 |
16 | ムーンティアラ | 1:25.8 | 14 | 1:22.74 | 13 | 1:27.59 |
第3レース
2022年02月05日 東京レース 第3レース 3歳未勝利の予測結果を比較した。
こちらの予測結果では、前回と比べて入賞馬の予測結果が悪くなっている。
着順 | 馬名 | タイム | 予測着順 (前回) | 予測タイム (前回) | 予測着順 (今回) | 予測タイム (今回) |
---|---|---|---|---|---|---|
1 | ドンレパルス | 1:39.3 | 3 | 1:41.75 | 9 | 1:46.36 |
2 | オクトニオン | 1:39.3 | 1 | 1:39.85 | 6 | 1:45.79 |
3 | フランベルジュ | 1:39.9 | 5 | 1:42.31 | 16 | 1:48.46 |
4 | ラズライト | 1:40.3 | 11 | 1:43.17 | 4 | 1:45.27 |
5 | ジョーカーブラウン | 1:40.6 | 8 | 1:42.61 | 1 | 1:42.69 |
6 | コスモガラクシア | 1:40.8 | 7 | 1:42.53 | 2 | 1:43.60 |
7 | ハローサブリナ | 1:40.9 | 6 | 1:42.40 | 14 | 1:47.61 |
8 | ダイチヴィヴァン | 1:41.0 | 13 | 1:43.49 | 13 | 1:46.90 |
9 | ゴールドルパン | 1:41.0 | 9 | 1:42.87 | 8 | 1:46.08 |
10 | ドルズプライスレス | 1:41.2 | 10 | 1:42.87 | 12 | 1:46.64 |
11 | スノーフォックス | 1:41.4 | 2 | 1:41.19 | 5 | 1:45.51 |
12 | ミスタートーザイ | 1:41.4 | 12 | 1:43.29 | 7 | 1:45.93 |
13 | ジュンオーズ | 1:41.6 | 4 | 1:42.21 | 3 | 1:44.70 |
14 | ミッドナイトブルー | 1:41.9 | 14 | 1:44.30 | 15 | 1:47.79 |
15 | ジョリエス | 1:42.0 | 16 | 1:44.89 | 10 | 1:46.51 |
16 | ナイスサンデー | 1:49.2 | 15 | 1:44.36 | 11 | 1:46.59 |
ドンレパルスのウォーターフォール図はこんな感じ。
過去4,5レースのデータがないことで、予測タイムが増えているよう。
オクトニオンのウォーターフォール図はこんな感じ。
前回見られたスピード指数による影響が全くなくなってしまった。
フランベルジュのウォーターフォール図はこんな感じ。
こちらも過去レースのデータがないことで、予測タイムが増えているよう。
考察
結果としては前回悪かった点が少し改善されたようだが、うまく予測できていた所が悪化したようである。
改めて問題点を挙げると、
- 馬のパワーに関する指標が考慮されていないこと。
- 過去レースデータがないことがタイムの悪化を招いている。
- スピード指数がタイム予測に影響を与えなくなった。
1についてはペース指数、上り指数、先行指数といった指数があるようなので、それらを導入すれば改善するかもしれない。
2については訓練データ内の新馬レースの影響が出てしまっているのかもしれない。
新馬レース予測モデルとそれ以外予測モデルに分離することで影響を緩和できるかもしれない。
3については、まったく予想外だった。
距離・タイム・平均速度・斤量といった特徴量はスピード指数の中に情報として含まれているので除外してもいいのかもしれない。
ディスカッション
コメント一覧
まだ、コメントがありません