2022/2/5 東京 レース予測 改善

2022年2月23日

目的

前回予測したレース結果を振り返り、次のモデルの改善点を洗い出した。

  • 5走に満たない馬のデータ考慮
  • 休養期間がある馬のデータ考慮

これらのデータを訓練データに追加したモデルを作成したので、前回のモデルと比べてみる。

第1レース

2022年02月05日 東京レース 第1レース 3歳未勝利の予測結果を比較した。
ヴィブラフォンオーロラアークランパデールの予測順位が前回よりも上位になった。
このレース予想家のコメントによると、ヴィブラフォンはパワーがあり砂適性は高いということであった。
競馬におけるパワーの意味合いが分からなかったので調べてみた。
このブログを参考にすると、パワーとは「最高速に一瞬で到達させる能力の高さ」という解釈になる。
このパワーに関する指標をモデルに組み込むことができれば、予測精度が上がると思われる。

着順馬名タイム予測着順
(前回)
予測タイム
(前回)
予測着順
(改良版)
予測タイム
(改良版)
1ヴィブラフォン1:26.2101:29.5541:32.52
2オーロラアーク1:26.4121:30.2261:32.77
3ランパデール1:27.1151:30.83101:33.61
4ビッグロジールーフ1:27.3131:30.5021:31.70
5ベストスマイル1:27.331:28.373 1:32.33
6パーチル1:27.591:29.5471:32.92
7クーシフォン1:28.181:29.4911:31.66
8ハクサンセーラー1:28.111:27.67131:33.96
9ラブミーディザイア1:28.2111:29.9091:33.30
10フラッシュサンダー1:28.351:28.77121:33.88
11リュウノアン1:28.4161:31.0181:32.97
12ライズザトーチ1:28.621:27.7114 1:34.00
13ベロア1:28.661:29.02151:34.05
14キネンビ1:29.5141:30.8051:32.67
15ピオニール1:31.071:29.15111:33.72
16ナツイチバン1:33.241:28.56161:34.15
第1レース予測の比較

第2レース

2022年02月05日 東京レース 第2レース 3歳未勝利の予測結果を比較した。
ニシノスーベニアが読み切れなかったのは良いとして、1番人気ニシノコニャックを上位に予測できていないのはどうなのだろうか。モデル的にはニシノコニャックが入賞しないのが分かっていたのかもしれない。

着順馬名タイム予測着順
(前回)
予測タイム
(前回)
予測着順
(今回)
予測タイム
(今回)
1ニシノスーベニア1:20.381:22.07151:27.86
2モンサンレジャンド1:20.661:21.8041:24.94
3ナンデフェスティヴ1:20.741:21.1521:24.30
4メルト1:20.921:21.1011:24.24
5サイキョウノオンナ1:21.0151:23.22121:27.24
6ファームラヴ1:21.0111:22.2661:26.08
7ニシノコニャック1:21.111:20.9791:26.34
8ペイシャブライティ1:21.3121:22.5351:25.30
9パイツィーレン1:21.3131:22.5771:26.17
10フィーカ1:21.5101:22.2581:26.20
11オリーヴベリー1:21.651:21.1731:24.80
12ネクタリス1:21.631:21.14141:27.75
13アポロウェイラーズ1:23.571:21.96111:26.98
14シンソーブ1:23.7161:23.34101:26.43
15ジャンヌデュモン1:23.991:22.09161:27.89
16ムーンティアラ1:25.8141:22.74131:27.59
第2レース予測の比較

第3レース

2022年02月05日 東京レース 第3レース 3歳未勝利の予測結果を比較した。
こちらの予測結果では、前回と比べて入賞馬の予測結果が悪くなっている。

着順馬名タイム予測着順
(前回)
予測タイム
(前回)
予測着順
(今回)
予測タイム
(今回)
1ドンレパルス1:39.331:41.7591:46.36
2オクトニオン1:39.311:39.8561:45.79
3フランベルジュ1:39.951:42.31161:48.46
4ラズライト1:40.3111:43.1741:45.27
5ジョーカーブラウン1:40.681:42.611 1:42.69
6コスモガラクシア1:40.871:42.5321:43.60
7ハローサブリナ1:40.961:42.40141:47.61
8ダイチヴィヴァン1:41.0131:43.49131:46.90
9ゴールドルパン1:41.091:42.8781:46.08
10ドルズプライスレス1:41.2101:42.87121:46.64
11スノーフォックス1:41.421:41.1951:45.51
12ミスタートーザイ1:41.4121:43.2971:45.93
13ジュンオーズ1:41.641:42.2131:44.70
14ミッドナイトブルー1:41.9141:44.30151:47.79
15ジョリエス1:42.0161:44.89101:46.51
16ナイスサンデー1:49.2151:44.36111:46.59
第3レース予測の比較

ドンレパルスのウォーターフォール図はこんな感じ。
過去4,5レースのデータがないことで、予測タイムが増えているよう。

ドンレパルス

オクトニオンのウォーターフォール図はこんな感じ。
前回見られたスピード指数による影響が全くなくなってしまった。

オクトニオン

フランベルジュのウォーターフォール図はこんな感じ。
こちらも過去レースのデータがないことで、予測タイムが増えているよう。

フランベルジュ

考察

結果としては前回悪かった点が少し改善されたようだが、うまく予測できていた所が悪化したようである。
改めて問題点を挙げると、

  1. 馬のパワーに関する指標が考慮されていないこと。
  2. 過去レースデータがないことがタイムの悪化を招いている。
  3. スピード指数がタイム予測に影響を与えなくなった。

1についてはペース指数、上り指数、先行指数といった指数があるようなので、それらを導入すれば改善するかもしれない。

2については訓練データ内の新馬レースの影響が出てしまっているのかもしれない。
新馬レース予測モデルそれ以外予測モデルに分離することで影響を緩和できるかもしれない。

3については、まったく予想外だった。
距離・タイム・平均速度・斤量といった特徴量はスピード指数の中に情報として含まれているので除外してもいいのかもしれない。