Scrapy + Splash で競馬予想のスクレイピング
前回 Scrapyチュートリアルを試してみたので、今回はnetkeiba.comから競馬予測家の予想コメントを集めてみようと思う。
netkeiba.comのデータ構造の確認Scrapy shellでnetkeiba. ...
競馬予測改善 指数追加
前回のモデルはスピード指数があまり予想に生かされていない感じであった。
これは訓練データ中の新馬戦の割合が多いためであると思う。
新馬戦では過去の戦績はないため、そのレースでの馬体重、斤量などがモデルで重要視されて ...
2回 中山 1日目レース予測
セイルオンセイラーは近走のスピード指数が良く予測1着、スズカコテキタイもスピード指数が良く、上り指数もよいので2着、ハナキリは1つ前のレースが芝レースでスピード指数も思わしくないが他近走のスピード指数は申し分な ...
2022/2/5 東京 レース予測 改善
前回予測したレース結果を振り返り、次のモデルの改善点を洗い出した。
5走に満たない馬のデータ考慮休養期間がある馬のデータ考慮
これらのデータを訓練データに追加したモデルを作成したので、前回のモデルと比べて ...
競馬結果予測 – スピード指数追加
以前過去レース4を参照する予測モデルを作成した。
今回は過去レースのスピード指数を算出して、それをモデルの特徴量に加えることで予測精度を高めてみる。
スピード指数とはWikipediaによると、「全ての馬が ...
1/23中山レース予測の振り返り
前回予測した1/23中山レースの結果を振り返りながら、予測モデルの課題と改善方針を考える。
予測結果これは第1レースの予測と実際のタイムである。
予測下位層の馬が実際は入賞している。
タイムも1.3 ...
競馬予測 2022年1月23日 中山
以前作った競馬レースタイム予測モデルを試してみる。
予測対象は2022年1月23日 中山のレースとする。
まずは第1レースの予測をしてみる。
第1レース予測結果着順枠番馬番馬名予想タイム124トーアコ ...競馬結果予測 – 直近4レース
前回、単勝を予測するためにタイムを予測するモデルを作成した。
今回はこのモデルを改善する。
今回は過去4レースの成績を特徴量として追加する。
競馬データは、Kaggleで公開されているデー ...
競馬結果予測 – タイム予測 – 性別・芝・ダート馬場状態
前回、単勝を予測するためにタイムを予測するモデルを作成した。
今回はこのモデルを改善する。
前回は特徴量として、’枠番’, ‘馬番’, ‘馬 ...
競馬結果予測 – タイム予測
単勝を予測するために、タイムを予測するモデルを作成する
アプローチ特徴量として、’枠番’, ‘馬番’, ‘馬齢’, ‘斤量’ ...