Python,データ分析

Thumbnail of post image 176

目的

前回 Scrapyチュートリアルを試してみたので、今回はnetkeiba.comから競馬予測家の予想コメントを集めてみようと思う。

netkeiba.comのデータ構造の確認

Scrapy shellでnetkeiba. ...

Python,データ分析

Thumbnail of post image 196

目的

前回のモデルはスピード指数があまり予想に生かされていない感じであった。
これは訓練データ中の新馬戦の割合が多いためであると思う。
新馬戦では過去の戦績はないため、そのレースでの馬体重、斤量などがモデルで重要視されて ...

競馬予想

Thumbnail of post image 013

2回 中山 1日目 7R

セイルオンセイラーは近走のスピード指数が良く予測1着、スズカコテキタイもスピード指数が良く、上り指数もよいので2着、ハナキリは1つ前のレースが芝レースでスピード指数も思わしくないが他近走のスピード指数は申し分な ...

Python,データ分析

Thumbnail of post image 161

目的

前回予測したレース結果を振り返り、次のモデルの改善点を洗い出した。

5走に満たない馬のデータ考慮
休養期間がある馬のデータ考慮

これらのデータを訓練データに追加したモデルを作成したので、前回のモデルと比べて ...

Python,データ分析

Thumbnail of post image 001

目的

以前過去レース4を参照する予測モデルを作成した。

今回は過去レースのスピード指数を算出して、それをモデルの特徴量に加えることで予測精度を高めてみる。

スピード指数とは

Wikipediaによると、「全ての馬が ...

データ分析

Thumbnail of post image 141

目的

前回予測した1/23中山レースの結果を振り返りながら、予測モデルの課題と改善方針を考える。

予測結果

これは第1レースの予測と実際のタイムである。

予測下位層の馬が実際は入賞している。
タイムも1.3 ...

データ分析

Thumbnail of post image 088

目的

以前作った競馬レースタイム予測モデルを試してみる。

予測対象は2022年1月23日 中山のレースとする。

まずは第1レースの予測をしてみる。

第1レース予測結果着順枠番馬番馬名予想タイム124トーアコ ...

Python,データ分析

Thumbnail of post image 172

目的

前回、単勝を予測するためにタイムを予測するモデルを作成した。
今回はこのモデルを改善する。

アプローチ

今回は過去4レースの成績を特徴量として追加する。

競馬データは、Kaggleで公開されているデー ...

データ分析

Thumbnail of post image 043

目的

前回、単勝を予測するためにタイムを予測するモデルを作成した。
今回はこのモデルを改善する。

アプローチ

前回は特徴量として、’枠番’, ‘馬番’, ‘馬 ...

データ分析

Thumbnail of post image 189

目的

単勝を予測するために、タイムを予測するモデルを作成する

アプローチ

特徴量として、’枠番’, ‘馬番’, ‘馬齢’, ‘斤量’ ...