Python

Thumbnail of post image 063
概要

pandasでconcatをしたところ下記のエラーが発生した。

InvalidIndexError: Reindexing only valid with uniquely valued Index objectsReind ...

Python,データ分析

Thumbnail of post image 164
目的

前回Scrapyを利用して取得した競馬予想家のコメントを分析して、競馬予想の着眼点を探してみる。

準備

今回は自然言語解析を行うため、形態素解析エンジンMeCabをインストールする。

!pip install me ...

Python,データ分析

Thumbnail of post image 157

目的

前回 Scrapyチュートリアルを試してみたので、今回はnetkeiba.comから競馬予測家の予想コメントを集めてみようと思う。

netkeiba.comのデータ構造の確認

Scrapy shellでnetkeiba. ...

Python,データ分析

Thumbnail of post image 013

Scrapyとは

ScrapyはPythonで開発されたクローラーフレームワークである。
Webサイトから情報を抽出するプログラムを簡単に作成することができる。

お試しコード

まずはお試しコードを触ってみる。 ...

Python,データ分析

Thumbnail of post image 074

目的

前回のモデルはスピード指数があまり予想に生かされていない感じであった。
これは訓練データ中の新馬戦の割合が多いためであると思う。
新馬戦では過去の戦績はないため、そのレースでの馬体重、斤量などがモデルで重要視されて ...

競馬予想

Thumbnail of post image 128

2回 中山 1日目 7R

セイルオンセイラーは近走のスピード指数が良く予測1着、スズカコテキタイもスピード指数が良く、上り指数もよいので2着、ハナキリは1つ前のレースが芝レースでスピード指数も思わしくないが他近走のスピード指数は申し分な ...

Python,データ分析

Thumbnail of post image 139
目的

前回線形サポートベクタマシン(LinearSVM)、非線形サポートベクタマシン(SVM)を利用したサッカー試合予測モデルを作ったが精度が良くなかったので改善策を考えたいと思う。

試み

SVMによる予測のSHAP値を計算し ...

Python,データ分析

Thumbnail of post image 167
目的

ドイツサッカーリーグ ブンデスリーガの勝敗予測をするために、線形サポートベクタマシン(LinearSVM)、k近傍法(KNN)、非線形サポートベクタマシン(SVM)を試した。
どの手法も予測精度がいまいちであったため、今回 ...

Python,データ分析

Thumbnail of post image 141

目的

前回予測したレース結果を振り返り、次のモデルの改善点を洗い出した。

5走に満たない馬のデータ考慮
休養期間がある馬のデータ考慮

これらのデータを訓練データに追加したモデルを作成したので、前回のモデルと比べて ...

Python,データ分析

Thumbnail of post image 009

目的

ブンデスリーガの勝敗予測をするために、前回、前々回いろいろな手法を試したが良い結果は出なかった。
Scikitlearnのチートシートに従って、今回は別種類のSVMを試してみる。

SVM

前々回使ったLinear ...