Python,データ分析

Thumbnail of post image 012
目的

前回Scrapyを利用して取得した競馬予想家のコメントを分析して、競馬予想の着眼点を探してみる。

準備

今回は自然言語解析を行うため、形態素解析エンジンMeCabをインストールする。

!pip install me ...

Python,データ分析

Thumbnail of post image 045

目的

前回 Scrapyチュートリアルを試してみたので、今回はnetkeiba.comから競馬予測家の予想コメントを集めてみようと思う。

netkeiba.comのデータ構造の確認

Scrapy shellでnetkeiba. ...

Python,データ分析

Thumbnail of post image 160

Scrapyとは

ScrapyはPythonで開発されたクローラーフレームワークである。
Webサイトから情報を抽出するプログラムを簡単に作成することができる。

お試しコード

まずはお試しコードを触ってみる。 ...

Python,データ分析

Thumbnail of post image 191

目的

前回のモデルはスピード指数があまり予想に生かされていない感じであった。
これは訓練データ中の新馬戦の割合が多いためであると思う。
新馬戦では過去の戦績はないため、そのレースでの馬体重、斤量などがモデルで重要視されて ...

Python,データ分析

Thumbnail of post image 004
目的

前回線形サポートベクタマシン(LinearSVM)、非線形サポートベクタマシン(SVM)を利用したサッカー試合予測モデルを作ったが精度が良くなかったので改善策を考えたいと思う。

試み

SVMによる予測のSHAP値を計算し ...

Python,データ分析

Thumbnail of post image 178
目的

ドイツサッカーリーグ ブンデスリーガの勝敗予測をするために、線形サポートベクタマシン(LinearSVM)、k近傍法(KNN)、非線形サポートベクタマシン(SVM)を試した。
どの手法も予測精度がいまいちであったため、今回 ...

Python,データ分析

Thumbnail of post image 191

目的

前回予測したレース結果を振り返り、次のモデルの改善点を洗い出した。

5走に満たない馬のデータ考慮
休養期間がある馬のデータ考慮

これらのデータを訓練データに追加したモデルを作成したので、前回のモデルと比べて ...

Python,データ分析

Thumbnail of post image 179

目的

ブンデスリーガの勝敗予測をするために、前回、前々回いろいろな手法を試したが良い結果は出なかった。
Scikitlearnのチートシートに従って、今回は別種類のSVMを試してみる。

SVM

前々回使ったLinear ...

Python,データ分析

Thumbnail of post image 019
目的

前回は線形SVMを使って、ブンデスリーガの勝敗予測を試みたが、良い結果が得られなかった。

なので今回はScikitlearnチートシートに従ってK近傍法を試してみる。

K近傍法とは

Wikipediaによると ...

Python,データ分析

Thumbnail of post image 078

目的

ドイツ プロサッカーリーグのブンデスリーガの勝敗予測を行ってみる。

データはFootball-Data.co.ukのデータを利用する。

各チームの勝敗予測を分類タスクととらえてSVMを利用して解く