Python,データ分析

Thumbnail of post image 171
目的

PyCaretを使ってJリーグの来場者予測をしてみる。

PyCaretとは

PyCaretは少ないコードで自動化された機械学習を行えるライブラリである。

Jリーグデータ

Jリーグの来場者数データはこちらのJリー ...

Python

Thumbnail of post image 123
概要

pandasでconcatをしたところ下記のエラーが発生した。

InvalidIndexError: Reindexing only valid with uniquely valued Index objectsReind ...

Python,データ分析

Thumbnail of post image 080
目的

前回Scrapyを利用して取得した競馬予想家のコメントを分析して、競馬予想の着眼点を探してみる。

準備

今回は自然言語解析を行うため、形態素解析エンジンMeCabをインストールする。

!pip install me ...

Python,データ分析

Thumbnail of post image 003

目的

前回 Scrapyチュートリアルを試してみたので、今回はnetkeiba.comから競馬予測家の予想コメントを集めてみようと思う。

netkeiba.comのデータ構造の確認

Scrapy shellでnetkeiba. ...

Python,データ分析

Thumbnail of post image 075

Scrapyとは

ScrapyはPythonで開発されたクローラーフレームワークである。
Webサイトから情報を抽出するプログラムを簡単に作成することができる。

お試しコード

まずはお試しコードを触ってみる。 ...

Python,データ分析

Thumbnail of post image 105

目的

前回のモデルはスピード指数があまり予想に生かされていない感じであった。
これは訓練データ中の新馬戦の割合が多いためであると思う。
新馬戦では過去の戦績はないため、そのレースでの馬体重、斤量などがモデルで重要視されて ...

Python,データ分析

Thumbnail of post image 193
目的

前回線形サポートベクタマシン(LinearSVM)、非線形サポートベクタマシン(SVM)を利用したサッカー試合予測モデルを作ったが精度が良くなかったので改善策を考えたいと思う。

試み

SVMによる予測のSHAP値を計算し ...

Python,データ分析

Thumbnail of post image 021
目的

ドイツサッカーリーグ ブンデスリーガの勝敗予測をするために、線形サポートベクタマシン(LinearSVM)、k近傍法(KNN)、非線形サポートベクタマシン(SVM)を試した。
どの手法も予測精度がいまいちであったため、今回 ...

Python,データ分析

Thumbnail of post image 079

目的

前回予測したレース結果を振り返り、次のモデルの改善点を洗い出した。

5走に満たない馬のデータ考慮
休養期間がある馬のデータ考慮

これらのデータを訓練データに追加したモデルを作成したので、前回のモデルと比べて ...

Python,データ分析

Thumbnail of post image 059

目的

ブンデスリーガの勝敗予測をするために、前回、前々回いろいろな手法を試したが良い結果は出なかった。
Scikitlearnのチートシートに従って、今回は別種類のSVMを試してみる。

SVM

前々回使ったLinear ...