競馬予想コメントをクラスタリングしWordCloudで可視化する
前回Scrapyを利用して取得した競馬予想家のコメントを分析して、競馬予想の着眼点を探してみる。
準備今回は自然言語解析を行うため、形態素解析エンジンMeCabをインストールする。
!pip install me ...Scrapy + Splash で競馬予想のスクレイピング
前回 Scrapyチュートリアルを試してみたので、今回はnetkeiba.comから競馬予測家の予想コメントを集めてみようと思う。
netkeiba.comのデータ構造の確認Scrapy shellでnetkeiba. ...
Scrapyを触ってみる
ScrapyはPythonで開発されたクローラーフレームワークである。
Webサイトから情報を抽出するプログラムを簡単に作成することができる。
まずはお試しコードを触ってみる。 ...
競馬予測改善 指数追加
前回のモデルはスピード指数があまり予想に生かされていない感じであった。
これは訓練データ中の新馬戦の割合が多いためであると思う。
新馬戦では過去の戦績はないため、そのレースでの馬体重、斤量などがモデルで重要視されて ...
SVCモデルのSHAP値
前回線形サポートベクタマシン(LinearSVM)、非線形サポートベクタマシン(SVM)を利用したサッカー試合予測モデルを作ったが精度が良くなかったので改善策を考えたいと思う。
試みSVMによる予測のSHAP値を計算し ...
サッカー勝敗予測 – 過去試合得点
ドイツサッカーリーグ ブンデスリーガの勝敗予測をするために、線形サポートベクタマシン(LinearSVM)、k近傍法(KNN)、非線形サポートベクタマシン(SVM)を試した。
どの手法も予測精度がいまいちであったため、今回 ...
2022/2/5 東京 レース予測 改善
前回予測したレース結果を振り返り、次のモデルの改善点を洗い出した。
5走に満たない馬のデータ考慮休養期間がある馬のデータ考慮
これらのデータを訓練データに追加したモデルを作成したので、前回のモデルと比べて ...
サッカー勝敗予測 – SVM
ブンデスリーガの勝敗予測をするために、前回、前々回いろいろな手法を試したが良い結果は出なかった。
Scikitlearnのチートシートに従って、今回は別種類のSVMを試してみる。
前々回使ったLinear ...
サッカー勝敗予測 – K近傍法
前回は線形SVMを使って、ブンデスリーガの勝敗予測を試みたが、良い結果が得られなかった。
なので今回はScikitlearnチートシートに従ってK近傍法を試してみる。
K近傍法とはWikipediaによると ...
ブンデスリーガ勝敗予測 – LinearSVM
ドイツ プロサッカーリーグのブンデスリーガの勝敗予測を行ってみる。
データはFootball-Data.co.ukのデータを利用する。
各チームの勝敗予測を分類タスクととらえてSVMを利用して解く