読者です 読者をやめる 読者になる 読者になる

統計馬

人工知能を活用した競馬の予想を紹介するブログです

最新の人工知能を活用した競馬予想ロジックについて

はじめに

何週か運用をやってみて一旦の馬券の購入傾向が見えてきたのでそれのまとめをさせていただこうと思います。

改善後の数値

現在のロジックは思いの外いい結果になっていて非常に満足な感じです。 

 

keiba.gedatsu.biz

 

予想モデルについて

予想モデルは大きく分けると3パターンで

 

  • 期待値最大化パターン
  • 穴馬狙いパターン
  • 着順推定パターン

 

となっています。

それぞれ何を行っているかというと過去実績の何を目標にして類推を行っているかの違いで

  • 期待値最大化パターン:馬券に絡みそうでオッズが不当に低い馬を当てる
  • 穴馬狙いパターン:とにかくオッズが不当に低い馬を当てる
  • 着順推定パターン:とにかく馬券に絡みそうな馬を当てる

というロジックになっています。

詳細を知りたい方はいかに記載されているテーブル構成を見ていただき 

keiba.gedatsu.biz

 

わかる人にしかわからないと思いますがTreasure DataのHiveのクエリでいうと

推定する値=flagを以下のクエリで定義しています。

期待値最大化

CASE 
WHEN timenorm< 0 AND timenorm - oddsnorm< 0 THEN timenorm - oddsnorm
WHEN timenorm< 0 AND timenorm - oddsnorm>= 0 THEN timenorm - oddsnorm
WHEN timenorm>= 0 AND timenorm - oddsnorm< 0 THEN 0
WHEN timenorm>= 0 AND timenorm - oddsnorm>= 0 THEN timenorm - oddsnorm
ELSE 0
END AS flag
穴馬狙いパターン
timenorm - oddsnorm AS flag
着順推定パターン
chaku AS flag

類推用のモデルを作るためのアルゴリズムにはDeeplearningを使っています。

と言っても一から作るとかではなく、RのH2Oパッケージというのをつかっています。

以下のブログを参考にした感じ。

tjo.hatenablog.com

 

馬券購入システムのロジックの考察について

0. 基本の考え方

今回の馬券購入システムのロジックは走破タイムの偏差値とオッズの偏差値の差が最大化されるための要素を見つけ出してそれに準じてスコアリングして買い目を決めています。 なので、以下に出てくる要素は人気よりも走る馬を見つけ出すための要素になります。

1 . 外枠の偶数番の馬

出遅れ&前が塞がれてしまうという状態は多くの馬にとって不利な状況です。そのため、外枠出あることは人気よりも走る可能性が高い要素としてリーズナブルだと思います(もしくは内枠が人気よりも走る可能性が低い要素であるとも言えます) また、競馬をある程度知っている方だとご存知だと思いますが、ゲートに馬を入れる順番は奇数番→偶数版と決まっているので気性が悪い馬は奇数番の時に偶数番と比較して着順が悪くなる傾向があったりします。

2. どちらかというと逃げ馬は人気が下がりやすい

これも感覚的にはあるのですが、同じ半馬身差の2着だとしても追い込んで2着と逃げ切れずに2着では見映えがだいぶ違います(逃げ切れずの場合は力負けと言われてしまうことが多いです)。そのため、逃げ馬の方が相対的には人気が下がりやすい傾向があるみたいです。

3. 前走の着順は3着が人気を釣り上げやすく、6着以下が狙い目

これはもともとの馬券裁判の話でも取り上げられていますが、複勝圏内に前走で入っている馬は人気が上がりやすい傾向があります。今回の解析結果では6着以下が狙い目です。

4. 前走からの日数は1ヶ月以内くらい短いか4ヶ月以上間が空いている馬が良い

調子がいいから短い期間に使うパターンもあれば、ある程度の休養を経て出走する時に人気よりも走るというケースが多いようです。前走からの日数としては1年近く前走から離れている馬(おそらく、怪我をしている馬)は相対的に人気よりも走らない傾向が強いようです。

5. 前のレースの出走馬の中の走破タイムの中央値との差分がプラスに触れている度合いが大きい方が良い

前走の走破タイムの中央値の馬から走破タイムの差分が+方向に大きい馬は人気よりも走る傾向が強いようです。3との掛け合わせで良いタイムで走っているけれども出ている馬が強くていい着順になれなかった馬はとても狙い目です。

6. Netkeiba の掲示板への書き込み数が多い母馬を持つ馬は人気を裏切りやすい

母親が有名な馬の子供は不当に人気になりやすい傾向があります。逆に全然書き込みがない馬の子供は人気よりも走る傾向が強いです。これは感覚的には当たり前ですが、数値化すると明確に出てきました。

7. Netkeiba の掲示板への書き込み数が馬は人気になりやすい傾向がある

これも当たり前ですが、掲示板への書き込み数が多い馬は実力よりも人気になりやすいです。

8. 人気を裏切りやすいジョッキーの馬は買わない方がよい

ジョッキーごとに人気よりもいい着順になりやすい人と人気よりも悪い着順になる人がいるようでテレビに出ることが多いジョッキーは相対的に人気になりやすいので買うことはお勧めできません。

まとめ

まとめてみると当たり前のことが多いですが、機械的に抽出することで愚直に買い目を見つけることができるというのはDeeplearningなどを使うメリットだと思います。 これらの要素を愚直に見つけ出して買うと回収率が100%を超えるんだったら確かに人間は単なる意思決定を鈍らせる抵抗なきがする。

予想について

それぞれのロジックの買い目は以下のNoteより購入(1日300円)ができます。

https://note.mu/statkeiba

もしも興味がある方はご購入よろしくお願いします。