競馬初心者が競馬の予測AIを作ってみた話
■ このスレッドは過去ログ倉庫に格納されています
人工知能でも機械学習でもいいよ。
競馬初心者が〜と経験期間に言及してるってことはさ、その予測AIとやらに競馬経験則の要素薄いですよ、ってことを表現してるってことなんだよねきっと。
でもさ、AIは人間がアルゴリズムの改修加えなくてもある程度自立的に改善していくもんなんだよね。
だからハナから競馬経験則は関係ないんだよ。 >アナログで普通に勝ってるから
こういってる奴は99.99%負け組だと思ってる >>308
う〜ん・・・リークするのって大抵、前処理段階だったり変数自作する時だったりだから、そういう当たり前の変数を入れて無いと言われてもなんともなあ
もう一回聞くけど、その5058Rは発送前にリアルタイムで予測した物の集合なの?
あと、>>309の >CVもしないし、ってのが
「クロスヴァリデーションしない」って意味なら、オーバーフィットしてる可能性の高いモデルで>>274の成績出してるってことだから尚更危うい気がしてくる
敵に塩を送ることになるかもしらんで具体的なことは書かないが、どんなアルゴリズム使ってるかは知らないけどPermutationなりモデル比較なり色々調べてみた方がいいと思うよ 他人の勝ち負けなんて確かめようがないものはどうでもいいな
俺の馬券に繋がる有益な発言だけに価値がある パドックやらで馬見たら勝てる
競馬新聞見たら勝てる
過去データで選んだら勝てる
その他いろいろ
これらにAIが入るだけだよ
目的は競馬で儲ける、回収率を100%以上にすることなんだし 確立なんてもんは人気の通りだよ
何故かって?
もちろん外れることもあるけど
金が掛かってる物に本気で考察して賭けてんだよ
それも何十万って人間がな
一番正確だよ 人気じゃなくオッズだろ
オッズが下がれば下がるほど勝率は上がっていくという相関関係があるし
予想するときにはオッズは気にしないと断言してる奴は養分だと思ってる リークということで俺がやらかした話書いてみる
詳細は書かないが「過去にその馬がある条件で勝った時の馬番」のような特徴量を作った
(実際には勝った時でもなければ馬番でもないが、まあそれはそれ。分かり易くってことで)
んで、モデル作ってテストデータで予測〜集計してみたら、はっきりは覚えてないが1位の勝率で2%くらい、回収率で5%くらい上がった
まあそこそこのもんになったので喜んだものの、その変数一つでそこまで上がるのはおかしいくねえか?と思って調べてみた
すると、その「ある条件」で勝率40%回収率100%超えてたんだな
要するに「過去に勝った時」だけでなく現在未来に勝った時をも含んでしまっていて「その条件で勝ったフラグ」として機能してしまったという訳
その時はその変数一つくらいしか入れなかったからすぐ気づけたけど、大量に特徴量作ってぶち込むとこんなしょーもないミスでも気づきにくい(だから最初の頃にやらかし易い)
特に「過去の○○」特徴量を自作したときは注意が必要だよというお話
まあこんなこと言われなくても分かってると言われそうだがw 「その条件で勝ったフラグ」ってのはおかしいか
「そのレースで勝ったフラグ」だな お前らの言ってるAI馬券なんて
将棋が弱い奴が自分のゴミみたいな指し手を
コンピューターに入力するようなもんだろw リークしてるかどうかは数日前に毎週予測出してる人いるかって聞いたのとも少し関連すんだよね
毎週予測してると多かれ少なかれ違和感ある予測が出てくる
バック/フォワードテスト時との性能差や数十万件のデータ全体見てた時には気づかなかったバグに気づいたりするんだな 基本リークしてないって断言できるのも凄いよな
俺なんか毎週運用してても常にどっかでリークしてんじゃないかと不安だもの
億勝っても多分安心できないだろうけど松風みたいに週次1億負けるようになると平気になんのかな AIの定義があーだこーだ言うより自称AIが当たる条件を絞り込んだ方が面白いんじゃないかな?
もちろんこんな当たる日ばかりじゃないのは俺もよく知ってる >>328
種牡馬成績とかリークしないように処理するのくそめんどくさかった記憶がある 馬鹿な質問で申し訳無いんてすがエクセルでも競馬予想AIって作れます? >>342
AIっていわれてるのの大半は機械学習でその先祖にあたるというか単純な重回帰分析とかはできると思う
でもわざわざエクセルでやるのならRとかPythonとか具体的なものを覚えたほうが
結果的に早くできると思う >>328
Lambdarankの予測器作ったのはここ2ヶ月なんでリアルタイムの予測ではないよ。
最初は的中率32%回収率87%くらいだったんだけど2ヶ月掛けてちょっとづつ最適化した。
>>334
良く分かる。
例えばJRA-VANの競走馬成績とか騎手調教師成績とかを使って過去レースを予測させるとリークになるよね。あくまでマスタは現在の集計結果で過去レース時点から見ると未来のデータが含まれてるからね。
そういうデータは使ってないけど色々調べてみるよ。
ありがとうね。 >>342
VBA書けるならフルスクラッチで実装出来ないこともない・・・と思ったけど扱えるデータ量がしょぼ過ぎるわな
でも俺も最初はJRAサイトから毎週出馬表と結果表をエクセルに貼り付けてたのがめんどくさくて自動化出来ないかな?ってとこから始めたよ
俺のはAIじゃないけどやる気があれば作れるようになる
プログラミングで出来ることは競馬予想だけじゃないし仕事でPC使うならフィードバックできることもあるかも
自由にデータ分析したりプログラミングするのは楽しいよ >>344
あ、なんか俺の知ってる人かもしれない・・・
だとすると昔から色々作ってる人な気がするけど、最初からその数字ってのもちょっとどうすかねってとこあるんで、一回バラして小さいのから組み直してみると何か分かるかもしんないすね >>347
ランク学習予測1位を全レース均等買いしたときの結果ってあんまどこも公開してないから、これがどの程度いいのか悪いのか分からなかったよ。
バグはも常にあるし。
たまに特徴量テーブルを生見てておかしいなというのもある。
取りあえず買い目と馬券購入のところまでできたらもっかい見直してみる。 >>341
血統は使ってないんだよね
「種牡馬のデータ」は使ってるけど血統とか産駒成績ではない
あれはオカルトと確証バイアスだと思ってるからw
まあなんか「ディープインパクト産駒は強い」みたいなのくらいはほんのり僅かに誤差に出てくるから使った方がいいのかもしんないけど >>348
貫井さんのウマナリティクス発表で32%85%とかだったんでその辺とか1番人気とか超えてくるとちょっと怖いですね
松風やテンテックも1番人気超えるまで2~3年以上かかってるはずです
もしリークしてないなら相当なものなので市場投入して勝てると思います 取りあえず今はバッチで自動的にレース5分前に予測して結果保存してるんで、その集計結果と過去集計との比較だな。
フォワードとバックの結果が違うならどっかリークしてる。 >>349
俺も血統はオカルトだと思ってる
変数重要度で見てると意外と効いてるから不思議
多分疑似相関なんだけど 重視するべきファクターが理解できていない下手糞は
まともに予想できるAIなんて作れん
上手い奴に乗るだけのオッズ予想でもしとけよ 10年くらい?の芝レースで産駒が1000回以上出走した種牡馬の予測誤差使ってテキトーにつけた点数で10傑出したらこうなったw
https://imgur.com/8kWDJA0
やっぱ競馬はハービンジャー! なんだろ・・ヨーロッパ血統が多いな
そういう馬が出走するレースの予測が上手くできて無いってことかな ID:gZ3RBxLT0
こいつのドヤ知識だけのスレになってるな解散 ID:gZ3RBxLT0は本当馬鹿だな
「んで」「敵に塩を送る」とか普通に使ってるし
自己満横文字にしても頭悪すぎちゃんでしょ
今週土日の成績出してみろっつーの ドヤ知識自己満野郎はまず月単位で勘弁してやるから
回収率と的中率貼ってみろやって事よ 競艇競輪競馬の3択でいくと
一番作り辛いジャンルに思うけど
逆に競艇競輪辺りからはじめようと思ったりはせんのか >>356
>>358
お前は解散と言ったり回収率貼ってみろと言ったりどっちなんだよw
こっちも毎度毎度「訂正」賜るの忍びないから一人で勝手に解散してろw
解散でいいからお前は二度とレスすんなよ 俺にドヤってると言われたのそんなに効いちゃったのかねw
そのまんまオウム返ししてくんだもんな
罵倒のボキャブラリーとバリエーションに乏しいのも可哀そうなとこあるね 下手糞は新馬戦の予想AIでも作れ
新馬戦が予想ファクターが一番少ない
まずは簡単な条件で結果をだせよ
新馬戦で結果がでないならもっと複雑な条件じゃ無理 新馬戦こそオッズ買いで勝てる
もちろん全レースやるわけじゃなく
本命党なら堅そうなレース穴党なら荒れそうなレースだけ絞って買う >>361
横からだが、お前の長文書き込みのが
ウザいと思うよ あくまでも初心者スレなんだから
専門用語ばっかり使ってるから空気読めないんだなって思ったわ
>>362
新馬戦は陣営の思惑が絡んでるからデータ化なんて無理でしょ >>363
松風やアルファはガチで殺されてもおかしくないだろ >>364
そりゃそうだ
新馬戦のオッズは競馬村の評価だからな
ある意味オッズがファクターとして一番機能するレース
そこに血統、調教、厩舎等のデータを加えてAI予想すんだよ
これならしょうもねぇファクターを使ってAI予想するよりマシな予想になるだろ >>365
「何の」初心者スレだと思ってんだ?
>>29
>>38
辺り読めば>>1は俺が書いてることぐらい理解できる知識持ってることぐらいは推察出来るわ
現に俺とレス交わした人達はまともにやり取り出来てるんだから俺の言ってること理解してくれてるよ?
お前やID:jWCLG6jZ0みたいな話を理解できない癖に他人の揚げ足取りたい文句は言いたいってだけの連中はいちいち横から口出して来なくていいよ
話の中身が理解できず内容に言及できないから言葉遣い論ったり長文どうの専門用語どうのとしか言えねえんだろw
何が専門用語だwこんなもん本職から見たら幼稚園児のじゃれ合いにも及ばないわ
話の意味分かんなくて悔しいなら勉強して来い つーかね、このスレは競馬AIスレで、俺は1やID:nOBsx5lJ0やID:rmDBPdr50みたいにまともに機械学習の話出来る人と話したいから意図的にそれなりの用語を使ってんの
こういうスレは他に無いのにしょーもない冷やかししか出来ない馬鹿しかいないんじゃつまんないし意味ねーだろ
機械学習初心者が専門用語を気にせずレスできるスレなんか競馬板のそこら中に転がってんだからそっちで仲良くやってろよ まずよ
競馬の予想もまともにできねーくせに
まともな予想AIなんて作れんだろ
機械学習の知識より競馬の知識増やせよw 競馬AIなんて作ったって競馬なんて勝てる訳ないよ
何故なら過去と未来は違うのだから
うまお 統計の再現性
これがわからん馬鹿ってなんで競馬やってるんだ?
競馬新聞の馬柱も見ずに予想して馬券買ってるマヌケかw 自分が話したいことから逸れないようにするためには荒らしレスを楽しむことだね
掲示板から荒らしがいなくなることは永遠にない
AI作りだと俺が作ってるオッズ解析型システムとはちょっと方向性がズレるかな 回収率プラス画像なんて検索すれば誰でも貼れるものに意味があるのか?w
御託に中身があるかだけだよ意味があるのは 昔PAT画像貼ったらそれを上回る画像を貼り返してきて、他サイトの転載を違う人に指摘されて逃亡した奴がいたのを思い出したw
まあ荒らしの実力なんてそんなもんでしょ
実力があるなら荒らす必要もなければPAT貼れなんて言う必要もない 1年通しての年間回収率がプラスじゃないと無意味だな
G1しかやらないなら1年間のG1成績でもいい
1つのレースを解析してスパッと競馬やめれる奴はいないのだから >>376
逃げちゃったwこいつ顔真っ赤にして逃げちゃったwwwww 荒らし無敵の戦法
貼る→「それがお前のものという証明はできない!」
貼らない→「逃げた!」
レース出ないから無敗の馬みたいなもんだな >>379
予想に関連する何かを書き込んでくれたらどのくらいの見識の持ち主かが俺や他の読んでる人に伝わるだろうから話はそれからだな これが俺の今日のAI馬券!
■ガチで期待値の高い馬
推奨馬券は複勝※的中率55%前後、回収率110%前後
20210619 hanshin 03R 8
20210619 tokyo 03R 1
20210619 sapporo 04R 12
20210619 hanshin 05R 11
20210619 sapporo 06R 3
20210619 sapporo 07R 4
20210619 tokyo 07R 12
20210619 hanshin 08R 8
20210619 tokyo 08R 8
20210619 tokyo 09R 8
20210619 sapporo 10R 5
■堅い馬券
推奨馬券は馬連※的中率10%前後、回収率105%〜108%
一番左の馬が軸、2番目の-の間が馬連紐、一番右の欄が3連系の紐
20210619 hanshin 03R 7-8 15-8 5 11 4 15 12 10 14 6 1 9
20210619 hanshin 03R 7-8-8 5 11 4 15 12 10 14 6 1 9
20210619 hanshin 05R 9-11-7 10 16 1 12 14 2 6 15 8
20210619 hanshin 05R 9-12-7 10 16 1 12 14 2 6 15 8
20210619 sapporo 07R 5-4 1-4 1 10 9 2 6 14 12 3 8 7 11
20210619 sapporo 07R 5-4-4 1 10 9 2 6 14 12 3 8 7 11
20210619 tokyo 07R 8-12 14-12 13 9 16 14 15 4 2 11 10
20210619 tokyo 07R 8-12-12 13 9 16 14 15 4 2 11 10
20210619 hanshin 08R 5-8 6-8 1 3 6 4 2 7
20210619 hanshin 08R 5-8-8 1 3 6 4 2 7
20210619 tokyo 09R 3-8-8 10 6 9 5 1 12 11 4 2
20210619 sapporo 10R 2-5 8-5 6 8 7 1 4 3
20210619 sapporo 10R 2-5-5 6 8 7 1 4 3 >>382は>>1ですか?
勝っても負けても荒らすだけが生きがいの残念な人に負けずがんばってください 本当に勝ちを証明してるAI馬券師って松風以外におるん? >>385
3,4番人気もあったけど人気上がったみたいですね。
ただし人気が上がっても期待値は高いので問題無いです。
多分ですが、阪神3、東京3、8、9はレースまでに人気は落ちる可能性が高いです。 阪神1R「1位・2位・4位」決着で本日の勝ち確定。
前日予想でこの精度だから俺のAIは良いね。 東京2Rは8-11が断然だから1点でブッ混んだ
期待値高杉 札幌3Rは「13か11が勝つ」
前提で買うべきだよん >>389
先に出して外れると荒らしが湧くから当たったときもしくは近いときに後出しで教えてもらえたらありがたいです
どの馬を買ってるかわかれば自分のシステムと比較できて十分ですので >>393
幸先良いスタートです!
20倍以下の指数上位3頭位でワイドも買うと的中率30~35%、回収率120〜130%で安定します 札幌4ゆま軸1着11.5
当たりが止まるまで追いかける価値あり ドレフォンとか新種牡馬のデータ無いけどどうやって補填してんだろ
阪神5とかドレフォンのダートのデータ無いから1人気の馬が評価されないだけな気も >>396
単にプラマイゼロか、系統のデータを足すかだけでは >>397
そうだよね
トータルで見たら誤差レベルなんだろうけど1戦を細かく見たら阪神5の11にぶっ込むのは危険な気がして
まぁ9も人気し過ぎな気もするし 予測システムがあるなら主観は入れない方がいい
もしその考えが合ってたなら次回以降の修正に組み込むべきと思いますが 惜しかったね
9-11の馬連と9-11流しで3単取れたありがとう 阪神6Rは6-7流しで仕方ない。
まあ6か7が勝つ。 札幌7ゆま軸メイショウオニユリとかぶりましたね
オッズめっちゃ落ちそう 今日のAI成績
まあようやってるかなあ
豆券じゃなくてもっと3練炭とか買いたいなあ
https://i.imgur.com/tnFNcAr.png >>409
>>410
回収率がプラスになるならほっとけばプラスになるのでは? >>369
その知識を活かして勝てるシステムは構築できたの?
興味があるのは専門用語じゃなくてそこなんだけど >>382
下の方は見てないからわからないけど上のプラス収支おめ!
丸乗りはしてないけど参考にさせていただきましたありがとう! AI作ってから金が減りにくくなっていい感じ
まだ増えるのは無理だが 自分は英語が読めずにAI作成を諦めたんだけど結果を元に思考を補正してくれるプログラムってそんな簡単に作れるの?
大量のデータを元に適当な項目で数値を出すだけならプログラマの自分には簡単だけど
そもそも有料で売られているAIって本当の意味でのAIなのか? ■ このスレッドは過去ログ倉庫に格納されています