EXKLUZIVNĚ: Šoky a zklamání: Srovnání efektivity bookmakerů během mistrovství světa 2022
05.06.2023 20:00
Přinášíme vám exkluzivní překlad odborného článku od sázkového analytika Josepha Buchdahla, který spravuje webové stránky www.football-data.co.uk, na kterém poskytuje historické výsledky, zápasové statistiky a údaje o kurzech. Je také autorem knih Fixed Odds Sports Betting: Statistical Forecasting & Risk Management (2003), How to Find a Black Cat in a Coal Cellar: The Truth about Sports Tipsters (2013) a Squares & Sharps, Suckers & Sharks: The Science, Psychology & Philosophy of Gambling (2016).
- Srovnání kurzů na mistrovství světa 2022
- Pochopení predikčních modelů
- Co je to efektivita kurzů?
- Šoky a zklamání: část druhá
Joseph Buchdahl zkoumá předpovědní modely a efektivitu kurzů během mistrovství světa ve fotbale 2022 a odhaluje, jak blízko byly predikční modely Pinnaclu skutečné pravděpodobnosti. Čtěte dál a dozvíte se, jak jeho bookmakeři předpovídají výsledky, a jak si vedli ve srovnání s konkurencí.
Využití trhů mistrovství světa pro srovnání efektivity kurzů stanovených bookmakery
V první části této dvoudílné série jsme se dívali na faktor překvapení uplynulého mistrovství světa ve fotbale. Ukázal jsem vám, jak lze pomocí simulace metody Monte Carlo odhalit škálu možných výsledků zápasů mistrovství světa, pravděpodobnostní kombinace všech 64 zápasů na jednom tiketu a jejich pravděpodobnost.
Na závěr jsem argumentoval, že podle názoru Pinnaclu byly výsledky zápasů (celkově vzato) sice méně pravděpodobné, než se očekávalo, ale ne až tak moc.
Překvapivé výsledky nebo špatný predikční model?
Pinnacle však představuje pouze jeden z pohledů na to, co bychom mohli od mistrovství světa očekávat. Každý sázkař má, stejně jako společnosti zabývající se předpovědí dat a jiné sázkové kanceláře, vlastní názor.
Náhoda může přinést velká překvapení
A to, co právě oni považují za očekávané, následně ovlivní, jestli se výsledek zápasu bude jevit jako překvapivý nebo ne. Naše následné překvapení (nebo očekávání) může pomoci určit, jakou důvěru bychom měli vkládat do jakéhokoliv výchozího předpovědního modelu. Čím více jsme výsledkem překvapení, tím více bychom měli začít zpochybňovat náš model.
Je pravda, že aleatorní nejistota (náhoda) může přinést velká překvapení bez zjevné příčiny, ale čím větší překvapení ve výsledku je, tím větší je pravděpodobnost, že existuje nějaká příčina a nejvíce se nabízí možnost špatného modelu.
Tento druh statistického testování je v podstatě tou samou metodou, kterou jsme dříve použili při analyzování toho, zda je sázkař dobrý nebo má prostě jen štěstí.
Jaký je dobrý předpovědní model?
Dobrý predikční model by měl být schopen reflektovat skutečné výsledky. Je zřejmé, že na bázi jednotlivých utkání je to nemožné, protože výsledky jsou binární (buď nastanou – 1, nebo nenastanou – 0), zatímco předpovědi jsou pravděpodobnostní.
Pokud se ale na vzorku více zápasů procento skutečných výher v zásadě shoduje s očekávaným počtem vítězství, můžeme říci, že je predikční model dobrý. V tomto směru se Pinnacle velmi osvědčil. Jejich kurzy a s nimi spojené pravděpodobnosti se velmi těsně blíží skutečným procentům vítězství v jednotlivých zápasech. Jejich kurzy jsou tedy efektivní, jednoduše řečeno přesné.
Čím větší vzorek máme k dispozici, tím snazší je oddělit epistemickou nejistotu (chyba v platnosti předpovědního modelu) od nejistoty aleatorní.
Pinnacle proti zbytku
64 zápasů MS nepředstavuje zrovna největší vzorek, ale pojďme si na jeho základě porovnat pohled Pinnacle s několika jinými sázkovými kancelářemi. Za tímto účelem jsem provedl stejnou simulaci Monte Carlo, kterou jsem popsal v mém prvním článku u dalších 23 online sázkových kanceláří a také u průměru trhu.
Pro každou z nich jsem spočítal procento pravděpodobností kombinované sázky (64 zápasů na jednom tiketu), které byly menší (překvapivější) než pozorovaná pravděpodobnost, přičemž tyto pravděpodobnosti byly vypočteny pomocí implikovaných pravděpodobností zápasů definovaných kurzy sázkových kanceláří (po odečtení marže).
Zdroj: pinnacle.com
Připomeňme si, že u Pinnaclu bylo zhruba 20 % pravděpodobností kombinované sázky (všech 64 zápasů) menších, než pravděpodobnost, která byla zaznamenána ve skutečnosti. To znamená, že i když se svým způsobem jednalo o určité překvapení, nebylo až tak velké a statisticky významné.
Pokud toto číslo od Pinnaclu porovnáme s ostatními sázkovými kancelářemi, bude mezi nimi nejvyšší. O čem to vypovídá? O tom, že skutečné výsledky u ostatních sázkových kanceláří, které použily svůj vlastní pohled na to, jaká je pravděpodobnost jednotlivých zápasů, byly ve srovnání s Pinnacle mnohem překvapivější.
P-hodnota a důvěra v předpovědní model sázkové kanceláře
Tuto procentuální hodnotu můžeme považovat za statistickou p-hodnotu. Ta nám při testování statistické významnosti udává pravděpodobnost, s jakou se určitý soubor dat objeví čistě náhodou (aleatorní nejistota), a to za předpokladu, že je daná hypotéza pravdivá.
Pokud je p-hodnota dostatečně malá, řekněme 1 % nebo menší, můžeme s dostatečnou důvěrou říci, že je příliš malá na to, aby se něco reálně stalo pouhou náhodou. To znamená, že bychom měli od naší původní hypotézy upustit ve prospěch jiné. V tomto kontextu naše původní hypotéza byla, že pohled sázkové kanceláře na pravděpodobnost jednotlivých výsledků je validní a představuje pravdivý obraz skutečných pravděpodobností reálných výsledků.
Pokud je p-hodnota dostatečně malá, měli bychom přehodnotit naši důvěru v predikční model sázkové kanceláře. Ano, stále může dojít k nepravděpodobným výsledkům pouhou náhodou, ale čím menší pravděpodobnost je, tím pravděpodobnější je, že bookmakerův model je špatný.
Typická hranice p-hodnoty pro statistickou významnost je 1 %. Žádná sázková kancelář se s p-hodnotou nedostala na takovou úroveň. Výsledky fotbalového šampionátu byly přitom nejpřekvapivější u sázkové kanceláře BetVictor s p-hodnotou okolo 7 %. Přesto bychom však ani u ní pravděpodobně neměli hned vyvozovat závěr, že je její předpovědní model špatný. Nicméně, graf výše nabízí možnost vytvořit základní stupnici důvěry (nebo úroveň víry) v kvalitu či efektivitu kurzů, které sázkové kanceláře na zápasy mistrovství světa vypisovaly.
Jak jsem už zmínil, vzorek 64 zápasů je nejspíš příliš malý na to, abychom z něj mohli vyvozovat pevné závěry, ale přinejmenším kvalitativně potvrzuje to, co jsem tvrdil už v předchozích článcích (při analýze mnohem větších vzorků dat), totiž že Pinnacle má ty nejpřesnější nebo nejefektivnější kurzy na fotbalové zápasy.
Maximální věrohodnost
Filozoficky řečeno nám tyto p-hodnoty sdělují, jaká je pravděpodobnost, že se určitý soubor dat objeví čistě náhodou, za předpokladu, že je daná hypotéza pravdivá.
Pinnacle má nejnižší logaritmické skóre z mnoha sázkových kanceláří
Místo toho můžeme tento způsob uvažování obrátit. Místo testování pravděpodobnosti výskytu dat za předpokladu platnosti hypotézy, můžeme testovat pravděpodobnost platnosti hypotézy za předpokladu, že jsou daná data opravdu nejpravděpodobnější, která mohou být pozorována. Rozdíl mezi těmito dvěma přístupy jsem popisoval už dříve.
První přístup se nazývá frekvenční statistické testování, protože počítá frekvence daných dat. Druhý je příkladem bayesovské inference a konkrétně v tomto případě jde o metodu známou jako metoda maximální věrohodnosti.
Za předpokladu, že máme konkrétní sadu dat – v tomto případě výsledky 64 zápasů fotbalového šampionátu – jaké předpovědní pravděpodobnosti by byly potřeba, kdyby pozorované výsledky byly skutečně ty nejpravděpodobnější? Tato statistická metodika nejlepší shody je formálně známá jako metoda maximální věrohodnosti. Nehodlám vás nudit matematikou metody odhadu maximální věrohodnosti; stačí říct, že jsem ji provedl v první části této dvoudílné série při výpočtu záporného přirozeného logaritmu pravděpodobnosti kombinace skutečných výsledků ze 64 zápasů.
Průměrná hodnota 63,5 u Pinnaclu je to, čemu se říká hodnota logaritmu věrohodnosti. Pokud ji vydělíme velikostí vzorku, tedy 64, získáme číslo označované jako logaritmická ztráta. U Pinnaclu by tedy hodnota logaritmické ztráty na mistrovství světa byla 0,992. Čím nižší tato hodnota je, tím lepší je předpověď pravděpodobností. Dokonalá hodnota je 0. Absolutně nesprávná hodnota se pak rovná nekonečnu.
Funkce logaritmické ztráty je typem bodovacího pravidla, který se příliš neliší od Brierova skóre. Skóre ztrátového logaritmu pak můžeme interpretovat jako míru toho, jak špatné nebo jak vzdálené jsou předpovědi pravděpodobností od skutečných výsledků. Z jistého úhlu pohledu můžeme „ztrátu“ považovat za ztrátu jistoty.
Jak si stojí skóre logaritmické ztráty jiných sázkových kanceláří ve srovnání se společností Pinnacle? Pojďme se na to podívat. Následující histogram zobrazuje tato data:
Zdroj: pinnacle.com
Pinnacle má skóre logaritmické ztráty ze všech nejnižší. To znamená, že jejich model nejlépe zachycuje skutečné pravděpodobnosti výsledků. Jinými slovy, má nejpřesnější či nejefektivnější kurzy.
Můžete si všimnout, že sázkové kanceláře s nižším skóre logaritmické ztráty velmi dobře korelují s těmi, které mají vyšší p-hodnoty, a naopak. To podporuje myšlenku, že čím lepší predikční model je, tím méně bychom měli být skutečnými výsledky překvapeni.
Analýza zápasů mistrovství světa nabídla zajímavý způsob pro prozkoumání a otestování tohoto konceptu, o kterém se osobně domnívám, že má praktickou i filozofickou hodnotu. Pokud nás výsledky překvapují, může to znamenat, že jsou překvapivé. Stejně tak to ale může znamenat, že způsob, kterým jsme se snažili tyto výsledky předpovědět, byl chybný. Je však nutné připomenout, že vzorek 64 zápasů je malý. Možná, že měl Pinnacle se svou přesností v tomto případě jen štěstí. Ale možná také ne.
Ve své knize Monte Carlo or Bust: Simple Simulations for Aspiring Sports Bettors jsem analyzoval mnohem větší vzorek dat (sezónu Premier League 2019/20) se 380 zápasy a vypočítal jsem skóre logaritmické ztráty a došel jsem ke stejnému závěru: Pinnacle měl nejmenší skóre logaritmické ztráty ze všech. Nepochybuji o tom, že to samé by se potvrdilo i s větším vzorkem zápasových dat.
Efektivita kurzů a politika „Vítězové vítáni“
To, že má nejefektivnější či nejpřesnější předpovědní model znamená, že má Pinnacle nejefektivnější či nejpřesnější kurzy. Tento fakt má několik důležitých důsledků. Zaprvé to znamená, že je Pinnacle potenciálně nejtěžší porazit, protože sázkař může dlouhodobě vydělávat pouze za předpokladu, že Pinnacle dělá chyby.
Nicméně žádná sázková kancelář nedokáže nastavit dokonale efektivní kurzy a všichni určitě víme, že Pinnacle využívá několika málo zákazníků, kteří jej dokáží porazit, ke zefektivnění kurzů.
Jedním z důvodů, proč má Pinnacle nejpřesnější kurzy, je kromě utrácení významných prostředků na analýzu dat také začlenění znalostí těchto extrémně úspěšných sázkařů do svých prognostických modelů.
Zadruhé to však znamená také to, že být dobrým sázkařem u Pinnaclu, na rozdíl od ostatních sázkových kanceláří, nevede k omezení či uzavření účtu. Kurzy rekreačních sázkových kanceláří je sice snazší porazit, ale pokud vám nebude umožněno sázet, když je porážíte, je tato výhoda zcela iluzorní.
Závěr
Moje analýza zápasů ze světového šampionátu přinesla zajímavé poznatky ohledně významu překvapení ve sportu a posílila přesvědčení, že Pinnacle nabízí nejpřesnější kurzy na fotbalové zápasy. Čtvrt století po založení společnosti s cílem poskytovat přesné kurzy a vyzvat sázkaře, aby se je pokusili překonat, pokračuje Pinnacle v tom, co umí nejlépe, a dělá to lépe než kdokoliv jiný.
Další zajímavé články od stejného autora
SynotTip registrace | Jak se zaregistrovat na SynotTipu?
25.08.2024 09:15 SynotTip se řadí mezi ty nejznámější sázkové kanceláře u nás. Původem uherskohradišťská společnost si na trhu vybudovala velmi silné postavení a je také sponzorem několika sportovních týmů. Chcete-li si vyzkoušet, jak se u ní sází, budete se nejdříve muset zaregistrovat. A právě registraci na SynotTipu se věnuje náš článek níže. Čtěte dál a dozvíte se vše, co o ní potřebujete vědět. Registrace na počítači Není pochyb o tom, že nejrychlejší a…
Chance registrace | Jak na to?
25.08.2024 09:00 Pro mnohé z vás určitě není Chance žádnou neznámou. Aby taky byla, vždyť se řadí mezi vůbec nejstarší sázkové kanceláře v Česku. Pokud si v ní chcete vsadit i vy, musíte se samozřejmě nejdříve zaregistrovat. Jak na to a co všechno budete muset vykonat? Přesně to se dozvíte v našem článku níže. Registrace z PC Za nás tím vůbec nejrychlejším a jednoznačně nejpohodlnějším způsobem registrace na Chanci je pomocí počítače. Na něm je totiž vše…
forBET – registrační bonus 100 Kč
19.08.2024 12:00 Trh s licencovanými sázkovými kancelářemi v Česku se neustále rozšiřuje. Jedním z novějších přírůstků je původem polská sázková kancelář forBET. Aby přilákala nové sázkaře, nabízí samozřejmě i ona registrační bonus, který můžete využít pro své první krůčky v ní. Jaký tento bonus je a jak ho můžete získat? Čtěte dál a vše se dozvíte! Registrační bonus 100 Kč Mezi sázkaři jsou obecně nejvíce vyhledávané registrační bonusy. To samozřejmě dává…
Synot Tip – bonus 500 bodů a „Sázka bez rizika“ až 500 Kč
15.08.2024 12:00 Synot Tip je jednou z nejdéle působících sázkových kanceláří na našem trhu. Svou dlouhou tradici udržuje nejen pomocí kvalitních služeb, ale také velmi zajímavou bonusovou nabídkou. Co za registraci v Synot Tipu můžete získat? To se dozvíte v našem článku. 500 Benefit Bodů za registraci Pokud byste se sázkařů zeptali, jaké bonusy mají nejraději, rozhodně by většina z nich ukázala na registrační bonus. Právě tento bonus totiž přináší možnost si…
SazkaBet – bonus 500 Kč za plnou registraci + vkladový bonus
12.08.2024 12:00 Sazka je nejstarším poskytovatelem hazardních her u nás. Kromě oblíbených loterií provozuje samozřejmě také sázkovou kancelář nebo online casino. V sázkové kanceláři SazkaBet na vás čeká obzvlášť zajímavý bonus. Zjistěte společně s námi, co můžete získat. 500 Kč od SazkaBetu za registraci Nejoblíbenějším bonusem u všech sázkových kanceláří je samozřejmě registrační bonus. Díky němu si můžete rychle vyzkoušet, jak vám bude sedět sázení u dané…