EXKLUZIVNĚ: Šoky a zklamání: Srovnání efektivity bookmakerů během mistrovství světa 2022
05.06.2023 20:00
Přinášíme vám exkluzivní překlad odborného článku od sázkového analytika Josepha Buchdahla, který spravuje webové stránky www.football-data.co.uk, na kterém poskytuje historické výsledky, zápasové statistiky a údaje o kurzech. Je také autorem knih Fixed Odds Sports Betting: Statistical Forecasting & Risk Management (2003), How to Find a Black Cat in a Coal Cellar: The Truth about Sports Tipsters (2013) a Squares & Sharps, Suckers & Sharks: The Science, Psychology & Philosophy of Gambling (2016).
- Srovnání kurzů na mistrovství světa 2022
- Pochopení predikčních modelů
- Co je to efektivita kurzů?
- Šoky a zklamání: část druhá
Joseph Buchdahl zkoumá předpovědní modely a efektivitu kurzů během mistrovství světa ve fotbale 2022 a odhaluje, jak blízko byly predikční modely Pinnaclu skutečné pravděpodobnosti. Čtěte dál a dozvíte se, jak jeho bookmakeři předpovídají výsledky, a jak si vedli ve srovnání s konkurencí.
Využití trhů mistrovství světa pro srovnání efektivity kurzů stanovených bookmakery
V první části této dvoudílné série jsme se dívali na faktor překvapení uplynulého mistrovství světa ve fotbale. Ukázal jsem vám, jak lze pomocí simulace metody Monte Carlo odhalit škálu možných výsledků zápasů mistrovství světa, pravděpodobnostní kombinace všech 64 zápasů na jednom tiketu a jejich pravděpodobnost.
Na závěr jsem argumentoval, že podle názoru Pinnaclu byly výsledky zápasů (celkově vzato) sice méně pravděpodobné, než se očekávalo, ale ne až tak moc.
Překvapivé výsledky nebo špatný predikční model?
Pinnacle však představuje pouze jeden z pohledů na to, co bychom mohli od mistrovství světa očekávat. Každý sázkař má, stejně jako společnosti zabývající se předpovědí dat a jiné sázkové kanceláře, vlastní názor.
Náhoda může přinést velká překvapení
A to, co právě oni považují za očekávané, následně ovlivní, jestli se výsledek zápasu bude jevit jako překvapivý nebo ne. Naše následné překvapení (nebo očekávání) může pomoci určit, jakou důvěru bychom měli vkládat do jakéhokoliv výchozího předpovědního modelu. Čím více jsme výsledkem překvapení, tím více bychom měli začít zpochybňovat náš model.
Je pravda, že aleatorní nejistota (náhoda) může přinést velká překvapení bez zjevné příčiny, ale čím větší překvapení ve výsledku je, tím větší je pravděpodobnost, že existuje nějaká příčina a nejvíce se nabízí možnost špatného modelu.
Tento druh statistického testování je v podstatě tou samou metodou, kterou jsme dříve použili při analyzování toho, zda je sázkař dobrý nebo má prostě jen štěstí.
Jaký je dobrý předpovědní model?
Dobrý predikční model by měl být schopen reflektovat skutečné výsledky. Je zřejmé, že na bázi jednotlivých utkání je to nemožné, protože výsledky jsou binární (buď nastanou – 1, nebo nenastanou – 0), zatímco předpovědi jsou pravděpodobnostní.
Pokud se ale na vzorku více zápasů procento skutečných výher v zásadě shoduje s očekávaným počtem vítězství, můžeme říci, že je predikční model dobrý. V tomto směru se Pinnacle velmi osvědčil. Jejich kurzy a s nimi spojené pravděpodobnosti se velmi těsně blíží skutečným procentům vítězství v jednotlivých zápasech. Jejich kurzy jsou tedy efektivní, jednoduše řečeno přesné.
Čím větší vzorek máme k dispozici, tím snazší je oddělit epistemickou nejistotu (chyba v platnosti předpovědního modelu) od nejistoty aleatorní.
Pinnacle proti zbytku
64 zápasů MS nepředstavuje zrovna největší vzorek, ale pojďme si na jeho základě porovnat pohled Pinnacle s několika jinými sázkovými kancelářemi. Za tímto účelem jsem provedl stejnou simulaci Monte Carlo, kterou jsem popsal v mém prvním článku u dalších 23 online sázkových kanceláří a také u průměru trhu.
Pro každou z nich jsem spočítal procento pravděpodobností kombinované sázky (64 zápasů na jednom tiketu), které byly menší (překvapivější) než pozorovaná pravděpodobnost, přičemž tyto pravděpodobnosti byly vypočteny pomocí implikovaných pravděpodobností zápasů definovaných kurzy sázkových kanceláří (po odečtení marže).
Zdroj: pinnacle.com
Připomeňme si, že u Pinnaclu bylo zhruba 20 % pravděpodobností kombinované sázky (všech 64 zápasů) menších, než pravděpodobnost, která byla zaznamenána ve skutečnosti. To znamená, že i když se svým způsobem jednalo o určité překvapení, nebylo až tak velké a statisticky významné.
Pokud toto číslo od Pinnaclu porovnáme s ostatními sázkovými kancelářemi, bude mezi nimi nejvyšší. O čem to vypovídá? O tom, že skutečné výsledky u ostatních sázkových kanceláří, které použily svůj vlastní pohled na to, jaká je pravděpodobnost jednotlivých zápasů, byly ve srovnání s Pinnacle mnohem překvapivější.
P-hodnota a důvěra v předpovědní model sázkové kanceláře
Tuto procentuální hodnotu můžeme považovat za statistickou p-hodnotu. Ta nám při testování statistické významnosti udává pravděpodobnost, s jakou se určitý soubor dat objeví čistě náhodou (aleatorní nejistota), a to za předpokladu, že je daná hypotéza pravdivá.
Pokud je p-hodnota dostatečně malá, řekněme 1 % nebo menší, můžeme s dostatečnou důvěrou říci, že je příliš malá na to, aby se něco reálně stalo pouhou náhodou. To znamená, že bychom měli od naší původní hypotézy upustit ve prospěch jiné. V tomto kontextu naše původní hypotéza byla, že pohled sázkové kanceláře na pravděpodobnost jednotlivých výsledků je validní a představuje pravdivý obraz skutečných pravděpodobností reálných výsledků.
Pokud je p-hodnota dostatečně malá, měli bychom přehodnotit naši důvěru v predikční model sázkové kanceláře. Ano, stále může dojít k nepravděpodobným výsledkům pouhou náhodou, ale čím menší pravděpodobnost je, tím pravděpodobnější je, že bookmakerův model je špatný.
Typická hranice p-hodnoty pro statistickou významnost je 1 %. Žádná sázková kancelář se s p-hodnotou nedostala na takovou úroveň. Výsledky fotbalového šampionátu byly přitom nejpřekvapivější u sázkové kanceláře BetVictor s p-hodnotou okolo 7 %. Přesto bychom však ani u ní pravděpodobně neměli hned vyvozovat závěr, že je její předpovědní model špatný. Nicméně, graf výše nabízí možnost vytvořit základní stupnici důvěry (nebo úroveň víry) v kvalitu či efektivitu kurzů, které sázkové kanceláře na zápasy mistrovství světa vypisovaly.
Jak jsem už zmínil, vzorek 64 zápasů je nejspíš příliš malý na to, abychom z něj mohli vyvozovat pevné závěry, ale přinejmenším kvalitativně potvrzuje to, co jsem tvrdil už v předchozích článcích (při analýze mnohem větších vzorků dat), totiž že Pinnacle má ty nejpřesnější nebo nejefektivnější kurzy na fotbalové zápasy.
Maximální věrohodnost
Filozoficky řečeno nám tyto p-hodnoty sdělují, jaká je pravděpodobnost, že se určitý soubor dat objeví čistě náhodou, za předpokladu, že je daná hypotéza pravdivá.
Pinnacle má nejnižší logaritmické skóre z mnoha sázkových kanceláří
Místo toho můžeme tento způsob uvažování obrátit. Místo testování pravděpodobnosti výskytu dat za předpokladu platnosti hypotézy, můžeme testovat pravděpodobnost platnosti hypotézy za předpokladu, že jsou daná data opravdu nejpravděpodobnější, která mohou být pozorována. Rozdíl mezi těmito dvěma přístupy jsem popisoval už dříve.
První přístup se nazývá frekvenční statistické testování, protože počítá frekvence daných dat. Druhý je příkladem bayesovské inference a konkrétně v tomto případě jde o metodu známou jako metoda maximální věrohodnosti.
Za předpokladu, že máme konkrétní sadu dat – v tomto případě výsledky 64 zápasů fotbalového šampionátu – jaké předpovědní pravděpodobnosti by byly potřeba, kdyby pozorované výsledky byly skutečně ty nejpravděpodobnější? Tato statistická metodika nejlepší shody je formálně známá jako metoda maximální věrohodnosti. Nehodlám vás nudit matematikou metody odhadu maximální věrohodnosti; stačí říct, že jsem ji provedl v první části této dvoudílné série při výpočtu záporného přirozeného logaritmu pravděpodobnosti kombinace skutečných výsledků ze 64 zápasů.
Průměrná hodnota 63,5 u Pinnaclu je to, čemu se říká hodnota logaritmu věrohodnosti. Pokud ji vydělíme velikostí vzorku, tedy 64, získáme číslo označované jako logaritmická ztráta. U Pinnaclu by tedy hodnota logaritmické ztráty na mistrovství světa byla 0,992. Čím nižší tato hodnota je, tím lepší je předpověď pravděpodobností. Dokonalá hodnota je 0. Absolutně nesprávná hodnota se pak rovná nekonečnu.
Funkce logaritmické ztráty je typem bodovacího pravidla, který se příliš neliší od Brierova skóre. Skóre ztrátového logaritmu pak můžeme interpretovat jako míru toho, jak špatné nebo jak vzdálené jsou předpovědi pravděpodobností od skutečných výsledků. Z jistého úhlu pohledu můžeme „ztrátu“ považovat za ztrátu jistoty.
Jak si stojí skóre logaritmické ztráty jiných sázkových kanceláří ve srovnání se společností Pinnacle? Pojďme se na to podívat. Následující histogram zobrazuje tato data:
Zdroj: pinnacle.com
Pinnacle má skóre logaritmické ztráty ze všech nejnižší. To znamená, že jejich model nejlépe zachycuje skutečné pravděpodobnosti výsledků. Jinými slovy, má nejpřesnější či nejefektivnější kurzy.
Můžete si všimnout, že sázkové kanceláře s nižším skóre logaritmické ztráty velmi dobře korelují s těmi, které mají vyšší p-hodnoty, a naopak. To podporuje myšlenku, že čím lepší predikční model je, tím méně bychom měli být skutečnými výsledky překvapeni.
Analýza zápasů mistrovství světa nabídla zajímavý způsob pro prozkoumání a otestování tohoto konceptu, o kterém se osobně domnívám, že má praktickou i filozofickou hodnotu. Pokud nás výsledky překvapují, může to znamenat, že jsou překvapivé. Stejně tak to ale může znamenat, že způsob, kterým jsme se snažili tyto výsledky předpovědět, byl chybný. Je však nutné připomenout, že vzorek 64 zápasů je malý. Možná, že měl Pinnacle se svou přesností v tomto případě jen štěstí. Ale možná také ne.
Ve své knize Monte Carlo or Bust: Simple Simulations for Aspiring Sports Bettors jsem analyzoval mnohem větší vzorek dat (sezónu Premier League 2019/20) se 380 zápasy a vypočítal jsem skóre logaritmické ztráty a došel jsem ke stejnému závěru: Pinnacle měl nejmenší skóre logaritmické ztráty ze všech. Nepochybuji o tom, že to samé by se potvrdilo i s větším vzorkem zápasových dat.
Efektivita kurzů a politika „Vítězové vítáni“
To, že má nejefektivnější či nejpřesnější předpovědní model znamená, že má Pinnacle nejefektivnější či nejpřesnější kurzy. Tento fakt má několik důležitých důsledků. Zaprvé to znamená, že je Pinnacle potenciálně nejtěžší porazit, protože sázkař může dlouhodobě vydělávat pouze za předpokladu, že Pinnacle dělá chyby.
Nicméně žádná sázková kancelář nedokáže nastavit dokonale efektivní kurzy a všichni určitě víme, že Pinnacle využívá několika málo zákazníků, kteří jej dokáží porazit, ke zefektivnění kurzů.
Jedním z důvodů, proč má Pinnacle nejpřesnější kurzy, je kromě utrácení významných prostředků na analýzu dat také začlenění znalostí těchto extrémně úspěšných sázkařů do svých prognostických modelů.
Zadruhé to však znamená také to, že být dobrým sázkařem u Pinnaclu, na rozdíl od ostatních sázkových kanceláří, nevede k omezení či uzavření účtu. Kurzy rekreačních sázkových kanceláří je sice snazší porazit, ale pokud vám nebude umožněno sázet, když je porážíte, je tato výhoda zcela iluzorní.
Závěr
Moje analýza zápasů ze světového šampionátu přinesla zajímavé poznatky ohledně významu překvapení ve sportu a posílila přesvědčení, že Pinnacle nabízí nejpřesnější kurzy na fotbalové zápasy. Čtvrt století po založení společnosti s cílem poskytovat přesné kurzy a vyzvat sázkaře, aby se je pokusili překonat, pokračuje Pinnacle v tom, co umí nejlépe, a dělá to lépe než kdokoliv jiný.
Další zajímavé články od stejného autora
SazkaBet přihlášení
27.05.2024 12:00 Základem každého sázkaře je jeho účet u sázkové kanceláře. Bez něho jednoduše není možné sázet a vyhrávat. Ani ti z vás, kteří využívají naše profesionální sázkové servisy, se bez účtu neobejdou. Pro zajištění přístupu do účtu je nutné se do něj přihlásit. V našem článku si proto ukážeme, jak se přihlásit do účtu u SazkaBet. Čtěte dál a dozvíte se, jak na to! Přihlášení do SazkaBet účtu z PC První způsob přihlášení k SazkaBet účtu je z…
SazkaBet Maraton | Každý měsíc hra o zajímavé ceny
27.05.2024 12:00 Společnost Sazka je nejdéle působícím poskytovatelem hazardních her na našem trhu. Za dobu své existence si již prošla mnohými změnami, mezi které patří mimo jiné také spuštění populární sázkové kanceláře SazkaBet. Tam se můžete účastnit mnoha zajímavých soutěží, mezi kterými můžete každý měsíc objevit také oblíbený SazkaBet maraton. O co vlastně jde a na co se v něm můžete těšit? Zajímavé ceny každý měsíc SazkaBet Maraton patří k dlouhodobým…
Jak vybrat peníze z MerkurXtip?
27.05.2024 12:00 Ruku na srdce. Nikdo od sázení neočekává nic jiného než výhry. Právě pro ten pocit většina z nás sází a je tím, co od sázení očekáváme. Ještě, než vám však peníze ze zeleného tiketu dorazí na bankovní účet, musíte si zažádat o jejich výplatu. To samozřejmě platí u sázkové kanceláře MerkurXtip a my vám v článku ukážeme, jak při jejich výplatě postupovat. Možnosti výběru V poslední době si mnoho hráčů vzniklo, že sázkové kanceláře nabízejí mnoho…
Chance podpora – kontakty a s čím umí poradit?
23.05.2024 08:00 Klasické kamenné sázkové kanceláře či casina jsou již pomalu vyhynulým druhem. Všechno dění se pomalu, ale jistě přesunuje na internet. To vyžaduje nemalou dávku technologické zdatnosti a jak víme, technologie ne vždy fungují tak, jak chceme. Právě proto nabízí sázkové kanceláře propracovanou technickou podporu, která je řeší. Pojďte se s námi podívat, jak funguje u Chance. Kontakty na zákaznickou podporu Chance Jenom těžko si dnes představit…
Registrace forBet | Jak se zaregistrovat ve forBet?
20.05.2024 12:00 Na českém trhu sázkových kanceláří samozřejmě vévodí dobře zavedená jména. Když se tedy objeví někdo nový, je to pro hráče vždy zajímavá možnost pro rozšíření svých sázkařských obzorů. Jedním z nováčkům je například polský forBet, který si začíná utvářet slušnou základnu sázkařů. Pojďte se s námi podívat, jak se na něm můžete zaregistrovat i vy. Registrace na počítači Jako u všech sázkových kanceláří i u forBet platí, že tím nejpohodlnějším a…