EXKLUZIVNĚ: Šoky a zklamání: Srovnání efektivity bookmakerů během mistrovství světa 2022
05.06.2023 20:00
Přinášíme vám exkluzivní překlad odborného článku od sázkového analytika Josepha Buchdahla, který spravuje webové stránky www.football-data.co.uk, na kterém poskytuje historické výsledky, zápasové statistiky a údaje o kurzech. Je také autorem knih Fixed Odds Sports Betting: Statistical Forecasting & Risk Management (2003), How to Find a Black Cat in a Coal Cellar: The Truth about Sports Tipsters (2013) a Squares & Sharps, Suckers & Sharks: The Science, Psychology & Philosophy of Gambling (2016).
- Srovnání kurzů na mistrovství světa 2022
- Pochopení predikčních modelů
- Co je to efektivita kurzů?
- Šoky a zklamání: část druhá
Joseph Buchdahl zkoumá předpovědní modely a efektivitu kurzů během mistrovství světa ve fotbale 2022 a odhaluje, jak blízko byly predikční modely Pinnaclu skutečné pravděpodobnosti. Čtěte dál a dozvíte se, jak jeho bookmakeři předpovídají výsledky, a jak si vedli ve srovnání s konkurencí.
Využití trhů mistrovství světa pro srovnání efektivity kurzů stanovených bookmakery
V první části této dvoudílné série jsme se dívali na faktor překvapení uplynulého mistrovství světa ve fotbale. Ukázal jsem vám, jak lze pomocí simulace metody Monte Carlo odhalit škálu možných výsledků zápasů mistrovství světa, pravděpodobnostní kombinace všech 64 zápasů na jednom tiketu a jejich pravděpodobnost.
Na závěr jsem argumentoval, že podle názoru Pinnaclu byly výsledky zápasů (celkově vzato) sice méně pravděpodobné, než se očekávalo, ale ne až tak moc.
Překvapivé výsledky nebo špatný predikční model?
Pinnacle však představuje pouze jeden z pohledů na to, co bychom mohli od mistrovství světa očekávat. Každý sázkař má, stejně jako společnosti zabývající se předpovědí dat a jiné sázkové kanceláře, vlastní názor.
Náhoda může přinést velká překvapení
A to, co právě oni považují za očekávané, následně ovlivní, jestli se výsledek zápasu bude jevit jako překvapivý nebo ne. Naše následné překvapení (nebo očekávání) může pomoci určit, jakou důvěru bychom měli vkládat do jakéhokoliv výchozího předpovědního modelu. Čím více jsme výsledkem překvapení, tím více bychom měli začít zpochybňovat náš model.
Je pravda, že aleatorní nejistota (náhoda) může přinést velká překvapení bez zjevné příčiny, ale čím větší překvapení ve výsledku je, tím větší je pravděpodobnost, že existuje nějaká příčina a nejvíce se nabízí možnost špatného modelu.
Tento druh statistického testování je v podstatě tou samou metodou, kterou jsme dříve použili při analyzování toho, zda je sázkař dobrý nebo má prostě jen štěstí.
Jaký je dobrý předpovědní model?
Dobrý predikční model by měl být schopen reflektovat skutečné výsledky. Je zřejmé, že na bázi jednotlivých utkání je to nemožné, protože výsledky jsou binární (buď nastanou – 1, nebo nenastanou – 0), zatímco předpovědi jsou pravděpodobnostní.
Pokud se ale na vzorku více zápasů procento skutečných výher v zásadě shoduje s očekávaným počtem vítězství, můžeme říci, že je predikční model dobrý. V tomto směru se Pinnacle velmi osvědčil. Jejich kurzy a s nimi spojené pravděpodobnosti se velmi těsně blíží skutečným procentům vítězství v jednotlivých zápasech. Jejich kurzy jsou tedy efektivní, jednoduše řečeno přesné.
Čím větší vzorek máme k dispozici, tím snazší je oddělit epistemickou nejistotu (chyba v platnosti předpovědního modelu) od nejistoty aleatorní.
Pinnacle proti zbytku
64 zápasů MS nepředstavuje zrovna největší vzorek, ale pojďme si na jeho základě porovnat pohled Pinnacle s několika jinými sázkovými kancelářemi. Za tímto účelem jsem provedl stejnou simulaci Monte Carlo, kterou jsem popsal v mém prvním článku u dalších 23 online sázkových kanceláří a také u průměru trhu.
Pro každou z nich jsem spočítal procento pravděpodobností kombinované sázky (64 zápasů na jednom tiketu), které byly menší (překvapivější) než pozorovaná pravděpodobnost, přičemž tyto pravděpodobnosti byly vypočteny pomocí implikovaných pravděpodobností zápasů definovaných kurzy sázkových kanceláří (po odečtení marže).
Zdroj: pinnacle.com
Připomeňme si, že u Pinnaclu bylo zhruba 20 % pravděpodobností kombinované sázky (všech 64 zápasů) menších, než pravděpodobnost, která byla zaznamenána ve skutečnosti. To znamená, že i když se svým způsobem jednalo o určité překvapení, nebylo až tak velké a statisticky významné.
Pokud toto číslo od Pinnaclu porovnáme s ostatními sázkovými kancelářemi, bude mezi nimi nejvyšší. O čem to vypovídá? O tom, že skutečné výsledky u ostatních sázkových kanceláří, které použily svůj vlastní pohled na to, jaká je pravděpodobnost jednotlivých zápasů, byly ve srovnání s Pinnacle mnohem překvapivější.
P-hodnota a důvěra v předpovědní model sázkové kanceláře
Tuto procentuální hodnotu můžeme považovat za statistickou p-hodnotu. Ta nám při testování statistické významnosti udává pravděpodobnost, s jakou se určitý soubor dat objeví čistě náhodou (aleatorní nejistota), a to za předpokladu, že je daná hypotéza pravdivá.
Pokud je p-hodnota dostatečně malá, řekněme 1 % nebo menší, můžeme s dostatečnou důvěrou říci, že je příliš malá na to, aby se něco reálně stalo pouhou náhodou. To znamená, že bychom měli od naší původní hypotézy upustit ve prospěch jiné. V tomto kontextu naše původní hypotéza byla, že pohled sázkové kanceláře na pravděpodobnost jednotlivých výsledků je validní a představuje pravdivý obraz skutečných pravděpodobností reálných výsledků.
Pokud je p-hodnota dostatečně malá, měli bychom přehodnotit naši důvěru v predikční model sázkové kanceláře. Ano, stále může dojít k nepravděpodobným výsledkům pouhou náhodou, ale čím menší pravděpodobnost je, tím pravděpodobnější je, že bookmakerův model je špatný.
Typická hranice p-hodnoty pro statistickou významnost je 1 %. Žádná sázková kancelář se s p-hodnotou nedostala na takovou úroveň. Výsledky fotbalového šampionátu byly přitom nejpřekvapivější u sázkové kanceláře BetVictor s p-hodnotou okolo 7 %. Přesto bychom však ani u ní pravděpodobně neměli hned vyvozovat závěr, že je její předpovědní model špatný. Nicméně, graf výše nabízí možnost vytvořit základní stupnici důvěry (nebo úroveň víry) v kvalitu či efektivitu kurzů, které sázkové kanceláře na zápasy mistrovství světa vypisovaly.
Jak jsem už zmínil, vzorek 64 zápasů je nejspíš příliš malý na to, abychom z něj mohli vyvozovat pevné závěry, ale přinejmenším kvalitativně potvrzuje to, co jsem tvrdil už v předchozích článcích (při analýze mnohem větších vzorků dat), totiž že Pinnacle má ty nejpřesnější nebo nejefektivnější kurzy na fotbalové zápasy.
Maximální věrohodnost
Filozoficky řečeno nám tyto p-hodnoty sdělují, jaká je pravděpodobnost, že se určitý soubor dat objeví čistě náhodou, za předpokladu, že je daná hypotéza pravdivá.
Pinnacle má nejnižší logaritmické skóre z mnoha sázkových kanceláří
Místo toho můžeme tento způsob uvažování obrátit. Místo testování pravděpodobnosti výskytu dat za předpokladu platnosti hypotézy, můžeme testovat pravděpodobnost platnosti hypotézy za předpokladu, že jsou daná data opravdu nejpravděpodobnější, která mohou být pozorována. Rozdíl mezi těmito dvěma přístupy jsem popisoval už dříve.
První přístup se nazývá frekvenční statistické testování, protože počítá frekvence daných dat. Druhý je příkladem bayesovské inference a konkrétně v tomto případě jde o metodu známou jako metoda maximální věrohodnosti.
Za předpokladu, že máme konkrétní sadu dat – v tomto případě výsledky 64 zápasů fotbalového šampionátu – jaké předpovědní pravděpodobnosti by byly potřeba, kdyby pozorované výsledky byly skutečně ty nejpravděpodobnější? Tato statistická metodika nejlepší shody je formálně známá jako metoda maximální věrohodnosti. Nehodlám vás nudit matematikou metody odhadu maximální věrohodnosti; stačí říct, že jsem ji provedl v první části této dvoudílné série při výpočtu záporného přirozeného logaritmu pravděpodobnosti kombinace skutečných výsledků ze 64 zápasů.
Průměrná hodnota 63,5 u Pinnaclu je to, čemu se říká hodnota logaritmu věrohodnosti. Pokud ji vydělíme velikostí vzorku, tedy 64, získáme číslo označované jako logaritmická ztráta. U Pinnaclu by tedy hodnota logaritmické ztráty na mistrovství světa byla 0,992. Čím nižší tato hodnota je, tím lepší je předpověď pravděpodobností. Dokonalá hodnota je 0. Absolutně nesprávná hodnota se pak rovná nekonečnu.
Funkce logaritmické ztráty je typem bodovacího pravidla, který se příliš neliší od Brierova skóre. Skóre ztrátového logaritmu pak můžeme interpretovat jako míru toho, jak špatné nebo jak vzdálené jsou předpovědi pravděpodobností od skutečných výsledků. Z jistého úhlu pohledu můžeme „ztrátu“ považovat za ztrátu jistoty.
Jak si stojí skóre logaritmické ztráty jiných sázkových kanceláří ve srovnání se společností Pinnacle? Pojďme se na to podívat. Následující histogram zobrazuje tato data:
Zdroj: pinnacle.com
Pinnacle má skóre logaritmické ztráty ze všech nejnižší. To znamená, že jejich model nejlépe zachycuje skutečné pravděpodobnosti výsledků. Jinými slovy, má nejpřesnější či nejefektivnější kurzy.
Můžete si všimnout, že sázkové kanceláře s nižším skóre logaritmické ztráty velmi dobře korelují s těmi, které mají vyšší p-hodnoty, a naopak. To podporuje myšlenku, že čím lepší predikční model je, tím méně bychom měli být skutečnými výsledky překvapeni.
Analýza zápasů mistrovství světa nabídla zajímavý způsob pro prozkoumání a otestování tohoto konceptu, o kterém se osobně domnívám, že má praktickou i filozofickou hodnotu. Pokud nás výsledky překvapují, může to znamenat, že jsou překvapivé. Stejně tak to ale může znamenat, že způsob, kterým jsme se snažili tyto výsledky předpovědět, byl chybný. Je však nutné připomenout, že vzorek 64 zápasů je malý. Možná, že měl Pinnacle se svou přesností v tomto případě jen štěstí. Ale možná také ne.
Ve své knize Monte Carlo or Bust: Simple Simulations for Aspiring Sports Bettors jsem analyzoval mnohem větší vzorek dat (sezónu Premier League 2019/20) se 380 zápasy a vypočítal jsem skóre logaritmické ztráty a došel jsem ke stejnému závěru: Pinnacle měl nejmenší skóre logaritmické ztráty ze všech. Nepochybuji o tom, že to samé by se potvrdilo i s větším vzorkem zápasových dat.
Efektivita kurzů a politika „Vítězové vítáni“
To, že má nejefektivnější či nejpřesnější předpovědní model znamená, že má Pinnacle nejefektivnější či nejpřesnější kurzy. Tento fakt má několik důležitých důsledků. Zaprvé to znamená, že je Pinnacle potenciálně nejtěžší porazit, protože sázkař může dlouhodobě vydělávat pouze za předpokladu, že Pinnacle dělá chyby.
Nicméně žádná sázková kancelář nedokáže nastavit dokonale efektivní kurzy a všichni určitě víme, že Pinnacle využívá několika málo zákazníků, kteří jej dokáží porazit, ke zefektivnění kurzů.
Jedním z důvodů, proč má Pinnacle nejpřesnější kurzy, je kromě utrácení významných prostředků na analýzu dat také začlenění znalostí těchto extrémně úspěšných sázkařů do svých prognostických modelů.
Zadruhé to však znamená také to, že být dobrým sázkařem u Pinnaclu, na rozdíl od ostatních sázkových kanceláří, nevede k omezení či uzavření účtu. Kurzy rekreačních sázkových kanceláří je sice snazší porazit, ale pokud vám nebude umožněno sázet, když je porážíte, je tato výhoda zcela iluzorní.
Závěr
Moje analýza zápasů ze světového šampionátu přinesla zajímavé poznatky ohledně významu překvapení ve sportu a posílila přesvědčení, že Pinnacle nabízí nejpřesnější kurzy na fotbalové zápasy. Čtvrt století po založení společnosti s cílem poskytovat přesné kurzy a vyzvat sázkaře, aby se je pokusili překonat, pokračuje Pinnacle v tom, co umí nejlépe, a dělá to lépe než kdokoliv jiný.
Další zajímavé články od stejného autora
O2 TV Sport | Sledujte stovky živých přenosů
29.12.2023 01:00 Pokud bychom měli vybrat nejrychleji rostoucí sportovní televizi u nás, byla by to pravděpodobně O2 TV Sport. Ta se totiž stala patronem českých nejvyšších soutěží a u diváků si tak získala pořádnou oblibu. Pojďte se s námi podívat, jak si O2 TV Sport naladit, kolik stojí a co všechno na ní můžete sledovat. Jak naladit O2 TV Sport? Jak už sám její název napovídá, O2 TV Sport provozuje výhradně poskytovatel internetových a mobilních služeb…
MerkurXtip | Vyzkoušejte si nového hráče na trhu
29.12.2023 01:00 Českým sázkovým kancelářím zcela jednoznačně dominují stálice Tipsport a Fortuna. V roce 2022 ale na trh přibyla další sázkovka – MerkurXtip. Chcete se o ní dozvědět více? Pokračujte ve čtení a my vás se vším důležitým seznámíme. O MerkurXtip Všechny sázkové kanceláře v Česku už máte vyzkoušené a chcete své portfolio rozšířit o dalšího bookmakera? Pak by pro vás MerkurXtip mohl být příjemným osvěžením. Sázkovou kancelář provozuje dobře známá…
EXKLUZIVNĚ: Sázet velké objemy nebo vysokou hodnotu? To je, oč tu běží
29.12.2023 01:00 Přinášíme vám exkluzivní překlad odborného článku od sázkového analytika Josepha Buchdahla, který spravuje webové stránky www.football-data.co.uk, na kterém poskytuje historické výsledky, zápasové statistiky a údaje o kurzech. Je také autorem knih Fixed Odds Sports Betting: Statistical Forecasting & Risk Management (2003), How to Find a Black Cat in a Coal Cellar: The Truth about Sports Tipsters (2013) a Squares & Sharps, Suckers & Sharks: The…
Jak vybrat peníze z Betana?
17.12.2023 20:00 V sázení neexistuje lepší pocit, než je výběr peněz z úspěšně vyhodnoceného tiketu. To jistě potvrdí každý sázkař. Pokud stále patříte mezi ty, co víc peněz vkládají, než vybírají, doporučujeme odebírat tipy našich úspěšných servisů. Z nabídky dlouhodobě úspěšných sázkařů si vybere každý. V následujícím článku vám popíšeme, jak vybrat peníze ze sázkové kanceláře Betano a začít si je co nejdříve užívat. Možnosti výběru Betano je původně řecká…
forBET | Nejnovější sázkovka na našem trhu
17.12.2023 20:00 Věříme, že sázkové kanceláře jako jsou Tipsport nebo Fortuna, představovat nemusíme. Koneckonců většina našich nejúspěšnějších servisů využívá právě tyto dvě společnosti. Na českém trhu se však v roce 2022 objevila nová sázkovka jménem forBET. Pokud jste se s ní zatím nestačili seznámit, určitě pokračujte ve čtení. O forBET Pokud už máte všechny sázkové kanceláře odzkoušené a rádi byste rozšířili své portfolio bookmakerů, můžete zkusit právě…