EXKLUZIVNĚ: Šoky a zklamání: Jak překvapivé bylo mistrovství světa 2022? PŘEKLADY ODBORNÝCH ČLÁNKŮ

EXKLUZIVNĚ: Šoky a zklamání: Jak překvapivé bylo mistrovství světa 2022?

29.05.2023 20:15

Přinášíme vám exkluzivní překlad odborného článku od sázkového analytika Josepha Buchdahla, který spravuje webové stránky www.football-data.co.uk, na kterém poskytuje historické výsledky, zápasové statistiky a údaje o kurzech. Je také autorem knih Fixed Odds Sports Betting: Statistical Forecasting & Risk Management (2003), How to Find a Black Cat in a Coal Cellar: The Truth about Sports Tipsters (2013) a Squares & Sharps, Suckers & Sharks: The Science, Psychology & Philosophy of Gambling (2016).

 

  • Jak překvapivé bylo mistrovství světa 2022?
  • Pravděpodobnost metodou Monte Carlo
  • Outsideři na mistrovství světa 
  • Šoky a zklamání: část první

 

Jak šokující bylo mistrovství světa 2022? Bylo vítězství Japonska nad Německem takovým překvapením? Joseph Buchdahl rozebírá data, aby zjistil, zda jsou velká překvapení na tak masivním turnaji opravdu tak překvapivá, jak si myslíme.  

Podle společnosti Gracenote, která se zabývá sběrem sportovních metadat, bylo mistrovství světa 2022 v Kataru turnajem outsiderů – 15 zápasů totiž skončilo překvapením (dle jejich vlastní definice) – což je nejvyšší procento za posledních 64 let.   

Katar byl nejpřekvapivějším mistrovstvím světa za 64 let.

Jak překvapivé takové číslo ale opravdu je a jak vlastně rozhodnout, že jde o překvapení? Všichni bychom pravděpodobně souhlasili, že vítězství Japonska nad Španělskem a Německem a porážka Argentiny v zápase se Saúdskou Arábií, byly překvapivé. Tato premisa však závisí na tom, nakolik je platné naše přesvědčení, že Španělsko, Německo a Argentina měly tyto zápasy vyhrát. Naše intuice nám možná říká, že zcela jistě měly, pokud však není možné dokonale posoudit skutečnou pravděpodobnost výsledků, měli bychom si vždy uvědomovat možnost potenciální chyby.  

Když se zdá být fotbalový výsledek překvapivý, znamená to, že měl outsider – právoplatně považován za outsidera na základě přesného predikčního modelu – jen štěstí nebo je to tím, že ve skutečnosti nebyl outsiderem a predikční model se zmýlil?   

Z filozofického hlediska se jedná o zajímavou hádanku, kterou lze jen těžko rozluštit. Zde se setkáváme se dvěma druhy nejistot. Nejistota nebo chyba v platnosti předpovědního modelu se nazývá epistemická nejistota a teoreticky ji lze redukovat lepším modelováním.  

Dalším druhem nejistoty je nejistota vnitřní, která je známá jako aleatorní nejistota, obecně známá spíše jako náhoda, štěstí nebo nahodilost. Tuto nejistotu nelze zmenšit. Oddělit epistemickou a aleatorní nejistotu může být zrádné. V tomto páru článků pro Pinnacle se pokusím přispět svou troškou do mlýna. V prvním článku se pokusím prozkoumat faktor překvapení mistrovství světa jako celku. 

V druhém článku se dozvíte více o tom, co nám tato zjištění mohou říci o přesnosti (nebo efektivitě) sázkových kurzů sázkových kanceláří a o platnosti jejich předpovědního modelu, pomocí kterého je sestavují.  

 

Pravděpodobnostní kombinace výsledků všech 64 zápasů MS

Pokud odhadneme pravděpodobnosti každého ze tří možných výsledků jednotlivých zápasů na MS ve fotbale, můžeme vytvořit pravděpodobnost každé z 64 možných kombinací výsledků. Jaké pravděpodobnosti výsledků bychom ale měli použít?   

Většina ambiciózních sázkařů má nepochybně své vlastní metody výpočtu, ale abych ušetřil čas (a s vědomím, že se jedná o jedny z nejlepších dostupných pravděpodobností), použiji ty, které jsou implikovány závěrečnými kurzy společnosti Pinnacle.

Již několikrát jsem podrobně rozebíral, proč jsou závěrečné kurzy Pinnaclu jedny z nejlepších pro odhadování skutečné pravděpodobnosti jednotlivých výsledků. Pinnacle samozřejmě k těmto kurzům přidává marži, proto o ni kurzy musím nejdříve očistit. Pro tyto účely mám vlastní kalkulačku. 

Poté se můžeme pomocí těchto vícenásobných pravděpodobností pokusit odpovědět na otázku: jak kolektivně překvapivé byly výsledky mistrovství světa 2022? 

 

Narativní omyl

Je dobré si uvědomit, že pravděpodobnost, že ve všech 64 zápasech mistrovství světa nedojde k žádnému překvapení, je mizivá.   

Existuje pouze 11 % šance, že favorit vždy vyhraje.

Na základě závěrečných kurzů Pinnaclu jsem vypočítal, že pravděpodobnost takové události je 6,5 x 10-17, tedy něco málo přes jedna ku trilionu. Pokud by se něco takového stalo, jednalo by se o jednu z nejúžasnějších událostí v historii lidstva. A přesto by mě zajímalo, kolik lidí kromě statistiků by tomu vůbec věnovalo pozornost, snad kromě poznámky, že je to extrémně nudné mistrovství světa.

Každý jiný scénář kombinací 64 výsledků má nižší pravděpodobnost. A potenciálních scénářů je hodně – 364 (pozn. redakce: každý ze 64 zápasů má tři možnosti výsledku – výhra domácích, remíza, výhra hostů), přesněji tedy 3 433 683 820 292 512 484 657 849 089 281.

V každém z nich dojde k překvapení (pokud budeme definovat překvapení jako neuskutečnění očekávaného výsledku neboli nevýhru favorita) a čím menší je pravděpodobnost 64možnostního scénáře, tím větší počet překvapení se v něm očekává. 

Existuje pouze jediný způsob, jak k žádnému překvapení nedojde – musí nastat všechny předpokládané výsledky (pozn. redakce: všechny favorizované výsledky musí být naplněny). Naproti tomu existuje mnoho způsobů, jak může dojít k překvapení. Individuálně jsou jejich pravděpodobnosti pro každou kombinaci 64 zápasů menší, ale kolektivně jsou pravděpodobnější, než aby se žádné překvapení nestalo.

Uvažujme o jednoduchém binomickém příkladu 10 zápasů se dvěma možnými výsledky, kde má každý favorit 80% šanci na výhru a každý outsider 20% šanci. Existuje přibližně 11% šance, že všichni favorité vyhrají, ale 20% šance, že vyhrají 3 outsideři, a téměř 9% šance, že vyhrají čtyři outsideři.

Proč je pravděpodobnost, že tolik outsiderů vyhraje, tak vysoká? Individuálně jsou pravděpodobnosti pouze 0,17 % a 0,04 % (pro jedinou kombinaci výher tří respektive čtyř outsiderů), ale existuje mnoho možností, jak k nim může dojít – konkrétně 120 pro tři outsidery a 210 pro čtyři outsidery (pozn. redakce: znamená to, že máme 120 možných kombinací výher tří outsiderů a 210 možných kombinací výher čtyř outsiderů).  

To vše představuje pouze jiný způsob, jak vám říct, že překvapení je potřeba očekávat. Přesto naše mozky často inklinují k tomu, že si z dat vytvářejí jednoduché, a někdy chybné příběhy, které dávají smysl pouze ve světě, jež považuje překvapení za méně pravděpodobná, než ve skutečnosti jsou.  

Pokud by Japonsko neporazilo Španělsko a Německo, nepsali bychom o tom, ale statistika nám říká, že tyto překvapivé výsledky jsou v podstatě statistickou jistotou. Toto je jasný příklad narativního omylu.

 

Rozdělení pravděpodobnosti metodou Monte Carlo

Existuje pouze jediný způsob, jak vidět multiplikovanou sázku složenou ze 64 zápasů s pravděpodobností 6,5 x 10-17 (pozn. redakce: taková je pravděpodobnost toho, že v žádném zápase nedojde k překvapení, viz. výše). Nejméně pravděpodobná kombinace 64 zápasů, ve kterých zvítězí všichni outsideři, má pravděpodobnost 1,5 x 10-51 a existuje pouze jediný způsob, jak by k tomu mohlo dojít. Ale kolik způsobů bychom mohli vidět, např. při násobku pravděpodobnosti 10-25  nebo 10-30?

Vyřešit tyto výpočty algoritmicky je příliš složité. Abychom si vše dost usnadnili, je dobrým nápadem vytvořit simulaci Monte Carlo. Náhodným zamícháním výsledků zápasů podle definovaných pravděpodobností předpokládaných Pinnaclem můžeme vytvořit náhodně generovanou souborovou pravděpodobnost 64 zápasů.

Mnohonásobným zopakováním této simulace Monte Carlo spočítáme, kolikrát se vyskytla každá definovaná pravděpodobnost, například 10-25 nebo 10-30. Tímto způsobem můžeme definovat pravděpodobnostní distribuci, která nám umožní určit rozsah a pravděpodobnost možných výsledků 64 zápasů MS.

Práce s malými hodnotami pravděpodobnosti je však intuitivně poměrně obtížná. Můžeme nicméně aplikovat malou transformaci, která je učiní kognitivně zvládnutelnější: můžeme použít logaritmus. Například logaritmus (základ 10) pro 0.001 je -3; pro 0.000001 je to -6 a pro 0.000000000001 pak -12. Já budu pro své účely (základ e) používat přirozený logaritmus (ln) a vypustím záporné znaménko minus. 

Moje Monte Carlo simulace obsahovala 100 000 cyklů pro 100 000 hodnot přirozeného logaritmu každé náhodně generované pravděpodobnosti kombinace výsledků 64 zápasů (s odstraněným záporným znaménkem). Tyto hodnoty jsem poté rozdělil do skupin a vytvořil následující graf pravděpodobnostní (či frekvenční) distribuce.

Zdroj: www.pinacle.com

Výsledky simulace jsou zobrazeny na grafu, kde osa x zahrnuje logaritmy pravděpodobností a osa y ukazuje četnost výskytu těchto hodnot. Celkový rozsah na ose x je od 37,3 (což představuje výhru všech 64 favoritů) do 117,1 (výhra všech 64 outsiderů), ale tyto pravděpodobnosti jsou nemožně malé.

Je tedy nutné zobrazit pouze nejpravděpodobnější výsledky, čímž získáme představu o tom, jaký je rozsah možností. Podíváme-li se na graf, vidíme, že je velmi pravděpodobné, že pro kombinace možností 64 zápasů bude hodnota na ose x někde mezi 45 a 75.  

Tyto hodnoty odpovídají pravděpodobnostem zhruba 3 x 10-20 a 3 x 10-33. Pravděpodobnost výsledků kombinace 64 zápasů klesá, jak se po ose x pohybujeme doprava. Průměrná nebo nejpravděpodobnější pozorovaná kombinace výsledků je na ose x přibližně u hodnoty 60, což odpovídá kombinaci pravděpodobnosti 7.5 x 10-27.

V grafu je pomocí vertikální černé linie zanesena také lokace kombinace skutečných výsledků zápasů mistrovství světa. Hodnota na ose x je v tomto případě 63.5 (a pravděpodobnost kombinace výsledků je 2.7 x 10-28). To je přibližně 28krát méně než nejpravděpodobnější kombinace výsledků.

To sice vypadá jako ohromné číslo, ale graf vypovídá o něčem jiném. Můžete vidět, že tato linie není příliš daleko od středu (průměru) pravědpodobnostní distribuce. Ve skutečnosti bylo přibližně 20 % možných kombinací výsledků MS méně pravděpodobných než ty, které se nakonec skutečně staly.  

Statisticky bychom to za překvapivé neoznačili. Pro to bychom potřebovali, aby se svislá čára posunula alespoň na hodnotu 70 na ose x, což by znamenalo, že jen méně než 1 % možných kombinací výsledků bylo méně pravděpodobných. To by odpovídalo pravděpodobnosti multiplikace přibližně 4 x 10-31, tedy téměř 700krát menší než té, ke které skutečně došlo. K tomu bychom museli vidět něco, jako že by Katar porazil Nizozemsko, Polsko porazilo Francii nebo Jižní Koreu, která by porazila Brazílii.

 

Bylo toto mistrovství světa překvapivé?

Na základě dat prezentovaných v tomto článku jsme se nyní dostali do fáze, kdy dokážeme odpovědět na mou původní otázku. 

Ne, tolik překvapivé nebylo. Došlo sice k několika překvapením v jednotlivých zápasech, ale už víme, že ta můžeme na turnajích s tolika zápasy očekávat. Mnohem překvapivější by bylo, kdyby k žádnému překvapení nedošlo.  

Filozoficky vzato, co překvapení opravdu znamená? To záleží především na našem očekávání výsledku zápasu. Představme si extrémní příklad, že by můj predikční model udělal z Walesu velké favority v zápasu s Anglií, z Ghany velké favority v zápase s Portugalskem, z Austrálie favority v zápase s Francií, z Kostariky favority proti Německu a tak dále ve všech zbylých 64 zápasech. 

Nejspíše bych byl velmi překvapený, co že se to vlastně stalo. Je to kvůli tomu, že outsideři, které z nich můj model udělal, měli jednoduše štěstí, nebo byl můj predikční model špatný? V tomto případě je to samozřejmě nad slunce jasné, ale většinou je hranice mezi těmito dvěma možnostmi mnohem tenčí. 

Odhady Pinnaclu na pravděpodobnost jednotlivých utkání ne vždy perfektně zachytily to, co se ve skutečnosti stalo. Je to kvůli smůle nebo jde o modelovou chybu?  

Nyní už je mnohem obtížnější odpovědět. Můžeme ale říct, že protože neexistuje statisticky významný rozdíl mezi odhady Pinnaclu a skutečnými výsledky, máme dobré důvody pro to tvrdit, že model Pinnaclu není tak špatný. 

Jinak řečeno, mistrovství světa (z pohledu Pinnaclu) nebylo z pohledu statistiky nijak zvlášť překvapivé. Výsledky byly méně pravděpodobné než u většiny jiných světových šampionátů (které měly statisticky o dva nebo tři překvapivé výsledky méně), ale ne nijak výrazně. Pokud by byl zaznamenán statisticky významný rozdíl, bylo by mnohem jednodušší názor Pinnaclu zpochybnit.  

Můžeme tedy formulovat pravidlo: čím větší je rozdíl mezi očekáváním a realitou, tím větší je statistická pravděpodobnost, že náš model očekávání je chybný. Jak si predikční model Pinnaclu pro světový šampionát stál v porovnání s jinými sázkovými kancelářemi? To bude téma druhé části této série. 

 

Sdílet tento článek ve službě

avatar

O autorovi

Lubomír Přibyl

Kurzové sázení není pro Luboše pouze koníček, ale životní styl. Sportovním analýzám a statistikám se věnuje přes deset let. V současnosti pracuje jako sportovní redaktor.

Další zajímavé články od stejného autora

OSOBNOSTI SPORTBREAKU

TOP 10 servisů v únoru 2023

02.03.2023 16:15 Kterým servisům se v uplynulém měsíci nejvíce dařilo? Dozvíte se z našeho přehledu. Žebříček nejúspěšnějších servisů jsme seřadili podle celkového zisku.    Po lednové krasojízdě přišla únorová sprcha. Zatímco v lednu byl celkový zisk TOP 10 servisů neuvěřitelných 980 860 Kč, což dělalo v průměru 98 086 Kč na jednoho, v únoru vydělala desítka nejlepších 555 760 Kč. Žádnému servisu se nepodařilo pokořit stotisícovou hranici. Hodně našich…

OSOBNOSTI SPORTBREAKU

TOP 10 servisů v lednu 2023

02.02.2023 12:00 Kterým servisům se v uplynulém měsíci nejvíce dařilo? Dozvíte se z našeho přehledu. Žebříček nejúspěšnějších servisů jsme seřadili podle celkového zisku.    Žebříček je stejně jako prosincový přehled seřazen podle celkového zisku. Suverénním králem prvního letošního měsíce se stal FINNYS. Legenda naší verifikace zaznamenala neuvěřitelný zisk 434 400 Kč! Při průměrné sázce 5 000 Kč a v průměrném kurzu 4.76 se jeho YIELD dostal lehce přes 34 %.…

OSOBNOSTI SPORTBREAKU

TOP 10 servisů v prosinci 2022

05.01.2023 20:30 Kterým servisům se v uplynulém měsíci nejvíce dařilo? Dozvíte se z našeho přehledu. Žebříček nejúspěšnějších servisů jsme seřadili podle celkového zisku.    Prosinec si pro sebe ukradl NR SPORTS INVEST, který s průměrným vkladem 3 265 Kč na tiket získal lehce přes 145 000 Kč a jeho YIELD překročil 25 %! Své umění předváděl především ve statistických sázkách na NBA a NFL. Nejvýdělečnější prosincový servis můžete odebírat za 2 000 Kč na 30 dní. 96…

OSOBNOSTI SPORTBREAKU

Ohlédnutí za rokem 2022 + plány na rok 2023

02.01.2023 15:00 S příchodem nového roku jsme si pro vás připravili krátké ohlédnutí za rokem 2022 a zároveň poodhalení našich plánů pro rok 2023. Máte se, na co těšit!   Co se událo v roce 2022 Zásadní událostí roku 2022 byla změna našeho webu. Oblékli jsme SportBreak do nového hávu, přidali nové funkcionality, více statistik a zdokonalili podporu. I díky tomu jsme pokořili hranici 500 verifikovaných servisů.   Speciální sólo balíčky V roce 2022 jsme začali se…

SportBreak - nejlepší profesionální sázkaři na jednom místě

Spojte se s jedničkami v oblasti sázkového poradenství! Na SportBreaku najdete komunitu těch nejlepších sázkařů z Česka i Slovenska. Nechte si poradit od skutečných profesionálů a začněte kurzovým sázením vydělávat. Stačí si vybrat z široké nabídky verifikovaných servisů a můžete začít.