‘De bal is rond’. Of hij is ‘onschuldig’. ‘Ieder land kan dit winnen.’ Aan de vooravond van het WK regent het clichés. Allemaal benadrukken ze de spanning, het toeval van het toernooi, die vaak beslissend is.

En het zat gisteren allemaal in de openingsmatch van Brazilië tegen Kroatië: emotie, druk, spanning. Arm in arm kwam de selecao het veld op: teamgeest, nationalisme, fanatisme. Voor de miljoenen kijkers van het wereldkampioenschap is dat waar het spel voor staat. We zagen dat voetbal vaak toeval of geluk is. En soms even de hand van God als bijvoorbeeld de scheidsrechter een onterechte penalty geeft. En dat is de charme. Betekent dat dat we ons aan de clichés moeten overgeven, en moeten accepteren dat echt alles mogelijk is? Data-analisten van over de hele wereld vinden van niet.

Nerdy peilers

Want er is ook die andere kant van het WK die ons, en met ons vele andere nerdy peilers en data-analisten ter wereld fascineert. Het WK betekent namelijk ook immense hoeveelheden data: van de financiële waarde van spelers, het aantal succesvolle passes, het samenspel van een team, stijgingen en dalingen op de rankings, thuiscontinentvoordeel. Niet alleen tijdens het toernooi, maar vooral data die in de voorgaande jaren verzameld zijn tijdens de kwalificatie- en oefenmatches. En die data kun je als team of coach natuurlijk gebruiken om beter te gaan voetballen én om –ondanks de hand van God- toch een voorspelling te doen over de uitslag van het toernooi. Een betere voorspelling dan de anderen. Met betere data, en een beter model.

Uitleven op het WK

En het mooie van zo’n WK is dat misschien wel de beste analisten zich uitleven op dit toernooi. Zo publiceerde het team van de Amerikaanse statisticus Nate Silver (dé data-analist die de presidentsverkiezingen in alle staten exact voorspelde) deze week een voorspelling op basis van een schier oneindige reeks variabelen. Silver heeft een sterk verbeterde versie van de FIFA worldranking samengesteld, en zijn ‘Soccer Power Index’ noteert de voornaamste concurrent van Oranje, Chili, op de vijfde plaats. Nederland staat negende. Volgens team-Silver heeft Chili 68 procent kans om de poule te overleven en Nederland slechts 43 procent.

Goldman Sachs

Eén van de voorspellingen op basis van de Elo-ranking komt van de analisten van de Amerikaanse investeringsbank Goldman Sachs,  die – al dan niet met een knipoog – wel mooi een 67 pagina’s tellende analyse over het WK schreven waarin ze voetbal verbinden met de economische ontwikkeling van een land. Vrij hilarisch is een ‘verband’ dat gelegd wordt tussen de ontwikkeling van de huizenprijzen in Nederland en Duitsland gekoppeld aan prestaties van de nationale elftallen, maar er zit wel een geavanceerd systeem achter. Goldman ziet Nederland de groep overleven, maar in de 8ste finales verliezen van toekomstig wereldkampioen Brazilië. 

Infostrada

Sportstatistiekbedrijf Infostrada heeft een eigen ranking- en voorspelmethode, waarbij gekeken wordt naar de resultaten van alle WK-deelnemers in internationale wedstrijden. De ranking is vervolgens gecorrigeerd voor verschillende factoren, zoals het thuisvoordeel van Brazilië. Volgens Infostrada behoort Nederland tot de 10 favorieten voor de titel. Met 3,3 procent kans scoren zij net iets hoger dan Chili (2,3 procent), het land dat de top 10 sluit. Ook poulegenoot Spanje staat in de top 10 (17,3 procent). De meest aannemelijke finale is tussen Spanje en Brazilië: er is acht procent kans dat die landen beide in de finale staan.

Te weinig info

Uiteindelijk blijft het koffiedik kijken, verzucht de Amerikaanse analist Neil Paine. Waar in Amerika basketball en baseball wél geavanceerde indexen hebben voor individuele spelers, is er over voetballers simpelweg te weinig informatie beschikbaar: ‘We kunnen nauwelijks het verschil zien tussen Wayne Rooney of zijn teamgenoot bij Manchester, Vidic.’ Maak dan maar eens een goede index. En maak zonder index maar eens een goede voorspelling van een WK.

Nederland-Spanje

Maar goed. Wat zeggen de bovenstaande modellen over de wedstrijd van Nederland tegen Spanje vanavond? Nate Silver geeft Nederland 21% kans op winst, Spanje 53%, en 25% kans op een gelijke eindstand. Goldman voorspelt 1-1.  Ze mogen dan verschillen over de kansen van Oranje, in één punt zijn ze gelijk: gastland Brazilië heeft een enorme kans om kampioen te worden: tegen de 45 procent. Daarna volgen Argentinië (13%) en Duitsland (11%). 

Infostrada wijkt hier opvallend af. Hoewel ook zij Brazilië tippen voor de titel, zijn de kansen volgens Infostrada slechts 21 procent. Spanje volgt op de voet met 17 procent kans op de titel. Dat Brazilië bij Infostrada veel minder kans maakt op de titel dan bij anderen komt waarschijnlijk omdat het bureau corrigeert voor het thuisvoordeel van de Kanaries.  

Terug naar de openingsmatch. Al ging het moeizaam, al was het misschien niet helemaal verdiend: Brazilië heeft de eerste winst wél binnen. Tot nu toe liggen, mede dankzij een versierde penalty – toch een beetje de hand van God - de modellen op koers. Data-modellen en clichés gaan misschien toch heel goed samen.

Vragen? Stel ze!

Heb je nog vragen of wil je reageren? Stuur ons dan hier een berichtje in onze chat. Elke donderdag vertellen we in de Doe mee-nieuwsbrief wat we met alle reacties doen. Wil je die in je mail? Meld je dan hier aan.