Til hovedinnhold

En datamaskin har kjørt 100 000 simuleringer av fotball-VM for å finne en vinner

Gir Spania 17,8 prosents sjanse.

Groll et al., 2018
Vegar Jansen

Verdensmesterskapet i fotball er uten tvil sommerens og muligens årets største sportsbegivenhet, og ett av de store spørsmålene retter seg selvfølgelig mot hvilket lag som til slutt vil kunne reise hjem med det gjeveste trofeet.

For å spå resultatet er det populært å ty til «synske» dyr. For åtte år siden var det en viss blekksprut som hadde medienes interesse, og nå nylig er det en russisk katt som visstnok skal ha peiling.

Andre går mer vitenskapelig til verks. En gjeng med forskere og statistikere fra universiteter i Tyskland og Belgia har nemlig matet inn en rekke data i en datamaskin som har simulert hele turneringen fra start til slutt.

Illustrasjon: Groll et al., 2018

Dette er i og for seg ikke noen ny øvelse, men denne gangen har forskerne tatt i bruk en metode som benytter seg av elementer kjent fra maskinlæring – en form for kunstig intelligens (AI).

Etter hundre tusen simuleringer har så datamaskinen konkludert med at Spania har størst sjanse for å vinne VM. Med 17,8 prosents sannsynlighet, for å være nøyaktig.

Men marginene er naturligvis små. Rett bak finner vi ikke overraskende Tyskland med 17,1 prosents mulighet for å hente hjem pokalen, så har vi Brasil (12,3 %), Frankrike (11,2 %) og Belgia (10,4 %).

Samtidig mener faktisk datamaskinen at dersom tyskerne først kommer seg til semifinalen – hvor de eventuelt kan møte Spania – er det størst sjanse for at nettopp Tyskland vil vinne hele sulamitten.

Illustrasjon: Groll et al., 2018

Dette fordi den tror at Tyskland har en større mulighet til å vinne over Spania enn omvendt. Men samtidig vil Tyskland møte tøffere motstand frem til dette, og således ha større sjanser for å bli slått ut før de kommer så langt.

Fra økonomi til lagstruktur

For å peke ut Spania som vinneren har datamaskinen hatt en rekke data å jobbe ut i fra, og det er tatt hensyn til 16 distinkte variabler. Det er sett på befolkning, befolkningsvekst og hvordan den økonomiske situasjonen er i hjemlandet. Videre er det tatt hensyn til FIFA-rangering og bookmaker-odds, samt slikt som fordelene av hjemmebane eller -kontinent.

Illustrasjon: Groll et al., 2018

Lagstrukturen er også analysert, med variabler som gjennomsnittsalder, hvor mange som spiller i internasjonale toppklubber og hvor mange som også spiller i den samme klubben. Det er også kalkulert inn hvor mange som spiller i utlandet kontra hjemlandet.

Et siste sett med variabler dreier seg rundt lagenes trener, og her ser vi allerede et problem med simuleringene som har vært kjørt. Ettersom papirarbeidet ble publisert allerede den 8. juni, kan de umulig ha kalkulert med at den spanske landslagssjefen skulle få sparken.

At turneringen går akkurat som datamaskinen har regnet ut er uansett svært lite sannsynlig. Som eksempelet over viser, er det et utall kjente og ukjente variabler som kan påvirke det endelige resultatet i en hvilken som helst retning.

Så du gledet deg til en ekstra høyoppløst fotballfest?
Derfor får du ikke se fotball-VM i 4K på NRK eller TV2 >>>

(Kilder: Motherboard | Technische Universität Dortmund)

annonse