Richard Öhrvall
Nu inleds fotbolls-VM i Brasilien. Vid första anblick är kanske inte kopplingen mellan statistik och fotboll, eller annan idrott, så tydlig. Statistiker har inte ett rykte om sig att vara stora atleter. När jag häromdagen tänkte köpa en statistikbok på en nätbokhandel fick jag ett tips om att en bok om att ”alla behöver träning” vore ett bra komplement till de statistiska formlerna.
Men även om statistiker kanske inte är de bästa idrottarna, så har statistiken en viktig roll i idrotten. Kopplingen mellan statistik och idrott fick stor uppmärksamhet i och med boken Moneyball av Michael Lewis, vilken även blev en succé som film. Den bygger på en verklig händelse och handlar om Billy Beane (spelad av Brad Pitt), en general manager i baseball som inser att statistik kan användas för att hitta undervärderade spelare. Metoden att använda statistik för att analysera spelare, så kallad sabermetrics, tillämpas numera av alla stora baseballklubbar. Genom statistiska metoder kan bättre beslut fattas. I filmen ges exempel på hur klubbarna tidigare kunde utvärdera unga talanger med omdömen som: ”He’s got an ugly girlfriend. Ugly girlfriend means no confidence.”
Även inom fotbollen har statistiken fått allt större betydelse. I en väldigt intressant artikel i Financial Times ges en bra beskrivning av utvecklingen. När årets engelska mästare, Manchester City, år 2008 köptes av ett investmentbolag i Abu Dhabi (med kopplingar till den kungliga familjen) var en av de första åtgärderna att anställa ett stort antal dataanalytiker. Andra storklubbar låg då redan långt före. Arsenals manager Arsene Wenger är en stor tillskyndare av statistik. En milstolpe var 1996 då man började att samla in mer ingående data från engelska fotbollsmatcher. För att kunna göra effektiva analyser krävs bra data. Nyligen kunde man läsa om att tyska fotbollsspelare har burit särskilda sensorer som samlar in detaljerad data som sedan kan analyseras för att utveckla spelet.
Fast det krävs mer än data. För att fatta korrekta beslut krävs bra analyser och att man vet vilka mått som man ska använda sig av. Enligt uppgifter berodde Alex Fergusons försäljning av försvararen Jaap Stam 2001 på en misstolkning av statistiken. Som på så många andra områden börjar mängden data kring fotboll bli så pass omfattande att det gäller att välja vilka mått som är av vikt (vilket också är det roliga med dataanalys). Analyser har visat att de mått som man intuitivt kan tänka sig vara viktiga, som löpsträcka under match, antal tacklingar, osv., inte är speciellt bra variabler att slänga in i modeller för att bedöma spelare och lag. Mer värdefulla variabler är i stället antal löpningar i hög hastighet och passningar till rätt adress (i synnerhet sådana passningar framåt, se även den här artikeln).
En av de dataanalytiker som tidigt var intresserad av att analysera baseballmatcher var Nate Silver. Han utvecklade en modell vid namn PECOTA för att utvärdera baseballspelare. Senare sålde han modellen och gick vidare till att analysera politiska val. Genom bloggen FiveThirtyEight nådde han berömmelse för sina träffsäkra prediktioner i amerikanska presidentval. I 2008 års val förutspådde han rätt vinnare i 49 av 50 delstater och i 2012 års val i alla 50. Nu har bloggen vuxit och Nate gör prediktioner kring det mesta, inklusive årets fotbolls-VM. Och ska vi tro honom så har Brasilien 88 procents chans att vinna öppningsmatchen mot Kroatien och 45 procents chans att vinna hela mästerskapet.