Richard Öhrvall
För den som är intresserad av att analysera data är det minst sagt intressanta tider: kraftfulla datorer kostar en bråkdel av vad de kostade för bara några år sedan, de mest kvalificerade statistikprogrammen är gratis och utmärkta kursböcker och webbkurser finns också fritt tillgängliga. Redan för fem år sedan skrev New York Times om hur dataanalytiker fängslats av statistikprogrammet R som har öppen källkod och distribueras gratis. Sedan dess har populariteten för R bara ökat, inte minst vid amerikanska universitet och stora, dataintensiva företag som exempelvis Google. Det finns dessutom en rad andra konkurrerande och kompletterande program som även de är gratis.
Nätkurser, eller MOOC (Massive Open Online Coursers) som de också kallas, har också vuxit explosionsartat. Via plattformar som exempelvis Coursera, edX och Udacity kan man utan kostnad gå kurser med lärare från några av världens främsta universitet. Många av dessa kurser ger kunskaper kring hur datamaterial kan analyseras, men kursutbudet innefattar självfallet även mycket annat. De svenska universiteten har inte riktigt hängt med i utvecklingen, trots att distansutbildningar har funnits länge. Men även här händer saker. I höst startar fyra utbildningar från Karolinska Institutet via edX (läs mer och anmäl dig här).
Om man trots studier av böcker och genomgångna kurser kör fast i dataanalysen finns olika webbsidor där man kan ställa frågor, som exempelvis Cross Validated och Stack Overflow. Utan att få någon ersättning mer än i form av äran, ägnar skarpa hjärnor mycket tid åt att besvara frågor som rör allt från det triviala till det intrikata.
Till detta ska läggas att allt mer data släpps fritt. Stora internationella organisationer låter i allt högre grad personer ladda ned deras insamlade eller sammanställda datamaterial för att själva analysera. Många svenska myndigheter strävar också efter att ha öppna data. Utvecklingen har skyndats på genom EU:s PSI-direktiv. PSI står för ”public sector information” och syftet med direktivet är att göra offentliga handlingar (och därmed även data) mer tillgängliga för att de ska kunna vidareutnyttjas.
Utvecklingen kan ses som demokratisk: genom att göra utbildning, verktyg och datamaterial fritt tillgängliga öppnas möjligheter för flera att studera samhället i olika avseenden. I detta finns en kraft som myndigheter och organisationer kan utnyttja. Exempelvis har Världsbanken gjort data över upphandlingar av projekt tillgängliga och uppmanat andra att analysera materialet för att finna eventuella konstigheter och tecken på korruption (läs mer här). Svenska Sida har tagit steg i samma riktning med sin webbsida OpenAid. Förhoppningsvis kommer fler svenska myndigheter och organisationer att ta efter. Och varför inte utlysa ett stort pris till den medborgare som i datamaterialen upptäcker något otillbörligt?