Image
statistikk

Statistikk brukes for å finne ut hvordan verden virkelig er. Vår tids enorme datamengder gjør at man kan finne ut mer, men det er også mer krevende å lete. Foto: Colourbox

Det går en rød tråd fra å avsløre skattesvindel til bedre kreftbehandling: Statistikk

Enkle, statistiske undersøkelser har reddet kvinner fra å dø i barsel og babyer fra krybbedød. Nå kan modernestatistiske metoder gjøre det mulig å bedre kreftbehandlingen, avsløre skattesvindlere og forstå krigens dynamikk.

Statistikk kan brukes til mye, fra fredsforskning og persontilpasset kreftbehandling til å avsløre skattesnusk og hjelpe rederier med å spare millioner av kroner på drift av store tankbåter.

– Felles for disse forskningsprosjektene er at vi må løse statistiske problemstillinger fra svært store og til dels uoversiktlige datamengder. Det er nettopp det som er den store utfordringen for oss statistikere i dag. Statistikk er vitenskapen som gjør det mulig å ta beslutninger selv om datagrunnlaget består av usikkerheter. Vi bruker statistikk for å finne kunnskap om hvordan verden virkelig er, poengterer Nils Lid Hjort, professor i statistikk på Matematisk institutt ved Universitetet i Oslo.

Reddet kvinner i barsel

Før i tiden var alt mye enklere. Da holdt det å forholde seg til små datamengder.

Et livreddende eksempel med svært enkel statistikk var da den ungarsk-østerrikske legen Ignaz Semmelweis i 1847 reagerte på de høye  dødelighetstallene blant fødende kvinner på et sykehus i Wien.

Dødeligheten på avdelingen til Semmelweis var mye høyere enn på de andre avdelingene ved sykehuset. På avdelingen hans døde én av åtte kvinner. Legene obduserte også lik. På den andre avdelingen rådet jordmødrene. Der døde én av 50 kvinner.

Dødsraten sank dramatisk da Semmelweis, ved å sammenligne tallene, slo fast at færre kvinner døde i barsel hvis sykehuslegene vasket hendene grundig etter hver obduksjon.

– Den gangen kjente ingen til bakterier. Forklaringen på de mange dødsfallene kom først flere tiår senere. I dag er det opplagt at legene må vaske hendene etter en obduksjon. Statistisk fantes det et mønster, selv om legene der og da ikke hadde den medisinske forklaringen på hvorfor dette var riktig, forteller Hjort.

Reduserte krybbedød

Baby
Takket være statistiske analyser kunne krybbedødforskere på begynnelsen av 90-tallet fastslå at det var lurt å legge babyer på ryggen. Foto: Colourbox

Over hundre år senere ble statistikk brukt i krybbedødforskning. Mange babyer døde uforklarlig og plutselig. Den australske barnelegen Susan Beal og den nederlandske legen Guus A. de Jonge fattet mistanke om at dødsfallene kunne skyldes liggestillingen. Dette var på 1970- og 80-tallet, da mageleie ble ansett som den optimale sovestillingen.

– Krybbedødepidemien kulminerte i Norge i 1989. Da døde 142 barn i krybbedød, forteller Torleiv Ole Rognum.

Han er professor emeritus på avdeling for rettsmedisinske fag ved UiO og fikk sommeren 2018 en internasjonal pris for sitt omfattende arbeid mot krybbedød.

Det store spørsmålet var om babyene skulle sove på magen eller ryggen. Medisinerne satte i gang kontrollerte, statistiske studier for å finne ut om det fantes en sammenheng mellom liggestilling og dødsfall.

I 1990, før sammenhengen var endelig bevist, ble det på et stort internasjonalt møte om krybbedød i Trondheim anbefalt at spedbarn skulle ligge på ryggen. To år senere, i 1992, ble sammenhengen statistisk bevist.

– Virkningen var dramatisk. Krybbedødtallene falt og har fortsatt å falle. I dag er det rundt ti årlige tilfeller, poengterer Torleiv Ole Rognum.

Vil du ha flere forskningsnyheter om statisitikk, realfag og teknologi: Følg Titan.uio.no på Facebook eller abonner på nyhetsbrevet vårt

Dataeksplosjon

Siden den gang har datamengdene eksplodert.

– Den voldsomme datafangsten har endret statistikkfaget, sier Nils Lid Hjort.

Noen tror kanskje at de enorme datamengdene gjør det lettere for statistikere. Da tar de grundig feil.

– Vi leter etter nålen i høystakken. Jo større høystakken er, desto vanskeligere er det å finne nålen. Dessuten er det fare for å finne ting som ligner på nåler, men som ikke er det likevel.

Mange samler inn data uten å stille seg klare spørsmål om hva de ønsker å finne svaret på. Det er et stort problem.

– Med en ugjennomtenkt innsamling av data kan de klassiske statistiske metodene bli ugyldige.

Nils Lid Hjort og Céline Cunen med kurven som viser at noe endret seg i 1965
Nils Lid Hjort og Céline Cunen beskriver Den lange freden ved hjelp av statistikk. Foto: Bjarne Røsjø/UiO Bruk bildet.

Statistikerne må derfor utvikle og tilpasse metodene sine for å kunne holde tritt med de enorme datamengdene som har kommet til de siste årene.

– Ethvert fag med komplekse problemstillinger vil trenge statistikk på høyt nivå. Selv om statistikkfaget er hundre år gammelt og mye fundamentalt er forstått, er det mer enn nok problemstillinger igjen. Det skyldes ikke bare at datafangsten er større enn før, men også at dataene er blitt langt mer komplekse, påpeker Hjort.

Postdoktor Céline Cunen på Matematisk institutt har forsket på hvordan statistikk kan brukes til å si noe om hvorvidt verden er blitt fredeligere. Hun poengterer at statistikere nå må lete etter mye svakere signaler i datamaterialet enn tidligere. Da er det vanskeligere å skille mellom datastøy og reelle funn.

Mange data blir dessuten samlet inn av ulike instanser. Mye av informasjonen er rotete.

– Problemet er at jo større datamengdene blir og jo mer uryddig de er lagret, jo vanskeligere er det å dra nytte av dem. En viktig del av statistikkfaget er å bidra til å samle  inn de mest relevante dataene, sier Cunen.

LES OGSÅ: Titan-prisen 2018 til Céline Cunen

Etisk ansvar

Selv om statistikk er et nødvendig verktøy for å forstå verden, brukes det ofte uvettig.

– Statistikk kan misbrukes. Det følger derfor med et etisk ansvar. Noen statistikere tenker ikke alltid på menneskehetens beste, beklager Nils Lid Hjort.

Et eksempel er statistikerne som jobber med de moderne overvåkingssystemene i Kina. Overvåkingen premierer folk med god oppførsel og gjør det vanskeligere for dem som ikke følger systemet.

– Her brukes avansert statistikk og komplekse algoritmer, med mulige konsekvenser for millioner av borgere. Jeg mener dette kan lede til misbruk.

Et annet misbruk er når statistikk brukes til å påvirke et valgresultat. Det amerikanske firmaet Cambridge Analytica fikk med tvilsomme metoder tak i data fra flere millioner Facebook brukere. Flere amerikanske politikere, som Donald Trump og valgkamporganisasjonen hans, tilpasset det politiske budskapet ved å analysere brukernes atferd på Facebook.

Statistikerne ved UiO ønsker imidlertid å bruke anvendt statistikk til «menneskehetens beste».

– Karl Marx sa i 1845 at filosofene bare brydde seg om å forstå verden. Vi vil med marxistisk forstand også bruke statistikk til å forandre verden – til det bedre, poengterer Nils Lid Hjort.

Statistikerne beklager også at faget blir misbrukt av enkelte forskere. De leter for mye etter mulige funn. Roter de lenge nok i høystakken, vil de finne ting som ser ut som nåler, selv om svarene ikke er statistisk gyldige.

– Problemet er at noen forskere ikke forstår de grunnleggende tingene ved komplekse statistiske metoder og legger frem tilsynelatende signifikante funn, som egentlig bare er «støy». De fleste gjør dette i god tro, men noen gjør det også med vilje, påpeker Céline Cunen.

Artikkelen ble først publisert i Apollon

Les mer på Titan.uio.no: