Image
Sylvia Richardson

– Eg vil oppmode unge studentar til å velje statistikk. Det er ein veldig morosam jobb der du både får utfordra hjernen og samarbeida med mange ulike ekspertar, seier Sylvia Richardson, som er ny æresdoktor ved UiO. Foto: Åsmund H. Eikenes/UiO

Ho utviklar framtidas biostatistikk

– Eg vil først og fremst forstå kva som skjer, seier professor Sylvia Richardson om arbeidet hennar med statistisk modellering av komplekse biologiske prosessar.

– Det er ein tendens til berre å nytte enkle statistiske metodar. Det er synd, for det utnyttar ikkje det fulle potensialet i dataa, seier professor i biostatistikk Sylvia Richardson.

Saman med forskingsgruppa ved University of Cambridge utviklar ho nye statistiske modellar for å forstå prosessar som genererer store datasett.

Spørsmålet hennar er enkelt: Korleis heng ulike biologiske prosessar saman og påverkar helsa vår?

1. september vart Richardson utnemnt til æresdoktor ved Universitetet i Oslo. I tida framover skal ho mellom anna samarbeide med norske statistikarar og brystkreftforskarar for å få endå meir ut av dei store databasane deira.

– Målet er at betre statistiske modellar skal bidra til å gjere klassifiseringa av brystkreftpasientar meir relevant for behandlinga dei får, forklarar Richardson.

Komplekse data

Ambisjonane set høge krav til algoritmar og komplekse analysar. Databasane inneheld mykje støy, samt mange koplingar som ikkje er relevante. Modellane må også handtere at statiske data om genetikk vert sett saman med dynamiske data om helsa til folk.

I arbeidet nyttar Richardson og kollegaene hennar såkalla Bayesianske metodar til å modellere data.

Dei startar med ein algoritme som inkluderer premissar og hypotesar. Når modellen møter datasettet, gir resultatet både eit oversiktsbilete og ei betre forståing for det forskarane endå ikkje veit.

– Det er ein svært fleksibel metode som unngår overforenkling av forskingsspørsmåla. Den gir ingen enkle predikasjonar, men gjer at vi lærer meir om datasettet og kan stille endå betre spørsmål i neste runde, forklarar biostatistikaren, som sjølv har bidrege stort til utvikling av fagfeltet.

LES OGSÅ: Morten Dæhlens blogg: Realister og teknologer erobrer helsesektoren

Statistikk for alt

Sylvia Richardson

Dei siste to åra har Richardson delteke i forskingsprosjekt som omhandlar mental helse, sjeldne blodsjukdomar, autoimmune sjukdomar og lungekreft. Kollegaene hennar ved Cambridge arbeider med epidemiologi og folkehelse i tillegg til genomikk og utvikling av legemiddel. Tidlegare arbeidde Richardson med statistikk for geografiske data.

– Statistikk er som eit mikroskop. Det er eit verktøy for oppdagingar, kommenterer ho.

– Er det ingen grenser for kva statistikk kan brukast til?

– Nei, ingen grenser, svarar Richardson. – Det er fordi vi kan nytte dei same prinsippa for å modellere folkehelse og biologiske prosessar. Statistikken gjer at vi kan sortere støy frå det som er relevant, samt forstå variasjon og usikkerheit. Ideane bak metodane er like sjølv om datasetta er ulike.

Vil forstå, ikkje føresjå

Ei rekke private selskap utfører analysar for å gi enkle svar om helse og livsstil og kva individet kan vente i framtida.

Det er berre eit fåtal sjukdomar som har ein sterk genetisk komponent. Dei fleste sjukdomane er resultatet av eit komplekst samspel mellom genetisk variasjon, miljø og livsstil. Richardson er skeptisk til verdien av prøveresultat som gir bastante predikasjonar. 

– Eg trur ikkje det å føresjå framtida burde vere vårt viktigaste fokus. Det er ikkje det som fascinerer meg. Eg vil først og fremst forstå kva som skjer i kroppen, seier ho.

Er du interessert i forskningsnyheter om realfag og teknologi? Abonner på vårt ukentlige nyhetsbrev(link is external) eller følg oss på Facebook.

Reproduserbar forsking

Richardson trekk fram fleire fordelar med store databasar for helseforsking.

– Ein fordel med store datamengder er at vi får høve til å evaluere modellane våre. Vi kan bruke halve datasettet til å finslipe modellen og algoritmen, og så teste om dei held vatn på den andre halvdelen, seier ho. 

Forskingsresultata frå slike datasett er som oftast også meir pålitelege enn enkeltstudiar. I Storbritannia har ein halv million menneske donert genetisk materiale og data om seg sjølv i over ti år (UK Biobank), ei gullgruve for statistiske modellar som koplar saman risikofaktorar for å betre folkehelsa i landet.

– Satsinga har også hjelpt til å diskreditere tilfeldige resultat frå små enkeltstudiar. Stordata bidreg til å gjere forskinga reproduserbar, seier Richardson.

– Vel statistikk

Ei stor utfordring er at det ikkje er nok biostatistikarar.

– Eg vil oppmode unge studentar til å velje statistikk. Det er ein veldig morosam jobb der du både får utfordra hjernen og samarbeida med mange ulike ekspertar, seier Richardson og avsluttar med eit sitat av sjeføkonom Hal Varian i Google:

– Statistikk vil bli den mest sexy jobben i framtida.

LES OGSÅ:

Meir statistikk-moro på Titan.uio.no: