Artikkel

Et Big Bang trenger Big Data

Big data illustrasjon
GAMBIT vil samle all data fra fysikk og astrofysikk for å teste våre fysiske teorier. For å gjøre det må GAMBIT takle utfordringene med Big Data. Illustrasjon: Colourbox.

Et Big Bang trenger Big Data

Du har sikkert hørt om «Big Data». Kan du forestille deg hvilken vitenskapelig teori som virkelig trenger Big Data? Det er selvfølgelig teorien om alt! Teorier som omfatter hele universet.

GAMBIT er et dataverktøy som skal brukes til å utforske nye fysikkteorier ved å bruke alle kjente astrofysiske og partikkelfysiske data. Professor i fysikk ved Fysisk institutt ved UiO Are Raklev, er blant bidragsyterne i GAMBIT-prosjektet.

GAMBIT

GAMBIT står for “The Global And Modular BSM Inference Tool”

GAMBIT er utviklet av nesten 30 teoretikere og eksperimentalister verden over.

Are Raklev fikk i 2014 støtte til prosjektet gjennom Forskningsrådets satsing «Fellesløftet».

GAMBIT ventes å komme med sin første publikasjon innen svært kort tid.

Raklev forklarer her hvordan GAMBITer spesialkonstruert til å takle «Big Data» og hvordan dette skal hjelpe oss i søken etter de beste teoriene innen grunnleggende fysikk.

Kunnskap er makt

Big Data er et resultat av at datamaskiner i dag er blitt ekstremt god til å registrere informasjon. Harddisker og prosessorer med stadig høyere kapasitet har ført til at vi har muligheten til å samle enorme mengder data.

Det er verdifullt på mange måter. Store datamengder kan for eksempel avsløre mønster vi ellers ikke ville ha oppdaget, eller bare i kraft av datamengden gi ny informasjon som vi ikke på forhånd kunne ha kjennskap til.

Begrepet «Big Data» oppstod da forskjellige selskaper kom opp med programvare for å behandle store mengde data for nettopp å avsløre skjulte hemmeligheter i de store datamengdene.

Are Raklev
Professor i fysikk og del av GAMBIT, Are Raklev. Foto: Hilde Lynnebakken

– Dette er også svært relevant for moderne forskning. Dagens situasjon er at vi ofte har tilgang til enorme mengde data. Så mye data at vi ikke vet hva vi skal gjøre med den. Dette gir forskningen helt nye redskaper og muligheter i fremtiden, for en slik tilgang til fakta har vi aldri vært i nærheten av før.

En lakmustest på de store teoriene

GAMBIT er et samarbeidsprosjekt som samler folk fra hele verden.

– Nå består GAMBIT-gruppen av forskere fra hele verden. Vi har eksperter på hvert sitt felt, programmering, teoretisk fysikk, statistikk og eksperimentell fysikk.

Målet er å utvikle et dataverktøy som kan benytte «Big Data» for å teste de store teoriene innen grunnleggende fysikk.

– Målet er å samle all relevant data innen partikkelfysikk og astrofysikk og bruke denne dataen til å teste eksisterende teorier. Hvordan står de seg når vi tester dem opp mot alt vi vet om universet i dag.

Dette henger sammen med «Teorien om alt», som brukes om en framtidig teori innen fysikk som - om mulig - fullstendig vil forene teorien om kvantemekanikk med Einsteins generelle relativitetsteori.

LES MER: Relativitetsteorien runder 100: I november i 2015 var det 100 år siden Albert Einstein la frem teorien som regnes som det største gjennombruddet i fysikkens histoire og gjorde Einstein selv til superstjerne.

I dag opererer fysikerne med det de kaller standardmodellen, som kort fortalt er en praktisk men ufullstendig forening av de to modellene.

Plukke lovende hypoteser

– Poenget er at vi har mange hypoteser om hvordan alt kan henge sammen, men de er bare muligheter. GAMBIT kan hjelpe oss i å plukke ut de hypotesene som er mest lovende. Hvis teori og data ikke stemmer godt overens med hverandre er det et tegn på at teorien ikke holder mål.

For GAMBIT kan ikke gjøre oppdagelser.

– Det den derimot er skapt for er å teste oppdagelser. Teste teorier opp mot alt vi vet om fysikk. Ta i bruk all relevant data vi har.

– Hvilken data er det snakk om?

– Det registreres en enorm mengde informasjon som er relevant. Og datamengdene bare øker i hyppighet. En viktig kilde er all høyenergifysikk som ved CERN. Når CERN kolliderer partikler i superhøy hastighet så er det en enorm mengde data som registreres.

Men det er mange kilder.

Bilde av  de som utgjør GAMBIT
GAMBIT-gruppen var samlet på Geilo våren 2015. Fysisk institutter på bildet representert med stipendiat Anders Kvellestad, professor Torsten Bringmann og professor Are Raklev. Foto: Joakim Edsjö/GAMBIT.

– Ja, det er snakk om alt vi har av data fra kosmisk stråling, presisjonsinstrumenter som måler fundamentale fysiske fenomener og som sagt data fra CERN.

GAMBIT tilgjengeligjør Big Data

På jakt etter fysikkens stordatahemmeligheter er statistikk det store verktøyet. Det er igjennom programmer som bruker statistisk analyse at vi har muligheten til å benytte Big data til det fulle.

Men all denne dataen skaper et statistisk problem.

– Man har sett på store undersøkelser der man tar i bruk såkalt Big Data. Og da kommer loven om store tall inn. Vi begynner å se statistiske avvik som i vanlig forskningsøyemed skal bety noe, men som i virkeligheten er en statistisk tilfeldighet.

Statistisk sett vil det oppstå tilfeldige og falske sammenhenger når man sammenligner svært store datasett. Vi har så mye data at mengden i seg selv blir et problem.

– Vår evne til å registrere virkeligheten har faktisk gjort denne typen forskning vanskeligere i dag enn den var før da man opererte med enklere modeller, med færre parametere.

Logo til Gambitgruppen
GAMBIT-prosjektets logo. Illustrasjon: GAMBIT.

Det er her GAMBIT kommer inn. Den er nemlig bygd slik at den kan forholder seg til statistiske tilfeldigheter på en ordentlig måte.

– Hvordan klarer dere å unngå statistiske tilfeldigheter?

– Det vi har gjort er å samle en rekke av de beste kjente statistiske metodene for store datasett, i form av såkalte algoritmer, sammen i en pakkeløsning. En slags lærebok i store datasett, som enkelt kan brukes på nye modeller og nye data. GAMBIT gir fysikere med modeller med mange parametere en oppskrift på hvordan man skal behandle «Big data».

GAMBIT regner på Higgs

Raklev tror GAMBIT kan benyttes innen mange fagfelt, men at GAMBIT selv bare opererer innenfor fysikken.

– Vi arbeider spesifikt for vårt fagfelt. Vi driver med fysikk.

– Det er det vi bruker GAMBIT til å regne på, men vi tror at slike algoritmer har relevans for andre. Vårt mål er en åpen kode som alle kan ta i bruk. Det skal være et slags «gjør det selv»-system inne store datasett.

– Hva gjør egentlig GAMBIT?

– GAMBIT handler om programvare for en stor samling av prosessorer. Det vi teknisk sett gjør er at hver prosessor parallelt tenker på hvert sitt eksperiment for hver sin versjon av modellen. De sender så resultatene sine til en sentral prosessor som sammenligner de forskjellige resultatene og styrer hvordan modellen skal utforskes.

Akkurat nå arbeider GAMBIT med data fra CERN sin oppdagelse av Higgs-partikkelen.

– Vi har puttet all data tilgjengelig fra Higgs-oppdagelsen inn i modellen og ser på konsekvensene. Hva skjer for eksempel med de forskjellige supersymmetriske modellene når man tar utgangspunkt i det vi nå vet om Higgs-partikkelen?

Raklev tror det kan føre til at enkelte teorier innen fysikkvitenskapen blir utelukket.

– Min forutsigelse nå er at vi kommer til å ende opp med enkelte supersymmetriske modeller som er utelukket, og andre igjen foretrukket på bakgrunn av de fysiske dataene vi sitter på.

Kontakt:

Are Raklev, professor ved Fysisk institutt.

Les mer:

Et ekstremt usannsynlig bilde

En veritabel cliffhanger fra Cern

GAMBITs hjemmeside.

Skriv ny kommentar

Verifiser deg (din epost-adresse vil ikke bli vist offentlig)

Les også