Artikkel

Datamengden eksploderer – SIRIUS finner dataene og kobler dem

Sirius
Dette er startoppstillingen til SIRIUS-prosjektet. Når alle partnerne har kommet i sving vil de være fire ganger så mange. Foto: Gunhild M. Haugnes/UiO Bruk bildet.

Datamengden eksploderer – SIRIUS finner dataene og kobler dem

SIRIUS-prosjektet tar mål av seg å løse dataalderens tøffeste utfordring – å finne og sammenstille ulike data i en verden hvor datamengden og kompleksiteten øker kraftig.

For en vanlig PC-bruker kan det være ille nok å finne et bilde man ikke husker hvor man har lagret eller overføre en tekstfil skrevet i word til regneark.

Men i industrien, og ikke minst innen olje og gass, er dette betydelig mer krevende.

Det er ikke bare vanlige tekster og tall. Det er geologiske data som seismikk og andre komplekse datatyper. Dette er lagret i ulike databaser med ulike teknologier som i liten grad snakker sammen. Ofte er det også ulike språk, som for eksempel norsk, engelsk og mandarin.

sirius

Et nytt SFI (Senter for forskningsdrevet innovasjon) ved navn Centre for Scalable Data Access in the Oil and Gas Domain - Senter for skalerbar datatilgang i olje- og gass industrien

Finansieringen er i øyeblikket på nærmere 300 millioner kroner fordelt på Forskningsrådet, samt deltakende universiteter og industripartnere.

Deltakere:

  • Universitetet i Oslo (ledelse), University of Oxford, NTNU, Simula Reserach Laboratory
  • Statoil, Computas, Schlumberger, Kadme, Oracle, IBM, fluid Operation, OSIsoft, Numascale, Evry, Dolphin

Leter etter data mesteparten av tiden

Undersøkelser viser at en oljeingeniør kan bruke opptil 70 prosent av tiden på å finne og sammenstille data fra ulike kilder som han/hun trenger for å kunne begynne å gjøre jobben.

– Det er ikke uvanlig at en reservoar-ingeniør i oljeindustrien må bruke flere uker på denne fasen, sier senterkoordinator David Cameron ved Institutt for informatikk.

Sammen med informatikkprofessor Arild Waaler leder han SIRIUS, som er et SFI (Senter for forskningsdrevet innovasjon) som starter opp i disse dager.

Prosjektet vil løpe over åtte år og har en totalramme på nærmere 300 millioner kroner omtrent jevnt fordelt på Forskningsrådet, deltakende universiteter og partnerbedrifter.

Cameron bedyrer at dette er et prosjekt som kommer til å vokse i alle retninger. De har blant annet akkurat søkt om EU-midler på 200 millioner kroner.

– Hvis vi får gjennomslag hos EU, så blir vi nok det største prosjektet ved UiO noensinne, sier Waaler.

Men så dreier det seg da også om det som er dataalderens desidert vanskeligste oppgave. Datamengdene i næringslivet og samfunnet forøvrig skyter i været år for år, og det blir stadig vanskeligere å finne, få tilgang til den informasjonen man søker - og koble det sammen.

– Optique skapte muligheter                   

SIRIUS er delt inn i fem ulike områder:

  • Semantiske teknologier
  • Språkteknologi
  • Databaseteknologi
  • Høyytelses-datateknologi
  • Skytjenester

De semantiske teknologene handler om å utvikle intelligente metoder, slik at informasjon i ulike databaser kan tolkes av maskiner. Det innebærer at ulike teknologier og systemer må kunne snakke sammen – slik at dataene kan finnes, forstås og brukes av de som trenger dem.

Deler av SIRIUS-prosjektet er en utvidelse av EU-prosjektet Optique, som ble startet i 2012 og som avsluttes til høsten. Optique handler om Big Data, det vil si utvikle systemer som finner fram riktig informasjon i enorme databaser.

– Optique har vært veldig vellykket og har skapt et mulighetsrom til å satse videre gjennom å bygge ut prosjektet, sier Waaler som også leder Qptique.

Tolker språk

Mange dokumenter er på ulike språk. Google, Apple og mange IT-selskaper andre utvikler intelligent oversettelsesteknologi - som Google Translate og Siri.

Det gjør også forskere over hele verden, blant annet en språkteknologigruppe på UiO.

SIRIUS-senteret vil også ta i bruk og videreutvikle slike teknologier slik at dokumenter og data på ulike språk kan tolkes riktig.

Slik kan teknologien hjelpe med å finne riktige data og dokumenter – uavhengig språk.

Databaser, skyteknologi og ytelse

En del av databaseteknologien i olje- og gass-industrien harmonerer dårlig med kravene til prosessering og lagring.

Den samhandler heller ikke godt med moderne skybasert teknologi. Men samtidig ligger det mye viktige data i disse databasene.

En viktig del av SIRIUS-prosjektet blir å utvikle og introdusere nye og forbedrede skytjenester i bransjen. Samtidig vil vi utvikle systemer som integrerer de ulike teknologiene, sier Waaler.

Prosjektet vokser seg stort

Ved oppstarten er det 25 forskere i sving ved UiO, men det vil etter hvert stige til rundt 100 når alle partnerne er i gang. 

Prosjektet har også knyttet til seg psykologer ved NTNU som har jobbet med arbeidsprosessene, noe som ikke minst har vært nyttig i oppstartsfasen.

Arild Waaler, David Cameron
Arild Waaler og David Cameron leder et prosjekt som kan bli UiOs største noensinne. Foto: Gunhild M. Haugnes/UiO

– Dette er et foroverlent løp, vi blir etter hvert en ganske stor «bedrift» med mange ulike aktiviteter, sier Cameron.

Målet er at de deltakende universitetene og industripartnerne i SIRIUS (se faktaboks) skal bygge opp sin kompetanse og ta i bruk ny og innovativ teknologi som utvikles. Dette vil i sin tur kunne føre til effektivisering og enorme besparelser.

Nettverk og bedriftsetableringer

Han påpeker at nettverksbygging, utvidelse av prosjektet og innovasjon vil være sentralt framover.

Et av samarbeidene er med et annet SFI ved UiO, Big Insight, som jobber med analyse og statistikk i store datamengder.

Det skal bygges opp et innovasjonsprosjekt i skjæringspunktet mellom SIRIUS og Big Insight.

– Vi ønsker også å søke samarbeide med ulike bedrifts- og innovasjonsnettverk – som for eksempel Subsea Valley og Oslotech/StartupLab, sier Cameron.

Slike nettverk vil ikke minst bli viktig i forbindelse med innovasjonen man håper vil komme ut av prosjektet.

– Vi håper og tror at forskere og andre SIRIUS-deltakere vil starte egne gründerbedrifter basert på kunnskap og teknologi som utvikles, sier Waaler.

Lederduoen er også overbevist om at prosjektet vil gi ideer og grobunn for nye forskningsprosjekter innen feltet.

Her kan også EU-prosjektet de nettopp har søkt om komme inn. Det handler om spesifikke teknologier innen olje og gass - som effektivisering av vedlikehold, reservoar-teknologi og geofysikk.

Bedre pasientbehandling

Samtidig mener Cameron og Waaler at teknologiene og metodene som utvikles kan bli svært nyttig også i industrien for øvrig, samt i offentlig forvaltning og helsesektoren.

– Også helsedata er lagret på mange proprietære systemer og plattformer som ikke snakker med hverandre. Teknologiene vi utvikler i SIRIUS kan bidra til effektivisering og bedre pasientbehandling, sier Waaler.

Han forteller at SIRIUS er populært og at det er mange flere som gjerne vil bli med.

– Det er jo hyggelig. Og vi vil holde døra på gløtt, men de som kommer inn må være aktører som har noe å tilføre – for eksempel kompetanse vi mangler.

– Relevant for vår industri

Det er flere årsaker til at Statoil ønsket å bli med som industripartner til SIRIUS.

– Det er veldig relevant for vår industri. Vi ser det også som en mulighet for å styrke IT-fagmiljøet og bygge opp kunnskapene våre på feltet, sier seniorrådgiver Knut Sebastian Tungland i Statoil.

Han påpeker også at Statoil gjennom SIRIUS vil kunne teste ut ny teknologi og få tilgang til viktig programvare. Statoil er også med i Optique og Tungland sier det har vært en god arena for selskapet.

– Vi har knyttet kontakter både ved universitetene og EU. Vi har også fått nyttige leveranser av teknologi, sier han.

Som i industrien for øvrig så vokser datamengdene hos Statoil eksplosivt og det blir stadig mer krevende å finne dem. Det er også svært ulike typer informasjon – alt fra seismikk og forkastninger til HR- og administrative data. Samtidig er dataene lagret på ulike teknologiske plattformer.

Å raskt kunne finne, kombinere, og ta i bruk disse dataene vil øke effektiviteten betraktelig.

– Når vi for eksempel skal gå i gang med et nytt oljefelt er det svært viktig å kunne bruke erfaringer og kunnskaper fra tidligere feltutbygginger. Gjennom Optique har vi fått metoder og verktøy som bidrar vi lettere kan finne disse dataene vi trenger og sette dem i en kontekst.

– Bygge langsiktig kompetanse

– SIRIUS er et veldig viktig forskningsinitiativ innen olje & gass, som setter fokus på analyse og bedre håndtering av enorme datamengder innenfor oljesektoren. IBM ønsker å bygge langsiktig kompetanse på dette området, som også er viktig for Norge, sier Morten Dalsmo, direktør innen IBMs olje- og gass-satsing i Norge.

Han påpeker at IBM blant annet vil bidra inn i prosjektet med den åpne innovasjonsplattformen Bluemix. Den bidrar til raskere utvikling av nye tjenester, og bedre utnyttelse av eksisterende data. SIRIUS-prosjektet er forankret i IBMs globale samarbeid med universiteter og høyskoler, IBM Academic Initiative.

– Et slikt samarbeid på tvers av akademia og industripartnere er høyt prioritert i IBM, og et viktig element for å kunne legge til rette for åpen innovasjon og bedre løsninger for våre kunder.

Les også på Titan.uio.no

Vil redde nordiske språk i dataalderen: Skal forskning på språkteknologi overlates til Google, Facebook og de andre IT-gigantene alene?

Nå blir internett raskere, sikrere og enklere: – Det er mye som er feil med internett, veldig mye kan forbedres, mener professor Michael Welzl

Kontakt:

Professor Arild Waaler, Institutt for informatikk http://www.mn.uio.no/ifi/personer/vit/arild/index.html

Dr. David Bruce Cameron, Institutt for informatikk

Andre artikler om SIRIUS og Optique

Nytt senter skal løse en av industriens største utfordringer

De løser dataalderens tøffeste utfordring

Optique

Skriv ny kommentar

Verifiser deg (din epost-adresse vil ikke bli vist offentlig)

Les også

Bakterier

Bacteria: The New Superheroes

Bacteria have a poor reputation, but they are also important collaborators, for instance in medicine. Ambitious researchers use computers to push bacteria beyond their limits.
Bakterier

Bakterier – de nye superheltene

Bakterier har et dårlig rykte, men er også en viktig samarbeidspartner for eksempel i medisin. Ambisiøse forskere bruker datamaskiner for å oppdage bakterienes egenskaper.

Bakterier er overalt.

Adam Heikel

Showtime for nye helseprosjekter

Behandling av hjertesvikt ved hjelp av elektrisk bioimpetans. Sink-basert molekyl som kan bidra til å bekjempe antibiotikaresistens.