Artikkel

Nå blir tolkningen av nett-klikkene dine smartere

Sylvia Liu, Arnoldo Frigessi, Ida Scheel, Ingrid Glad, Evgenij Thorstensen og Daniel Bakkelund
Noen av dem som jobber med å utvikle mye metoder innen dataanalyse og er tilknyttet DataScience@UiO: Sylvia Liu (t.v.), Arnoldo Frigessi, Ida Scheel, Ingrid Glad, Evgenij Thorstensen og Daniel Bakkelund. Foto: Gunhild M. Haugnes/UiO Bruk bildet.

Nå blir tolkningen av nett-klikkene dine smartere

UiO-forskere utvikler nye metoder for å gi deg bedre tjeneste basert på klikkene dine og oppførselen ellers på nett.

Du har sett på et hotell eller en bok på nettet, og etterpå forfølger hotellet og boken deg i evigheter i form av annonser. Dette skjer uavhengig av om du har bestilt dem, om du har forkastet dem eller om du fortsatt er interessert. Mange synes dette er irriterende.

– Det finnes mange tjenester som baserer seg på algoritmer som tar i bruk klikkdata for hver enkelt av oss. Slike data samles og brukes innen en rekke områder, ikke bare i næringslivet, men også innen politikk og underholdning, sier statistikkprofessor Ingrid Glad.

Hun leder innovasjonsklyngen DataScience@UiO. Et av prosjektene de jobber med, er nye tilnærminger og algoritmer som skal gi bedre kunnskap om de ulike brukerne, slik at man skal kunne foreslå mer relevant informasjon for dem.

Klikk avslører preferanser

– Brukernes klikk på nettsider, vurderinger og rangering av ulike tjenester avslører preferansene deres, sier Sylvia Liu, som i sitt doktorgradsarbeid samarbeider med Finn.no og NRK med å utvikle slike tjenester.

Når det gjelder NRK handler det om å få på plass en brukertilpasning av kanalens internettbaserte TV-innhold. Brukerne skal blant annet få innholds-anbefalinger basert på hva de har valgt tidligere.

Metoden hun har utviklet, ligner på filmtjenesten Netflix - som foreslår nye filmer for deg basert på filmer du har sett før.

Liu understreker imidlertid at det er krevende å få laget en treffsikker løsning.

Hvorfor hopper seeren av?

Dataene kan vurderes på ulikt vis. Hvordan tolker man for eksempel at en seer skrur av etter 5 minutter eller 15 minutter, eller hopper av en serie etter én episode? Er det fordi han/hun ikke liker filmen, eller plutselig ikke har tid, eller skjer det noe uforutsett i vedkommendes liv? 

– For å lage en god anbefaling for deg, må man sammenligne deg med andre brukere. Man må finne de som ligner mest på deg og se hva de har sett som du ikke har sett ennå, sier Liu.

Hennes veiledere, professor Arnoldo Frigessi og førsteamanuensis Ida Scheel, nikker.

De påpeker at utfordringen er å få tilgang til data av så høy kvalitet at man kan komme med forslag som oppleves som nyttige av brukeren. Derfor legges det opp til at man ikke gir anbefalinger før man vet nok om vedkommende.

– Dårlige anbefalinger virker mot sin hensikt, sier Scheel.

– Vi jobber videre med vår metode. Den er basert på en statistisk modell som vi har kalt BayesMallows. Er vi bedre på testdata enn de metodene som brukes i industrien, skal vi prøve den ut i samarbeid med Finn.no og NRK, sier Frigessi – som også leder BigInsight, som er et Senter for forskningsdrevet innovasjon (SFI).

For små og store forskningsnyheter om teknologi og realfag: Følg Titan.uio.no på Facebook eller abonner på nyhetsbrevet vårt

Brukertilpasning - en het trend

Frigessi påpeker at personifisering og brukertilpasning av ulike tjenester på nett er en het trend som bare vil forsterke seg framover.

Bayesiansk statistikk

  • UiO-forskere utvikler de nye algoritmene basert på såkalt bayesiansk statistikk.
  • Det er en metode for å analysere data som er beheftet med usikkerhet og variasjon – og er et sentralt begrep i statistisk analyse.
  • En Bayes-analyse består i å utlede sannsynlighetsfordelingen til ukjente størrelser i lys av dataene.

På dette feltet har Liu utviklet en metode gjennom bruk av sanntidsdata og bayesiansk statistikk.

Denne metoden har potensial til å bli kommersielt interessant. Derfor er den meldt inn som oppfinnelse, en såkalt DOFI (Disclosure of Invention) til UiOs kommersialiseringsenhet Inven2.

Forskning, nytt studium, drop-in-tjeneste

DataScience@UiO-klyngen har også satt i gang flere andre aktiviteter. Blant annet er det utviklet et nytt og svært etterlengtet masterprogram innen data science, som starter til høsten.

Senteret har også fått etablert drop-in tjenesten DataScience@UiO Advisory Service for UiO-forskere som trenger hjelp med å analysere data.

Ting, som består av ting, som består av ting

Også tre andre forskningsprosjekter er satt i gang. Et av dem har tilknytning til digitaliseringen som pågår i oljeindustrien. Doktorgradsstipendiat Daniel Bakkelund ser på data om utstyr og hvordan dette er registrert i databaser. Over tid kan det forekomme avvik i hvordan utstyr blir registrert. Dette kan i sin tur skape problemer når man nå ønsker å øke graden av automatisk datahåndtering.

– Jeg ser på modeller av ting, som består av ting, som består av ting. En bil, for eksempel, består av deler, som igjen består av deler, og så videre. Det samme gjelder utstyret som benyttes i oljeindustrien, og jeg ser på data som nettopp beskriver hvordan utstyr er satt sammen av annet utstyr, sier Bakkelund.

Han jobber med å utvikle metoder for automatisk å finne avvik i disse dataene og å foreslå metoder for å gjøre dataene mer enhetlige. Målet er å komme frem til generelle metoder og teorier som vil være nyttige ikke bare i oljeindustrien. Partner i prosjektet er TechnipFMC.

Mer på Titan.uio.no:

Kontakt:

Professor Ingrid Glad ved Matematisk institutt

Lese noe om statistikk?

Statistiske metoder i medisin og helsefag, av Odd O. Aalen, Marit B. Veierød, Arnoldo Frigessi, Tron Anders Moger, Ida Scheel, Eva Skovlund

Kommentarer

Problematisk?

Og kva med dei etiske problemstillingane rundt dette?

Hei.
Ang. tolkning av nettfart.
For meg så er dette noe bom i utvikling. Først må en få muligheten til å ikke bli en del av dette, slik at et søk blir helt rent og nytt, og dermed også får forslag på områder en ikke har vært innom tidligere.
Helsing
Egil

Explore & Exploit

I am happy that I have an algorithm that understands what my preferences are. When I search for a name, usually I look for a scientist, and not for a musician or an actor: fine that the scientist comes on top of my search. (If I look for the musician, I know I have to add music beside the name.) This allows me to use my time for more important and useful activities. It gives me more freedom, in fact.

There are many different things that can be done with my preferences. For example, one can suggest items that are very different from my usual ones I tend to search for. This would allow me to explore new aspects. There are these concepts: explore and exploit. Exploit my preferences to suggest things I probably look for; Explore new items that are not the ones I usally prefer. Most recommender systems are both explore and exploit, and answer to my request (what film will I see, what webpage do I need).

There is also a lot of misuse of preferences. The ethical problem comes from the fact that organisations (Cambridge Analitica fro example) use my preferences to tell my false stories, or they try to sell me things which I do not need, or try to influence my choices. This should be illegal, to use my preferences to mislead me. My preferences should only be used when I request this (as it would help me). I alsowant to know who is using my data and why and how. Our algorithms are open and published.

A very important discussion.

Skriv ny kommentar

Verifiser deg (din epost-adresse vil ikke bli vist offentlig)

Les også

Simone Mester

Teknologien som kan gjøre kreftmedisin mer effektiv

Simone Mester har utviklet en teknologi som kan forbedre virkningstiden til biologiske kreftmedisiner ved at de holder seg lenger i blodet. Det gjør at medisinen kan drepe flere kreftceller og å gi mindre bivirkninger.