Image
""

Anbefalingssystemet til Finn.no bygger på dyp læring. (Skjermdumper fra Finn.no. Montasje: UiO)

Finn.no får flere klikk når søkemotoren tar høyde for usikkerheter

For å øke trafikken på Finn.no har matematiker Simen Eide laget et system som beregner sannsynligheten for hva alle brukerne er interessert i.

Uansett hva du leter etter på Finn.no, landets største markedsplass, blir de automatiske annonse-anbefalingene mer relevante desto mer Finn.no tar hensyn til usikkerhetene.

Etter at nettstedet tok i bruk nye usikkerhetsberegninger, har den gjennomsnittlige brukeren klikket seg inn på sju prosent flere annonser enn tidligere. Mer trafikk betyr større omsetning og mer penger i kassen.

– Det gjelder å engasjere brukeren nok til at han bryr seg om hva vi anbefaler, forteller data scientist Simen Eide på Finn.no. Han tar nå en doktorgrad på BigInsight – et senter for forskningsdrevet innovasjon ved Universitetet i Oslo – om hvordan det er mulig å bruke kunnskapen om usikkerheter for at markedsplassen kan anbefale de beste annonsene til nettopp deg som bruker.

Ut av digital boble

La oss ta det hele fra starten. Du har klikket ti ganger på noe du er interessert i. Anta du har sett på ti biler. Før ville Finn.no ha anbefalt deg annonser med tilsvarende biler.

– Det er vanligvis slik anbefalingsalgoritmene fungerer, sier Eide.

Dette har noen uheldige konsekvenser. Hvis du bare blir anbefalt det markedsplassen tror du ser etter, havner du i en digital boble.

– Da vil ikke anbefalingene dekke hele interessebredden din. Simen Eide har forsøkt å gjøre noe med dette. Det har vært alt annet enn enkelt. Selv om Finn.no sitter på enorme mengder data, vet de nesten ingenting om den enkelte bruker.

– Usikkerheten er svært stor om hva brukeren er interessert i. Hvis du har sett på ti biler, men også er interessert i noe annet, er det i tillegg viktig for oss å oppdage de andre interessene dine, sier Eide.

– Hvis folk finner annonsene mer interessante, vil de kjøpe og selge mer, sier matematiker Simen Eide i Finn.no. Foto: Yngve Vogt/UiO

Dyp læring

For å klare dette må Simen Eide kvantifisere usikkerhetene. Anbefalingssystemet til Finn.no bygger på dyp læring, en viktig metode for å trene opp datamaskinen til å gjenkjenne mønstre i dataene. Problemet med dyp læring er at denne metoden ikke tar hensyn til usikkerheter.

– Vi prøver nå å bake inn usikkerheten i den dype læringen.

Hvis du har sett på 15 biler og ett sofabord, er det best å vise annonser av biler, men det er samtidig en viss sannsynlighet for at du også har andre preferanser. Simen Eide tar derfor også hensyn til hva de andre brukerne, med tilsvarende interesser for biler, ser etter.

– Det eneste vi vet er at en bruker som har sett på en bil, også har stor sannsynlighet for å se på en annen bil, sier Eide.

Da må Finn.no finne den rette bilen blant de to millioner gjenstandene som finnes i databasen deres.

LES OGSÅ: Når skal kunstig intelligens bli gunstig intelligens?

50-dimensjonal fotballbane

For å skjønne hvordan Finn.no tenker, kan du se for deg at nettstedet har plassert alle annonsene – det er altså mer enn to millioner av dem – utover en fotballbane. Hver gang en av brukerne tar en titt på to bestemte annonser, blir disse to annonsene plassert nærmere hverandre på fotballbanen.

– Brukere har en tendens til å se på lignende ting over tid. Kanskje vil alle de dyre bilene havne på den ene siden av fotballbanen, mens sofaene havner på den andre siden, forklarer Eide.

Jo kortere avstanden er mellom to objekter, desto større er sannsynligheten for at de to annonsene blir vist til samme bruker.

Det er ikke mulig å plassere alle objektene på en todimensjonal fotballbane. Simen Eide jobber heller ikke i tre dimensjoner.

– Vi er nødt til å sortere alle annonsene på en fotballbane med femti dimensjoner. Vi trenger så mange dimensjoner for å kunne finne den rette avstanden mellom alle annonsene.

Sannsynlighetsfordeling

Så kommer neste problem. Det handler om det Eide kaller kaldstartproblemet.

– Hvis det legges ut en ny bilannonse, er det ingen som har sett på denne bilen før. Da er det umulig å legge ut bilen på fotballbanen.

Poenget er å anbefale den til brukere så tidlig som mulig. Og det er nå vi omsider kommer til hovedpoenget om usikkerheter. Og nå snakker han om brukerne og ikke annonsene. Han legger også brukerne inn på fotballbanen.

– Vi legger også brukerne på fotballbanen, men vi er usikre på nøyaktig hvor de skal plasseres. Det er ikke nok å legge dem på et bestemt punkt. Vi må også lage en sannsynlighetsfordeling for hvert av disse punktene.

Det betyr at alle brukerne får et område på fotballbanen der de med en viss usikkerhet kan ligge.

– Sannsynligheten blir da kanskje størst for at brukeren fortsatt ønsker å lete etter en annen bil, mens sannsynligheten også er til stede for at han har lyst til å se etter et sofabord, sier Eide.

Etter at Finn.no la denne spesielle formen for usikkerhet inn i modellen, økte klikkraten med sju prosent.

– Det er bra. Hvis folk finner annonsene mer interessante, vil de kjøpe og selge mer. Vi får da mer fornøyde brukere, samtidig som Finn.no får en sterkere posisjon i markedet.

Tunge beregninger

Det krever en del datakraft for å ta hensyn til alle usikkerhetene, men det er ikke noe stress for akademikere. Det har ingenting å si for dem om de må bruke en ukes databeregninger for å trene opp modellen.

I det virkelige liv er en uke altfor mye. Før alle beregningene er i boks, er resultatene i mellomtiden blitt irrelevante. Det er derfor viktig at markedsplassen klarer å løse beregningene i løpet av noen få nattetimer, slik at brukerne kan få de beste anbefalingene når de setter seg ved tastaturet neste morgen.

– Jo fortere vi får dette til, desto mer ferskvare blir resultatene, sier Eide.

Det beste hadde vært om det var mulig å trene opp modellen i sanntid, slik at Finn.no vet hva brukeren er interessert i der og da.

– Med en liten algoritme skal det være mulig å få fornuftige resultater i løpet av 80 millisekunder. Det betyr at systemet vårt kan beregne hva du liker best hver gang du klikker deg inn på nettstedet.

Spiller med åpne kort

Selv om alle algoritmene blir publisert i vitenskapelige tidsskrifter, er ikke Simen Eide redd for at noen andre luringer skal stikke av gårde med ideene hans.

– På konferanser utveksler vi ideer med konkurrentene våre. Verdien av algoritmene er begrenset kommersielt. Finn.no er mye mer enn dette. Men den gangen jeg jobbet i finansverdenen, diskuterte vi ikke løsningene med andre. Det hadde vært mye farligere for bedriften.

Artikkelen ble først publisert hos Apollon.