Nye statistiske metoder kan utmanøvrere hvitvaskere. Photo: Ola Sæther/UiO

Det blir vanskeligere å være svindler

Folk som snyter på skatten, hvitvasker penger eller lurer forsikringsselskapene, går usikre tider i møte. Nye statistiske metoder øker sannsynligheten for at de blir tatt.

Av Yngve Vogt – Apollon

Publisert 28. jan. 2019

Den svarte økonomien i Norge blomstrer. Hvert år unndras minst 150 milliarder kroner bare i skatter og avgifter.

Skatteetaten, Gjensidige Forsikring og DNB har nå gått sammen med forskere ved Universitetet i Oslo og Norsk Regnesentral for å ta innersvingen på økonomisk kriminelle. Prosjektet deres har fått det klingende navnet «Persontilpasset svindeldeteksjon».

Juksemakerne

DnB trenger bedre metoder for å jakte på dem som driver med hvitvasking, en oppgave de er lovpålagt å rapportere om.
Gjensidige Forsikring ønsker å avsløre dem som melder ifra at skader er mer alvorlige enn i virkeligheten eller oppgir for høye verdier på stjålne gjenstander.
Skatteetaten ønsker å ta i bruk nye metoder for å bekjempe den svarte økonomien. Tiltaket er godt nytt for alle dem som ikke jukser med skatten: «De som følger regelverket, skal ikke tape konkurransen mot dem som ikke følger regelverket.»

Takket være nye digitale muligheter vil de tre aktørene få tilgang til langt mer informasjon enn tidligere. Det gir enorme muligheter.

Momsjuks

En av kampsakene til Skatteetaten er å finne frem til nye metoder for å avsløre dem som jukser med innrapporteringen av merverdiavgift (mva). Hvert år tar Skatteetaten imot 1,6 millioner mva-meldinger. Mange av dem inneholder feil. Feilene skyldes enten at innmelderne bevisst overrapporterer kostnadene, underrapporterer inntektene, misforstår regelverket eller feilfører avgiftene. Det er umulig å sjekke alle mva-meldingene manuelt.

Ingrid Hobæk Haff utvikler nye statistiske metoder som gjør det mulig å finne de sakene der sannsynligheten for svindel er høy. Foto: Yngve Vogt/Apollon

– Skatteetaten må derfor ha et automatisk system for å sile ut hvem de skal se nærmere på. Så må saken sendes videre til en saksbehandler for grundigere vurdering, forteller førsteamanuensis Ingrid Hobæk Haff på Matematisk institutt ved UiO.

Årlig opprettes det 34 000 nye mva-pliktige bedrifter. Skatteetaten ønsker å lage en statistisk modell som allerede fra første dag kan angi risikoen for hvem som kommer til å jukse.

Beslektet svindel

Selv om hvitvasking skiller seg fra forsikringssvindel og skattesvindel, fins det visse likheter. Likhetene brukes til å utvikle nye statistiske metoder som skal avdekke lurendreierne.

De tre samarbeidspartnerne skal ikke utveksle hverandres datasett, men ved å bryne seg på forskjellige datasett med beslektede problemstillinger, kan statistikerne komme et godt stykke videre.

Dagens metoder fungerer ikke godt nok. Ingrid Hobæk Haff utvikler derfor nye metoder for å avsløre svindel.

– Hver gang det kommer inn en ny sak, ønsker vi å beregne sannsynligheten for at det er svindel, sier hun.

Prosjektet er en del av Big Insight, et senter for forskningsdrevet innovasjon ved UiO. Senteret har som spesiale å utvikle helt nye statistiske metoder for å avdekke irregulære mønstre i enormt store datamengder.

De fleste svindelforsøkene blir aldri kontrollert. Selv om en sak er kontrollverdig, er det likevel ikke sikkert at det lønner seg å sjekke den ut. Dataprogrammet skal derfor samtidig anslå den forventede gevinsten ved å undersøke saken.

Avslører lurendreierne

De nye statistiske metodene testes på datasett der innholdet allerede er kontrollert. Det betyr at statistikerne på forhånd vet hvem som er svindlere eller ikke.

– Vi kan da kontrollere resultatene våre opp imot fasiten. Ulempen er at vi ikke får sjekket programmet vårt på de sakene som ikke allerede er kontrollert. Sakene som ble kontrollert, hadde kanskje noe suspekt ved seg i utgangspunktet. Da er de ikke plukket ut tilfeldig.

Kontrolldatasettet kan derfor være skjevt vinklet fordi sakene som er manuelt plukket ut til kontroll, allerede er valgt ut etter visse kriterier.

Ingrid Hobæk Haff lurer derfor på om det finnes informasjon i resten av datasettet som utfyller den informasjonen de allerede har – og om det er mulig å utnytte denne informasjonen på et eller annet vis.

– Da må vi skille mellom «Ja, vi kjenner fasiten» og «Nei, vi kjenner ikke fasiten». Hele poenget er å finne de dataene som skiller seg ut.

Det som skiller seg ut, behøver ikke nødvendigvis være svindel. Og selv om den nye statistiske metoden kan føre til at flere blir avslørt, er det ikke sikkert at de får tak i alle. Det er ikke så farlig.

– Hvis vi gjør metoden bare litt bedre, kan det likevel føre til store gevinster. Metoden må også ta hensyn til at svindlere endrer måten å jukse på, påpeker hun.

– Hvis vi avslører hva som er svindel, prøver svindlerne andre metoder i stedet. Vi må derfor stadig utvikle nye metoder.

Vil du ha flere forskningsnyheter om teknologi og realfag? Følg Titan.uio.no på Facebook eller abonner på nyhetsbrevet vårt

Matematisk kinkig

En av de mange matematiske vanskelighetene er ubalanserte datasett. Svindelsakene utgjør bare en liten andel av alle sakene. Ettersom det er vanskelig å plukke dem ut, er det fare for at saksbehandlerne får beskjed om å sjekke ut mange saker der alt er i orden.

– Vi ønsker bare å finne de sakene der sannsynligheten for svindel er høy.

Et annet kinkig problem for matematikerne er ikke bare den store datamengden, men også de mange avhengighetene mellom de ulike dataene.

– Flere variabler i et datasett kan gi den samme informasjonen. Da er det mange av de statistiske metodene som begynner å slite, forklarer Hobæk Haff.

Og som om dette ikke er nok:

– Vi har mye informasjon med forskjellige statistiske egenskaper. Noe av informasjonen kan ha alle mulige verdier, og noe kan ha bare få verdier. Denne kombinasjonen kan være vanskelig matematisk.

Bedriftshemmelighet

Norge er ikke det første landet i verden som forsker på å avsløre svindel. Ingrid Hobæk Haff har derfor sjekket hva andre forskere har gjort.

– Vi har testet metodene deres, men de løser ikke problemene våre slik vi ønsker det, sier hun.

– Jeg vil absolutt anta at store forsikringsselskaper og banker ute i den store verden har løst problemet med egne statistiske metoder. De publiserer ikke løsningene sine. De forblir derfor godt bevarte hemmeligheter..

Artikkelen ble først publisert i Apollon

Saken finnes også på engelsk her.

Emneord: Matematikk