Maskinlæring og samarbeid om antihvitvasking i banksektoren
- Avdeling SAMBA
- Involverte fagområder Statistisk modellering, Maskinlæring og Kunstig intelligens (AI)
- Sted Norsk Regnesentral
En oppsummering og status etter seminaret
Den 13.juni 2024 arrangerte NR det første seminaret om kampen mot hvitvasking ved hjelp av datakraft. Seminaret ble støttet av Finansmarkedsfondet og samlet i underkant av 60 deltakere, der mange var analytikere, utviklere og ansvarlige for antihvitvaskingsarbeidet i norske banker. Totalt var over ti ulike banker representert. De øvrige deltakerne bestod av representanter fra FinTech, finansiell etterretning (Økokrim og Politiets IT-enhet), forskere, samt ulike andre bedrifter både med og uten rapporteringsplikt.
Vi har gjort opp status, og her er en oppsummering på en del av tematikken som ble tatt opp i presentasjonene, kommentarene og diskusjonene under seminaret.
Program
Fra kl 08.45 | Registrering, kaffe og velkommen |
---|---|
kl 09.00 | Dagens hvitvaskingssystem, status på forskning innen bruk av ML til AML. Martin Jullum, seniorforsker Norsk Regnesentral |
kl 09.30 | Bruk av ML for AML i Norges største bank. Roger Olafsen, fagleder Data Science AML, DNB |
kl 10.00 | Bruk av ML for AML i en mellomstor bank. Helene Tangen, leder anti-hvitvasking, SpareBank 1 Utvikling |
Pause kl 10.30 | |
kl 10.45 | Bruk av ML for AML til en liten bank. Jo Endre Reite, direktør personmarked, BN Bank |
kl 11.15 | Prosjektet «Maskinlæring uten datadeling» i Datatilsynets sandkasse. Alexander Skage, CEO, FinterAI |
Felles lunsj 11.45 | |
kl 12.45 | Erfaringer fra danske prosjekter om datadeling for AML-formål. Tobias Thygesen, director Fintech, Betalingstjenester og Governance, Det danske Finanstilsynet |
kl 13.15 | AML-arbeid hos Økokrim i dag (og i fremtiden?). Nina Prestårhus Bjærke, spesialetterforsker, Økokrim og Eva Helena van Schijndel, Senior Data Scientist, Politiets IT-enhet |
Pause kl 13.45 | |
kl 14.00 | Gruppediskusjon om fremtidens hvitvaskingssystem |
kl 15.00 | Oppsummering |
kl 15.15 | Vel hjem |
Maskinlæring i bankene
For ti år siden var det svært få banker i Norge som brukte maskinlæring eller andre avanserte, datadrevne metoder i sitt antihvitvaskingsarbeid. Den elektroniske transaksjonsovervåkningen bestod, for eksempel, i stor grad av manuelle regelbaserte deteksjonssystemer som er både tidkrevende å vedlikeholde og enklere å omgå.
Gledelig nok er status i dag at de fleste bankene bruker datadrevne metoder som maskinlæring som en del av sitt antihvitvaskingsarbeid. Det er imidlertid stor forskjell på akkurat hva de ulike bankene bruker maskinlæringen til, og hva slags metoder og modeller som benyttes. Store banker som DNB utnytter deres størrelse ved å lære mønstre fra historiske hvitvaskingssaker. Mindre banker har naturlig nok færre hvitvaskingssaker å lære fra, og må dermed tenke annerledes, også fordi deres kundesegment skiller seg betydelig fra de større bankene. BN Bank har for eksempel hatt god effekt av å bruke modellert kunderisiko inn i undersøkelsene av mistenkelige transaksjoner. I mange banker brukes det betydelige ressurser på metodikk som kan bidra til å redusere antall falske positive i den manuelle undersøkelsen av mistenkelig transaksjoner. Slik effektivisering vil bety mer tid til grundige undersøkelser, og forhåpentligvis bedre og mer relevante MT-meldinger for Økokrim.
Generelt er det i stor grad styrt læring som brukes til datadrevet antihvitvaskingsarbeid, og moderne maskinlæringsmetoder som XGBoost og Random Forest er blant de brukte metodene. Det anerkjennes også at ulike metoder og modeller har ulike styrker og svakheter, og bankene ser generelt ut til å kjøre flere ulike modeller i produksjon eller operativ testing. Flere banker har også utforsket ulike former for ikke-styrt læring, men det er delte meninger om hvor effektivt dette egentlig er. Det er også stor interesse for nettverksbaserte modeller og analysemetoder. For andre enn de aller største bankene virker det imidlertid vanskelig å utnytte nettverksmodeller effektivt, da man ser så liten del av nettverket.
Samarbeid og datadeling mellom bankene
Til tross for at det er bred enighet om at bankene bør samarbeide mer, skjer det ikke så mye i praksis. Dagens regelverk er en mulig hindring når det gjelder datadeling. Ulike datasystemer og definisjoner for variabler er også barrierer som må overkommes, samt at både personvern for kunder og forretningsfordeler for bankene må beskyttes.
Sparebank1 Utvikling sin modell er et svært gledelig unntak fra praksisen om lite samarbeid. Strengt anonymiserte, historisk rapporterte hvitvaskingssaker fra 13 ulike banker i Sparebank 1-alliansen har blitt brukt til å trene en felles antihvitvaskingsmodell som alle bankene i alliansen kan benytte seg av. Juristene i alliansen har gjort nøye juridiske vurderinger, og konkludert med at dette er tillatt innenfor dagens regelverk. Implementeringen av metoden forenkles av at bankene i Sparebank 1-alliansen benytter samme data- og analysesystem, og det vil dermed ikke være like enkelt å gjøre noe tilsvarende for en større mengde andre banker. Fra et overordnet AML-perspektiv er de juridiske vurderingene og konklusjonen som gjør det mulig å lage en slik fellesmodell svært interessante. Dette har potensiale til å åpne dører for anonymisert deling av rapporterte hvitvaskingssaker mellom banker, og det var et bredt ønske om at de juridiske vurderingene gjort av SpareBank 1-alliansen ble delt med jurister i andre banker.
Føderert læring gir en annen mulighet for å kombinere data fra ulike banker i en felles hvitvaskingsmodell. Dette er en metodikk for å trene modeller fra ulike aktører uten å dele data. I Datatilsynets sandkasse har Finterai og Datatilsynet vurdert personvernspørsmål relatert til denne metoden. Langt fra alle problemstillinger ble diskutert, men metoden kan synes å være mer personvernvennlig enn tradisjonelle maskinlæringsmodeller. Det finnes i hovedsak to typer føderert læring: vertikal føderert læring, hvor informasjon om de samme individene kombineres fra kundeforhold i ulike banker, og horisontal føderert læring, hvor samme type variabler fra flere ulike banker benyttes, men for forskjellige kunder. Vertikal føderert læring er problematisk i henhold til GDPR, slik at det er horisontal føderert læring som kan være aktuelt i praksis.
Til tross for at det eksisterer samarbeidsorganer rundt antihvitvaskingsarbeid som OPS AT og DSOP, var det bred enighet om det var ønskelig med mer samarbeid mellom bankene, spesielt rundt datadrevne metoder. Å opprette et felles forum for erfaringsutveksling og samarbeid rundt datadrevet antihvitvasking ble nevnt som et mulig steg i den retningen.
Etterretning og tilsyn
Enheten for finansiell etterretning (EFE) i Økokrim er mottaker av MT-meldingene fra bankene. EFE analyserer og etterforsker MT-meldingene videre, før de korresponderende sakene eventuelt løftes til rettsapparatet. Med en sterk økning i antall MT-meldinger de siste årene (fra < 10 000 i 2017 til ca 24 000 i 2023), uten at de tilgjengelige ressursene har økt, er det liten tvil om at det er krevende arbeidsforhold hos EFE. Politiets IT-enhet (PIT) jobber tett med EFE for å effektivisere og forbedre analysene av innkomne MT-meldinger. Fra i år sitter de to miljøene i samme kontorlandskap, noe som forenkler informasjonsflyten og samarbeidsevnen betydelig. PIT har nylig satt i gang et stort langsiktig prosjekt som tar sikte på å bygge opp grafdatabaser/nettverk basert på innkomne MT-meldinger. Det er betydelige praktiske, tekniske og metodiske utfordringer forbundet med dette prosjektet. Dette angår blant annet format på MT-meldinger, manglende og inkonsistente data, samt behandling og analysering av dataene. Det ble for eksempel nevnt at det per i dag ikke finnes en standard for vedleggene til MT-meldinger. Dersom man lykkes, virker det udiskutabelt at et slikt system vil være svært nyttig i kampen mot hvitvasking.
I Norge kontrollerer Finanstilsynet bankenes etterlevelse av hvitvaskingsregelverket. Disse var ikke til stede under seminaret. Blant deltakerne på seminaret ble det imidlertid uttrykt en reell frykt for at tilsynet skulle slå ned på solid og godt dokumentert arbeid basert på maskinlæring og andre datadrevne metoder – fordi det er både uvant og ukjent. Finanstilsynets har visstnok et standpunkt om at all mistenkelig oppførsel må rapporteres. Dette ble problematisert i lys av transparensen man får ved back-testing av datadrevne metoder. En god modell kan oppnå en enorm effektivitetsgevinst for bankene i form av færre falske positive (saker som undersøkes manuelt, men som ender opp med å ikke rapporteres), men det vil sannsynligvis være på bekostning av at andel falske negative (saker som ikke blir manuelt undersøkt, men som ville blitt rapportert om de ble det). ikke er 1 og det kan dermed være vanskelig å få aksept for en slik modell hos Finanstilsynet. AML-arbeidet har vært høyt prioritert i Danmark etter hvitvaskingsskandalen med Danske Banks estiske filial noen år tilbake. Dette har blant annet ført til at det har blitt jobbet intenst langs flere akser relatert til datadeling. Deling av data har imidlertid også der vist seg krevende med dagens regelverk, og lite har derfor nådd helt frem. En konsekvens av arbeidet som er lagt ned er imidlertid at danske representanter har klart å påvirke EU til å inkludere samarbeid og teknologi i EUs nye AML-forordning. Også der vil formålet måtte veies opp mot personverninngrepet, men det finnes i det minste en åpning for det.
Spørsmål: Ta kontakt