Anonymisering av tekst

Målet med CLEANUP er å utvikle nye maskinlæringsmetoder for automatisk å anonymisere tekstdokumenter som inneholder personlige data, som elektroniske helseregistre, rettsavgjørelser eller chatbaserte interaksjoner med kunder.

Prosjektet samler forskere fra maskinlæring, prosessering av naturlig språk, databeskyttelse, statistisk modellering, helseinformatikk og IT-rett.

I tillegg bidrar partnere fra norsk offentlig og privat sektor (som dekker forsikring, velferd, helsetjenester og juridisk publisering) til prosjektet med data- og domenekunnskap.

Prosjektet har som mål å utvikle nye beregningsmodeller og behandlingsteknikker for automatisk anonymisering av ustrukturerte data som inneholder personlig informasjon, med spesifikke fokustekstdokumenter

Prosjektets hovedide er å kombinere tilnærminger fra naturlig språkbehandling og personvern for å designe en ny generasjon av anonymiseringsteknikker.

Formålet er å modifisere tekstdokumenter på en måte som forhindrer utlevering av personlig informasjon, samtidig som den interne sammenhengen og semantiske innholdet i dokumentene bevares.

Navn: CleanUp-project

Partner: Institutt for Informatikk og Det juridiske fakultet ved Universitetet i Oslo, Norges Teknisk-naturvitenskapelige universitet, Universitat Rovira i Spain, DNB, NAV, Gjensidige, Lovdata, Norsk helsearkiv

Periode: 2020 – 2024

Finansiering: Norges forskningsråd

Prosjektets eksterne nettside: cleanup.nr.no