Anonymisering av tekst
- Avdeling SAMBA
- Involverte fagområder Bildeanalyse, Maskinlæring, Språkteknologi
- Involverte bransjer Samfunn, Teknologi og industri
Målet med CLEANUP er å utvikle nye maskinlæringsmetoder for automatisk å anonymisere tekstdokumenter som inneholder personlige data, som elektroniske helseregistre, rettsavgjørelser eller chatbaserte interaksjoner med kunder.
Prosjektet samler forskere fra maskinlæring, prosessering av naturlig språk, databeskyttelse, statistisk modellering, helseinformatikk og IT-rett.
I tillegg bidrar partnere fra norsk offentlig og privat sektor (som dekker forsikring, velferd, helsetjenester og juridisk publisering) til prosjektet med data- og domenekunnskap.
Prosjektet har som mål å utvikle nye beregningsmodeller og behandlingsteknikker for automatisk anonymisering av ustrukturerte data som inneholder personlig informasjon, med spesifikke fokustekstdokumenter
Prosjektets hovedide er å kombinere tilnærminger fra naturlig språkbehandling og personvern for å designe en ny generasjon av anonymiseringsteknikker.
Formålet er å modifisere tekstdokumenter på en måte som forhindrer utlevering av personlig informasjon, samtidig som den interne sammenhengen og semantiske innholdet i dokumentene bevares.
Navn: CleanUp-project
Partner: Institutt for Informatikk og Det juridiske fakultet ved Universitetet i Oslo, Norges Teknisk-naturvitenskapelige universitet, Universitat Rovira i Spain, DNB, NAV, Gjensidige, Lovdata, Norsk helsearkiv
Periode: 2020 – 2024
Finansiering: Norges forskningsråd
Prosjektets eksterne nettside: cleanup.nr.no