
Sjefsforsker
Pierre Lison
- Avdeling Statistisk modellering og maskinlæring
- Telefonnummer +47 22 85 25 77
- E-post plison@nr.no
- Sjefsforsker ved Norsk Regnesentral
- Førsteamanuensis II ved Universitetet i Oslo
OM
Mine viktigste forskningsinteresser ligger innen naturlig språkprosessering (NLP) og maskinlæring, spesielt trening, tilpasning og evaluering av store språkmodeller (LLM-er), samt hvordan disse kan tas i bruk i ulike anvendelser.
I løpet av min forskerkarriere har jeg arbeidet med temaer som talebaserte dialogsystemer, storskala informasjonsuttrekk, personvern i data, nevrale maskinoversettelser og samhandling mellom mennesker og roboter.
Jeg er spesielt opptatt av forskningsspørsmål i skjæringspunktet mellom språkbehandling og andre fagområder – både natur- og samfunnsvitenskapelige. Jeg deltar også i flere forsknings- og utviklingsprosjekter med fokus på innovasjon, hvor vi undersøker hvordan store språkmodeller og maskinlæring kan brukes til å løse praktiske utfordringer i offentlig og privat sektor.
Bakgrunn
Jeg er opprinnelig fra Belgia og ble uteksaminert fra Universitetet i Louvain i 2006 med en grad i informatikk og ingeniørvitenskap. Med økende interesse for koblingen mellom informatikk og språkvitenskap flyttet jeg til Saarbrücken i Tyskland for å ta en mastergrad i språkvitenskap og teknologi. Jeg fullførte graden i 2008 og jobbet deretter som forsker ved det tyske forskningssenteret for kunstig intelligens (DFKI), hvor jeg deltok i flere EU-finansierte prosjekter om utvikling av dialogsystemer for samhandling mellom mennesker og roboter.
I 2011 flyttet jeg til Norge for å ta en doktorgrad i språkgruppa ved Universitetet i Oslo. I 2014 forsvarte jeg doktoravhandlingen min om sannsynlighetsbaserte metoder for dialogstyring, og jobbet deretter i to år som postdoktor i samme gruppe med dialogmodellering for statistisk maskinoversettelse.
I 2016 begynte jeg som forsker ved Norsk Regnesentral, hvor jeg jobber med ulike forsknings- og utviklingsprosjekter innen språkprosessering og maskinlæring. To av mine nyeste prosjekter er CLEANUP, som utviklet datadrevne metoder for å fjerne personopplysninger fra tekstdata, og GraphDial, som handlet om dialogstyring og bruk av kunnskapsgrafer for å representere dialogtilstanden i komplekse samtaledomener. Andre prosjekter jeg har vært involvert i inkluderer SAFERS (taleanalyse for nødetater), DialMT (dialogmodellering for maskinoversettelse), AICOM (språklig analyse av samspill mellom mennesker og store språkmodeller), Oslo Analytics, og nylig CyberRisk (cyber-trusselintelligens og risikostyring).
I tillegg til hovedstillingen som sjefsforsker ved NR har jeg også en bistilling som førsteamanuensis II ved språkgruppa ved Universitetet i Oslo, hvor jeg bidrar i flere kurs innen maskinlæring og naturlig språkprosessering. Jeg har også tidligere vært medlem av Akademiet for yngre forskere.
Prosjekter
- Maskinlæring
- Språkteknologi
Anonymisering av tekst (CLEANUP)
- Maskinlæring
- Språkteknologi
- Digital sikkerhet og personvern
Delautomatisering av digital risikostyring
- Maskinlæring
Hvordan forstår vi maskiner som snakker til oss?
Publikasjoner
- 95 publikasjoner funnet
- Utgiver
Following Route Instructions using Large Vision-Language Models: A Comparison between Low-level and Panoramic Action Spaces pp. 449 463 , doi: https://doi.org/https://aclanthology.org/2025.icnlsp-1.43/ , 2025. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Pragmatic Reasoning for Irony Detection With Large Language Models in English and Norwegian - SEMDIAL SemDial Proceedings, pp. 204 209 , (ISSN 2308-2275 ), doi: https://doi.org/https://www.semdial.org/anthology/Z25-Berg_semdial_4421.pdf , 2025. Vitenskapelig artikkel
Re-identification of De-identified Documents with Autoregressive Infilling pp. 1192 1209 , doi: https://doi.org/10.18653/v1/2025.acl-long.60 , 2025. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Retrieving Relevant Knowledge Subgraphs for Task-Oriented Dialogue pp. 513 526 , doi: https://doi.org/https://aclanthology.org/2025.sigdial-1.42.pdf , 2025. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Incremental Dialogue Management: Survey, Discussion, and Implications for HRI arXiv, , 2025. Vitenskapelig artikkel
Nå kan KI-generert tekst vannmerkes 2024. Kronikk
Conversational Feedback in Scripted versus Spontaneous Dialogues: A Comparative Analysis pp. 440 457 , doi: https://doi.org/10.18653/v1/2024.sigdial-1.38 , 2024. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Evaluating the disclosure risk of anonymized documents via a machine learning-based re-identification attack Data mining and knowledge discovery, vol. 38, pp. 4040 4075 , (ISSN 1384-5810 1573-756X ), doi: https://doi.org/10.1007/s10618-024-01066-3 , 2024. Vitenskapelig artikkel
Enhancing Naturalness in LLM-Generated Utterances through Disfluency Insertion arXiv, doi: https://doi.org/10.48550/arXiv.2412.12710 , 2024. Vitenskapelig artikkel
GraphWOZ: Dialogue Management with Conversational Knowledge Graphs 2023. Vitenskapelig foredrag
Fire tiltak for en bedre språkpolitikk i akademia 2023. Kronikk
Identifying Token-Level Dialectal Features in Social Media , 2023. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Constructing a Knowledge Graph from Textual Descriptions of Software Vulnerabilities in the National Vulnerability Database pp. 386 391 , , 2023. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Who's in Charge? Roles and Responsibilities of Decision-Making Components in Conversational Robots 2023. Vitenskapelig foredrag
Generation of Replacement Options in Text Sanitization pp. 292 300 , , 2023. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Alt du kan lære om statistisk modellering og maskinlæring på en dag 2023. Faglig foredrag
Pierre Lison; Samia Touileb; Chat GPT egner seg dårlig til eksamenssensuren Morgenbladet, (ISSN 0805-3847 0806-2617 ), 2023. Kronikk
Retrieval-Augmented Neural Response Generation Using Logical Reasoning and Relevance Scoring SemDial Proceedings, (ISSN 2308-2275 ), , 2023. Vitenskapelig artikkel
Pierre Lison; Venn med kunstig intelligens 2023. Intervju
Pierre Lison; Kunstig Intelligens, en fare for menneskeheten? 2023. Intervju
Helse-effektivisering - et mulig satsningsområde for NR 2023. Rapport
A Graph-to-Text Approach to Knowledge-Grounded Response Generation in Human-Robot Interaction arXiv, , 2023. Vitenskapelig artikkel
Alt du kan lære om statistisk modellering og maskinlæring på en dag 2023. Faglig foredrag
Dialogue Management as Graph Transformations pp. 219 227 , doi: https://doi.org/10.1007/978-981-19-5538-9_15 , 2022. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
The GDPR and Unstructured Data: Is Anonymisation Possible? International Data Privacy Law (IDPL), vol. 12, pp. 184 206 , (ISSN 2044-3994 2044-4001 ), doi: https://doi.org/10.1093/idpl/ipac008 , 2022. Vitenskapelig artikkel
Kjernekraft -er det farlig, eller er det fremtiden? 2022. Kronikk
Dis, c'est quoi l'intelligence artificielle? (ISSN 9782507057299 ), 2022. Populærvitenskapelig bok
Anonymization of sensitive information 2022. Faglig foredrag
Problemer på kontoret: Alltid jeg som må trakte kaffe 2022. Kronikk
Bootstrapping Text Anonymization Models with Distant Supervision pp. 4477 4487 , , 2022. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Automatic Evaluation of Disclosure Risks of Text Anonymization Methods pp. 157 171 , doi: https://doi.org/10.1007/978-3-031-13945-1_12 , 2022. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
The text anonymization benchmark (TAB): A dedicated corpus and evaluation framework for text anonymization Computational Linguistics, vol. 48, pp. 1053 1101 , (ISSN 0891-2017 1530-9312 ), doi: https://doi.org/10.1162/coli_a_00458 , 2022. Vitenskapelig artikkel
Neural Text Sanitization with Explicit Measures of Privacy Risk pp. 217 229 , , 2022. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Hva er universell utforming? 2022. Programdeltagelse
Towards an AI-driven talking avatar in virtual reality for investigative interviews of children pp. 9 15 , doi: https://doi.org/10.1145/3534085.3534340 , 2022. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Vi må snakke om Bitcoin , 2021. Kronikk
Welcome to Norway! , 2021. Kronikk
skweak: weak supervision made easy for NLP 2021. Poster
Nicholas Thomas Walker; Torbjørn Dahl; Pierre Lison; Dialogue Management as Graph Transformations 2021. Vitenskapelig foredrag
Fremdrift i forskningsprosjekter 2021. Faglig foredrag
Skweak: Weak Supervision Made Easy for NLP 2021. Vitenskapelig foredrag
Dinesh Lala; Pierre Lison; Proceedings of the 1st RobotDial Workshop on Dialogue Models for Human-Robot Interaction , 2021. Rapport
Assessing the Quality of Human-Generated Summaries with Weakly Supervised Learning pp. 112 123 , , 2021. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Anonymisation Models for Text Data: State of the art, Challenges and Future Directions 2021. Vitenskapelig foredrag
Anonymisation Models for Text Data: State of the art, Challenges and Future Directions 2021. Vitenskapelig foredrag
skweak: Weak Supervision Made Easy for NLP pp. 337 346 , doi: https://doi.org/10.18653/v1/2021.acl-demo.40 , 2021. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Anonymisation Models for Text Data: State of the art, Challenges and Future Directions pp. 4188 4203 , doi: https://doi.org/10.18653/v1/2021.acl-long.323 , 2021. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Språkteknologi: siste trender og vanlige fallgruver 2021. Faglig foredrag
Named Entity Recognition without Labelled Data: A Weak Supervision Approach 2020. Vitenskapelig foredrag
Pierre Lison; Jeremy Barnes; Aliaksandr Hubin; Samia Touileb; Named Entity Recognition without Labelled Data: A Weak Supervision Approach (ISSN 978-1-950737-48-2 ), 2020. Vitenskapelig antologi/Konferanseserie
Named Entity Recognition without Labelled Data: A Weak Supervision Approach pp. 1518 1533 , , 2020. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Episode 5: Hva er språkteknologi (eller NLP)? Med Pierre Lison 2020. Programdeltagelse
Episode 6: Kan språkteknologi virkelig forstå språk? Med Ingrid Lossius Falkum og Pierre Lison 2020. Programdeltagelse
Developing NLP models without labelled data using weak supervision 2020. Faglig foredrag
Kan kunstig intelligens "forstå" språk? Aftenposten (morgenutg. : trykt utg.), (ISSN 0804-3116 0807-2027 ), , 2020. Populærvitenskapelig artikkel
For enkelt om kunstig intelligens: – Diskriminerende og fordomsfull AI er ikke alltid lett å løse Forskning.no, (ISSN 1891-635X 1891-6341 ), , 2020. Leserinnlegg
Ethical and social impacts of AI 2020. Faglig foredrag
Hva skjedde med «Don’t be evil»? , 2020. Kronikk
Modellering av omdømme i cybersikkerhet med nevralske nettverk 2019. Faglig foredrag
PyOpenDial: A Python-based Domain-Independent Toolkit for Developing Spoken Dialogue Systems with Probabilistic Rules pp. 187 192 , doi: https://doi.org/10.18653/v1/D19-3032 , 2019. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Modélisation du dialogue: contrôle du dialogue et corpus multilingues 2019. Vitenskapelig foredrag
Dialogue Modelling: Small data, Big data 2019. Vitenskapelig foredrag
Data-driven models of reputation for cybersecurity 2019. Vitenskapelig foredrag
Open challenges in anonymisation 2019. Faglig foredrag
OpenSubtitles 2018: Statistical Rescoring of Sentence Alignments in Large, Noisy Parallel Corpora , 2018. Vitenskapelig foredrag
Tekstmining: En kort innføring , 2018. Faglig foredrag
OpenSubtitles 2018: Statistical rescoring of sentence alignments in large, noisy parallel corpora pp. 1742 1748 , , 2018. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Detecting Machine-translated Documents in Large Parallel Corpora pp. 25 32 , , 2018. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Anonymisering av rettsavgjørelser 2018. Rapport
Data-driven models of reputation in cyber-security , 2018. Vitenskapelig foredrag
SAFERS: Talegjenkjenning og maskinlæring for nødmeldetjenester , 2018. Faglig foredrag
Modélisation du dialogue : systèmes de dialogue parlé et corpus multilingues , 2018. Vitenskapelig foredrag
Detecting Machine-translated Subtitles in Large Parallel Corpora 2018. Vitenskapelig foredrag
Neural models for predicting the reputation of end-point hosts 2018. Vitenskapelig foredrag
Not All Dialogues are Created Equal: Instance Weighting for Neural Conversational Models pp. 384 394 , doi: https://doi.org/10.18653/v1/w17-5546 , 2017. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Incremental Processing for Neural Conversational Models , 2017. Poster
Incremental Processing for Neural Conversational Models SemDial Proceedings, pp. 162 163 , (ISSN 2308-2275 ), , 2017. Vitenskapelig artikkel
Automatic Detection of Malware-Generated Domains with Recurrent Neural Models Norsk Informasjonssikkerhetskonferanse (NISK), (ISSN 1893-6563 1894-7735 ), , 2017. Vitenskapelig artikkel
Opptreden i God Morgen Norge (TV2) for å vise Lenny roboten som ble brukt ved Forskningstorget. 2017. Programdeltagelse
Redefining Context Windows for Word Embedding Models: An Experimental Study pp. 284 288 , , 2017. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Neural Reputation Models learned from Passive DNS data pp. 3662 3671 , doi: https://doi.org/10.1109/BigData.2017.8258361 , 2017. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Not all dialogues are created equal: instance weighting for neural conversational models , 2017. Vitenskapelig foredrag
Automatic Detection of Malware-Generated Domains with Recurrent Neural Models , 2017. Vitenskapelig foredrag
Neural Reputation Models learned from Passive DNS Data 2017. Vitenskapelig foredrag
Dialogue modelling: small data and large data , 2016. Vitenskapelig foredrag
Automatic Turn Segmentation of Movie and TV Subtitles pp. 245 252 , doi: https://doi.org/10.1109/SLT.2016.7846272 , 2016. Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Automatic Turn Segmentation for Movie and TV Subtitles , 2016. Poster
Automatic Turn Segmentation for Movie and TV Subtitles , 2016. Vitenskapelig foredrag