Forskargrupp Natural Language Processing Research Group

Natural Language Processing Research Group utvecklar, tillämpar och utvärderar metoder för att bearbeta, modellera och analysera text, i synnerhet involverande stora språkmodeller. Vi utforskar tillämpningar inom olika domäner och fokuserar på frågor som integritet, förklarbarhet och domänanpassning.
Förstoring av HPV-16, en högrisktyp för cancer.

Forskargruppen arbetar bland annat med sjukvårdsdata. Foto: National Cancer Institute/Unsplash.

Natural Language Processing Research Group forskar om metoder för bearbetning, modellering och analys av text, inklusive stora språkmodeller. Natural Language Processing översätts ofta till språkteknologi på svenska, och på båda språken används förkortningen NLP. Vi är intresserade av tillämpningar av NLP inom områden som sjukvård, utbildning och säkerhet.

Vi har byggt upp en omfattande expertis inom klinisk NLP för att analysera sjukvårdsdata och har för detta ändamål en forskningsinfrastruktur som heter Health Bank. Kliniska NLP-metoder möjliggör storskalig analys av sjukvårdsdata och kan bidra till att förbättra vården, till exempel genom att skapa kliniska prediktionsmodeller som innehåller information från kliniska fritextanteckningar. Vi utforskar hur språkmodeller kan användas inom hälso- och sjukvården och tillämpar domänanpassning för att skapa kliniska språkmodeller, i synnerhet med integritetsbevarande NLP-metoder (exempelvis avidentifiering eller syntetiska träningsdata).

Ett annat applikationsområde är utbildning, där vi är intresserade av att använda förtränade språkmodeller för olika pedagogiska användningsfall – såsom automatisk bedömning av uppsatser, generering av frågor/svar och rekommendationer av utbildningsmaterial – med målet att förbättra undervisnings- och inlärningsprocesser. För att möjliggöra utveckling av intelligenta och adaptiva inlärningssystem utforskar vi tekniker som retrieval-augmented generation (RAG) och tool-augmented generation (TAG).

Säkerhet är ett annat tillämpningsområde där vårt fokus ligger på att upptäcka och analysera hatretorik, hot samt våldsamt, extremistiskt innehåll på nätet. Vi är också intresserade av hotbedömning av skriftlig kommunikation och att fastställa hotens allvar. Vi är värd för European Online Hate Lab, en hubb för forskare och organisationer som arbetar med att hitta och analysera näthat.

Slutligen, då förklarbarhet är avgörande för utvecklingen av pålitlig AI så utvecklar vi metoder för förklarbar NLP, framförallt för stora språkmodeller. Vi fokuserar särskilt, men inte uteslutande, på att utveckla NLP-metoder för det svenska språket.

Institutionen för data- och systemvetenskap

Svensk teknik för säkra språkmodeller testas i Chile

Hur kan integriteten skyddas när AI-baserade språkmodeller hanterar våra hälsodata? Thomas Vakili studerar frågan i sitt avhandlingsarbete. Nu har han fått ett chilenskt stipendium – och möjligheten att testa sina modeller på nya dataset.

AI – smartare än en universitetsstudent?

Chattboten GPT 3.5 har slagit igenom med dunder och brak. Den nya versionen är smartare, snabbare och mer språkbegåvad. Men kan den verkligen skriva lika bra texter som en människa? Vi har frågat några forskare på Institutionen för data- och systemvetenskap (DSV).

Inga evenemang tillgängliga.