Spatially Selective Speaker Separation: Bridging the Gap between Blind and Strongly Location Guided Methods

Promovendus/a
Bohlender, Alexander
Faculteit
Faculteit Ingenieurswetenschappen en Architectuur
Vakgroep
Vakgroep Elektronica en Informatiesystemen
Curriculum
Master of Science Electrical Engineering, Information Technology and Computer Engineering, RWTH Aachen University (Duitsland), 2018
Academische graad
Doctor in de ingenieurswetenschappen: elektrotechniek
Taal proefschrift
Engels
Promotor(en)
prof. Kris Demuynck, Vakgroep Elektronica en Informatiesystemen - prof. Nilesh Madhu, Vakgroep Elektronica en Informatiesystemen
Examencommissie
voorzitter prof. Filip De Turck (academisch secretaris) - prof. Dick Botteldooren, vakgroep Informatietechnologie - prof. Tom Dhaene, vakgroep Informatietechnologie - prof. Timo Gerkmann, Universität Hamburg, Duitsland - prof. Emanuël Habets, International Audio Laboratories Erlangen, Duitsland - promotor prof. Kris Demuynck, vakgroep Elektronica en Informatiesystemen - promotor prof. Nilesh Madhu, vakgroep Elektronica en Informatiesystemen

Korte beschrijving

In een lawaaierige omgeving, zoals in de buurt van een drukke straat of in een restaurant, kunnen de vele storende geluiden het moeilijk maken om de stem van een bepaalde persoon te horen. Dit is niet alleen een probleem voor een mens die een gesprek probeert te voeren, maar ook voor een machine die tot doel heeft zuivere spraak te verkrijgen op basis van opgenomen microfoonsignalen. Het scheiden van meerdere gelijktijdige sprekers is bijzonder uitdagend omdat het niet meteen duidelijk is welke spraak gewenst en welke ongewenst is. Deze ambiguïteit kan effectief worden opgelost door ruimtelijke selectiviteit, waarbij alleen het geluid afkomstig van een specifieke locatie wordt behouden (sterke locatiegeleiding). Dit vereist echter een nauwkeurige lokalisatie van de sprekers, wat niet altijd mogelijk is. Daarom onderzoekt deze thesis ruimtelijk selectieve methoden die niet (erg) afhankelijk zijn van voorkennis. In het geval van de sterke locatiegeleiding maakt een ruimtelijk doelgebied van variabele grootte het mogelijk om met grove locatie-informatie om te gaan. Alternatief kunnen sprekers worden onderscheiden op basis van hun locaties zonder een specifieke doelspreker te selecteren (locatiebewustzijn). Ten slotte wordt een algoritme ontwikkeld om de spreker te extraheren die zich het dichtst bij een willekeurige kijkrichting bevindt (zwakke locatiegeleiding).

Praktisch

Datum
Vrijdag 18 oktober 2024, 16:00
Locatie
leslokaal Rudolf E. Richter, gebouw 131 Volta (gelijkvloers), Technologiepark Zwijnaarde 131, 9052 Zwijnaarde
Livestream
Volg online

Meer info

Contact
doctoraat.ea@UGent.be