Spatially Selective Speaker Separation: Bridging the Gap between Blind and Strongly Location Guided Methods
- Promovendus/a
- Bohlender, Alexander
- Faculteit
- Faculteit Ingenieurswetenschappen en Architectuur
- Vakgroep
- Vakgroep Elektronica en Informatiesystemen
- Curriculum
- Master of Science Electrical Engineering, Information Technology and Computer Engineering, RWTH Aachen University (Duitsland), 2018
- Academische graad
- Doctor in de ingenieurswetenschappen: elektrotechniek
- Taal proefschrift
- Engels
- Promotor(en)
- prof. Kris Demuynck, Vakgroep Elektronica en Informatiesystemen - prof. Nilesh Madhu, Vakgroep Elektronica en Informatiesystemen
- Examencommissie
- voorzitter prof. Filip De Turck (academisch secretaris) - prof. Dick Botteldooren, vakgroep Informatietechnologie - prof. Tom Dhaene, vakgroep Informatietechnologie - prof. Timo Gerkmann, Universität Hamburg, Duitsland - prof. Emanuël Habets, International Audio Laboratories Erlangen, Duitsland - promotor prof. Kris Demuynck, vakgroep Elektronica en Informatiesystemen - promotor prof. Nilesh Madhu, vakgroep Elektronica en Informatiesystemen
Korte beschrijving
In een lawaaierige omgeving, zoals in de buurt van een drukke straat of in een restaurant, kunnen de vele storende geluiden het moeilijk maken om de stem van een bepaalde persoon te horen. Dit is niet alleen een probleem voor een mens die een gesprek probeert te voeren, maar ook voor een machine die tot doel heeft zuivere spraak te verkrijgen op basis van opgenomen microfoonsignalen. Het scheiden van meerdere gelijktijdige sprekers is bijzonder uitdagend omdat het niet meteen duidelijk is welke spraak gewenst en welke ongewenst is. Deze ambiguïteit kan effectief worden opgelost door ruimtelijke selectiviteit, waarbij alleen het geluid afkomstig van een specifieke locatie wordt behouden (sterke locatiegeleiding). Dit vereist echter een nauwkeurige lokalisatie van de sprekers, wat niet altijd mogelijk is. Daarom onderzoekt deze thesis ruimtelijk selectieve methoden die niet (erg) afhankelijk zijn van voorkennis. In het geval van de sterke locatiegeleiding maakt een ruimtelijk doelgebied van variabele grootte het mogelijk om met grove locatie-informatie om te gaan. Alternatief kunnen sprekers worden onderscheiden op basis van hun locaties zonder een specifieke doelspreker te selecteren (locatiebewustzijn). Ten slotte wordt een algoritme ontwikkeld om de spreker te extraheren die zich het dichtst bij een willekeurige kijkrichting bevindt (zwakke locatiegeleiding).
Praktisch
- Datum
- Vrijdag 18 oktober 2024, 16:00
- Locatie
- leslokaal Rudolf E. Richter, gebouw 131 Volta (gelijkvloers), Technologiepark Zwijnaarde 131, 9052 Zwijnaarde
- Livestream
- Volg online
Meer info
- Contact
- doctoraat.ea@UGent.be