Improving the Efficiency of Knowledge Graph Construction from Heterogeneous Data Sources

Promovendus/a
Van Assche, Dylan
Faculteit
Faculteit Ingenieurswetenschappen en Architectuur
Vakgroep
Vakgroep Elektronica en Informatiesystemen
Curriculum
Master in de industriële wetenschappen: elektronica-ICT, KU Leuven, 2019
Academische graad
Doctor in de industriële wetenschappen: informatica
Taal proefschrift
Engels
Vertaling titel
Het verhogen van de efficiëntie van kennisgraafgeneratie vanuit heterogene databronnen
Promotor(en)
prof. Pieter Colpaert, vakgroep Elektronica en Informatiesystemen - prof. Anastasia Dimou, KU Leuven
Examencommissie
voorzitter prof. Hennie De Schepper (onderwijsdirecteur) - prof. David Chaves-Fraga, Universidade de Santiago de Compostela, Spanje - dr. ir. Tom De Nies, First Stage - prof. Dieter De Witte, vakgroep Elektronica en Informatiesystemen - prof. Christophe Debruyne, Université de Liège - prof. Femke Ongenae, vakgroep Informatietechnologie - promotor prof. Pieter Colpaert, vakgroep Elektronica en Informatiesystemen - promotor prof. Anastasia Dimou, KU Leuven

Korte beschrijving

Wanneer informatie moet worden samengesteld uit verschillende databronnen komt men data-integratieproblemen tegen. Integratie van verschillende databronnen vereist een uitgebreide kennis van deze bronnen en de mogelijke relaties ertussen. Deze relaties kunnen worden uitgedrukt dankzij de technologie van kennisgrafen, zoals het Resource Description Framework (RDF). Daarbij worden de data een graafstructuur met knopen met relaties tussen. Om heterogene bronnen die vaak nog niet beschikbaar zijn in RDF te vertalen naar zo’n graafstructuur bestaat er een taal: de RDF Mapping Language (RML). Diverse processoren interpreteren RML-documenten, lezen de brondata, en vertalen die zo in een kennisgraaf. In dit doctoraat bestuderen en verbeteren we de efficiëntie om kennisgrafen te genereren op vlak van uitvoeringstijd, opslag, CPU-tijd en benodigd werkgeheugen. Hiervoor bestudeerde ik zowel technieken die werken op basis van een materialisatie van de graaf, als technieken die de graaf virtualiseren bovenop een niet RDF-systeem. Op die wijze vond ik een manier om bestaande materialisatiesystemen te optimaliseren door grafen incrementeel te genereren naar gelang ze veranderen in de tijd. Daarnaast heb ik ook ondersteuning voor nieuwe databronnen zoals Web API’s en datastromen toegevoegd zodat de reproduceerbaarheid van kennisgraaf-generatie werd verbeterd.

Praktisch

Datum
Vrijdag 29 november 2024, 17:30
Locatie
auditorium 1, iGent, eerste verdieping, Technologiepark 126, 9052 Zwijnaarde
Livestream
Volg online