Improving the Efficiency of Knowledge Graph Construction from Heterogeneous Data Sources
- Promovendus/a
- Van Assche, Dylan
- Faculteit
- Faculteit Ingenieurswetenschappen en Architectuur
- Vakgroep
- Vakgroep Elektronica en Informatiesystemen
- Curriculum
- Master in de industriële wetenschappen: elektronica-ICT, KU Leuven, 2019
- Academische graad
- Doctor in de industriële wetenschappen: informatica
- Taal proefschrift
- Engels
- Vertaling titel
- Het verhogen van de efficiëntie van kennisgraafgeneratie vanuit heterogene databronnen
- Promotor(en)
- prof. Pieter Colpaert, vakgroep Elektronica en Informatiesystemen - prof. Anastasia Dimou, KU Leuven
- Examencommissie
- voorzitter prof. Hennie De Schepper (onderwijsdirecteur) - prof. David Chaves-Fraga, Universidade de Santiago de Compostela, Spanje - dr. ir. Tom De Nies, First Stage - prof. Dieter De Witte, vakgroep Elektronica en Informatiesystemen - prof. Christophe Debruyne, Université de Liège - prof. Femke Ongenae, vakgroep Informatietechnologie - promotor prof. Pieter Colpaert, vakgroep Elektronica en Informatiesystemen - promotor prof. Anastasia Dimou, KU Leuven
Korte beschrijving
Wanneer informatie moet worden samengesteld uit verschillende databronnen komt men data-integratieproblemen tegen. Integratie van verschillende databronnen vereist een uitgebreide kennis van deze bronnen en de mogelijke relaties ertussen. Deze relaties kunnen worden uitgedrukt dankzij de technologie van kennisgrafen, zoals het Resource Description Framework (RDF). Daarbij worden de data een graafstructuur met knopen met relaties tussen. Om heterogene bronnen die vaak nog niet beschikbaar zijn in RDF te vertalen naar zo’n graafstructuur bestaat er een taal: de RDF Mapping Language (RML). Diverse processoren interpreteren RML-documenten, lezen de brondata, en vertalen die zo in een kennisgraaf. In dit doctoraat bestuderen en verbeteren we de efficiëntie om kennisgrafen te genereren op vlak van uitvoeringstijd, opslag, CPU-tijd en benodigd werkgeheugen. Hiervoor bestudeerde ik zowel technieken die werken op basis van een materialisatie van de graaf, als technieken die de graaf virtualiseren bovenop een niet RDF-systeem. Op die wijze vond ik een manier om bestaande materialisatiesystemen te optimaliseren door grafen incrementeel te genereren naar gelang ze veranderen in de tijd. Daarnaast heb ik ook ondersteuning voor nieuwe databronnen zoals Web API’s en datastromen toegevoegd zodat de reproduceerbaarheid van kennisgraaf-generatie werd verbeterd.
Praktisch
- Datum
- Vrijdag 29 november 2024, 17:30
- Locatie
- auditorium 1, iGent, eerste verdieping, Technologiepark 126, 9052 Zwijnaarde
- Livestream
- Volg online