Etude des principes d'interprétation Sémantique tabulaire dans l'Open Data
Défense de mémoire de messieurs Cabello Anthony et Verhelle Romain
Date : 02/09/2021 10:00 - 02/09/2021 11:30
Lieu : Teams
Orateur(s) : Cabello Anthony et Verhelle Romain
Organisateur(s) : Benjamine Lurquin
Ces dernières années, le monde de l’Open Data s’agrandit de jour en jour. Les bases de données ne cessent de croitre ainsi que l’intérêt pour l’annotation de tableaux sur le Web. Notre travail s’intéresse surtout aux Linked open data (LOD). C’est un système qui permet de relier différentes sources de données entre elles. Ces dernières sont libres d’accès et d’utilisation permettant à tout individu de pouvoir les utiliser. L’interprétation sémantique (STI) des tables est un processus qui exploite la sémantique des bases de connaissances (KB) afin de pouvoir annoter les colonnes, cellules et relations d’une table. Ce mémoire commence par synthétiser la définition, les méthodes et les meilleurs outils existants de cette interprétation. Il décrit ensuite le développement d’une solution qui permet d’annoter un ensemble de tableaux de manière efficiente et de les comparer entre eux grâce à DBpedia. Cette solution se base sur des outils existants. Elle comble certaines lacunes de ces derniers et amène une preuve de concept d’un procédé complet d’annotation et de comparaison de tableaux. Enfin nous discuterons des résultats, des limitations et des perspectives d’amélioration pour les travaux futurs.
Mot-clefs: Semantic Table Interpretation, STI tool, Dataset Matching, HTML Table, Open Data, Knowledge Graph, LOD.
In recent years, the world of Open Data is growing day after day. Databases is growing up and so does the interest in annotating tables on the Web. Our work focuses on Linked open data (LOD), a system that allows to link different sources of data between them. These data are free to access and use, allowing everyone to use it. Semantic Table Interpretation (STI) is a process that exploits the semantics of knowledge bases (KB) to annotate columns, cells and relations of a table. This paper begins by summarizing the definition, methods and best existing tools for this interpretation. It then describes the development of a solution that allows to annotate a set of tables in an efficient way and to compare them with DBpedia. This solution is based on existing tools. It fills in some of the gaps in these tools and provides a proof of concept for a complete table annotation and comparison process. Finally, we will discuss the results, limitations and perspectives for future work.
Key-words: Semantic Table Interpretation, STI tool, Dataset Matching, HTML Table, Open Data, Knowledge Graph, LOD.
Télecharger :
vCal