Séminaire LATECE: «Extraction et formalisation de la connaissance d’une base de données multi-relationnelle»
Bonjour à tous
Nous avons le plaisir de vous inviter au deuxième séminaire du LATECE de la session d'hiver 2019.
Qui? Mickael Wajnberg, doctorat en informatique, sous la direction des professeurs Blondin Massé et petko valtchev, département informatique, UQAM
Quand? mercredi 30 janvier 2019 à 12h30
Où? PK-5115
Titre :
Extraction et formalisation de la connaissance d’une base de données multi-relationnelle
Résumé :
L’extraction de connaissances est une discipline qui cherche à détecter des tendances, des groupes ou des motifs dans les grandes jeux de données. Elle a principalement été développée autour de cas de tables de données uniques. Or, la plupart des systèmes d’informations actuels se basent sur une représentation en base données relationnelle multi-table, alias, jeu de données multi-relationnel. La fouille de données multi-relationnelles vise à combler un certain manque de précision et une perte de contextualité qui apparait lorsque les tables d’un tels jeu de données se font analyser séparément ou, alternativement, en joignant toutes les données dans une table unique.
L’analyse relationnelle de concepts (ARC) est une méthode capable d’extraire des connaissances d'un jeu de données multi-relationnelles et de les expliciter sous forme de : (1) motifs (patterns) et règles d’association ou (2) groupes homogènes (clusters). C’est une extension du paradigme mathématique d’analyse formelle de concept qui admet une seule table. ARC permet, notamment, de traiter plusieurs type d’objets —chacun représenté au sein de sa propre table, alias contexte— inter-reliés au travers de relations binaires inter-contextes. Ce format est clairement compatible avec les données liées et le formalisme RDF. La méthode analytique associée emploie des mécanismes de propositionnalisation. Ceux-ci sont inspirés des logiques de description pour ramener les liens inter-objets à des descripteurs propres de ces objets.
Un premier cas d’application du procédé d’ARC est en cours : il consiste à croiser les données neurologiques d’Imagerie par Résonance Magnétique fonctionnelle, spatialement précises, avec les données d’électroncephalogrammes, temporellement précises, pour fournir aux neurologues partenaires un outil d’aide à l’interprétation.
En outre, l’ARC permettrait aussi de confronter les connaissances contenues dans un jeu de données à ce qui est déjà connu sur le domaine d’origine de celles-ci, exprimé, par exemple, sous forme d’une ontologie. Notamment, en exhibant des sous-groupes d’objets aux propriétés communes, l'ARC pourrait détecter l’existence de sous-classes potentiellement pertinentes au sein d’une classe connue. Alternativement, elle peut valider la pertinence de certaines restrictions de propriétés au sein d’une classe. De plus, l’ARC suggérerait des types plus restrictifs pour les objets peuplant une ontologie en utilisant les associations entre descripteurs.
Date / heure
Lieu
Montréal (QC)