Soutenance de thèse de M. Claude Coulombe, doctorant en informatique

SOUTENANCE DE THÈSE  

 

VENDREDI  25 octobre 2019

13h30

Université TELUQ, 5800, rue St-Denis, local 11.051 (amphithéâtre)

 

TITRE : Techniques d’amplification des données textuelles pour l’apprentissage profond  

 

Présenté par

Claude COULOMBE, étudiant au doctorat en informatique cognitive. TELUQ

 

Résumé 

Cette thèse a pour objectif d’étudier la faisabilité de différentes techniques d’amplification des données textuelles (ADT) afin de contrer l’insuffisance de données pour entraîner de gros modèles statistiques, particulièrement en apprentissage profond. Pour franchir ce « mur des données massives », nous proposons de créer de nouvelles données à partir des données existantes.  On dit aussi : données synthétiques, données générées ou données artificielles. Nous recherchons des techniques d’ADT pratiques, robustes, capables de monter en charge et simples à mettre en œuvre.  Ces techniques de prétraitement s’inspirent des techniques utilisées avec succès en vision artificielle. Aux fins de comparaison, des techniques d’ADT existantes ont été expérimentées, comme l’injection de bruit ou l’emploi d’expressions régulières.  D’autres ont été améliorées, comme la substitution lexicale.  Enfin, des techniques plus innovatrices utilisent des services en ligne comme la rétrotraduction et la génération de paraphrases par transformation d’arbres syntaxiques. Les techniques d’ADT étudiées ont permis d’accroître l’exactitude de 0,5 à 8,8%, sur une tâche de prédiction de la polarité de textes.  Différentes architectures de réseau de neurones ont été testées : le perceptron multicouche (PMC), le réseau convolutif 1D (RNC 1D), le réseau récurrent à longue mémoire court terme (LMCT) et le réseau récurrent LMCT bidirectionnel (biLMCT).  

 

Jury d’évaluation : 

Stan Matwin, professeur, Faculty of Computer Science, Université Dalhousie, (membre externe)

Christophe Malaterre, professeur, UQAM, département de philosophie (membre externe)

Belkacem Chikhaoui, TELUQ, département Science et Technologie (membre interne et présidente du jury)

Gilbert Paquette, TELUQ, département Science et Technologie  (directeur de recherche)

Neila Mezghani, TELUQ, département Science et Technologie (codirectrice de recherche)

Michel Gagnon, Polytechnique de Montréal (codirecteur de recherche)

clockCreated with Sketch.Date / heure

vendredi 25 octobre 2019
13 h 30

pinCreated with Sketch.Lieu

Télé-université (TÉLUQ)
Local 11.051 (amphithéâtre)
5800, rue Saint-Denis
Bureau 1105
Montréal (QC)

dollarSignCreated with Sketch.Prix

Gratuit

personCreated with Sketch.Renseignements

Mots-clés

Groupes