Soutenance de thèse de Francis Lareau, doctorat en informatique cognitive: «Lecture et analyse argumentaire de texte assistées par ordinateur (LAATAO): détection automatique d'argument dans les textes de haut niveau théorique»
SOUTENANCE DE THÈSE
VENDREDI 27 septembre 2024
9h30
UQAM, Pavillon President-Kennedy, local PK-2265
TITRE : Lecture et analyse argumentaire de texte assistées par ordinateur (LAATAO): détection automatique d'argument dans les textes de haut niveau théorique
Présenté par
Francis LAREAU, personne étudiante au doctorat en informatique cognitive, UQAM
Résumé
Ce travail de recherche vise à appliquer les méthodes de lecture et d'analyse de texte assistées par ordinateur (LATAO) à des textes de haut niveau théorique en explorant plus particulièrement les dimensions d'assistance à la fouille d'argument (argument mining). Il vise le développement d'un système informatique dont le but est d'effectuer la tâche de détection automatique d'arguments. Dans un premier temps, nous présentons les assises théoriques d'un tel système dont, notamment, l'analyse du discours, la lecture et l'analyse de texte assistées par ordinateur, l'argumentation, les modèles computationnels de l'argumentation ainsi que leurs différentes applications. Dans un deuxième temps, nous présentons le système de fouille d'argument de manière à saisir les différents objets informatiques en jeu ainsi que les étapes opératoires comme la définition du corpus, la préparation du corpus, la détection des arguments et la représentation des résultats. Dans un troisième temps, nous explorons plus en détail l'étape de détection de composantes argumentatives et des relations à l'intérieur et entre les arguments en explicitant les différentes représentations et les divers outils informatiques permettant une telle détection. Au terme de cette exploration, une théorie novatrice de l'argumentation est présentée ainsi que diverses hypothèses de recherche à propos de composantes argumentatives importantes telles que les contextes de citation et les thèses principales. À cet effet,deux expériences sont effectuées afin de tester les hypothèses de recherche. Les résultats de la première expérience montrent que la détection automatique de l'appartenance des contextes de citation à une structure argumentative particulière est possible. La combinaison d'une représentation textuelle basée sur ChatGPT sans surentrainement et d'un classifieur de type SVM semble donner de bons résultats, mais l'approche la plus performante apparait être une combinaison de la représentation BERT de base surentrainée sur nos données de la régression logistique avec validation croisée. Les résultats de la deuxième expérience montrent que la détection automatique de la thèse principale est possible. L'approche la plus performante pour la détection de la thèse principale apparait être une modèle ensembliste combinant une mesure de similitude entre la section "introduction" et les énoncés de la section "discussion", l'emplacement de la thèse principale dans le texte et la présence (ou non) de certains connecteurs de discours. Dans la structure du résumé, l'approche fondée sur l'emplacement s'est avérée plus performante.
Mots clés:
Argumentation; fouille d'arguments; texte de haut niveau théorique; analyse de discours; Lecture et Analyse de Texte Assistées par Ordinateur (LATAO); Lecture et Analyse Argumentaire de Texte Assistées par Ordinateur (LAATAO).
Jury d’évaluation :
Marcello Vitali-Rosati, professeur titulaire au département des littératures de langue française de l'Université de Montréal, (membre externe)
Motasem Alrahabi, Coordonnateur scientifique en Humanités Numériques à l'Université de la Sorbonne (membre externe)
Hakim Lounis, professeur au département d'informatique de l'Université du Québec à Montréal (membre interne et président du jury)
Pierre Poirier, Professeur au département de philosophie de l'Université du Québec à Montréal
Roger Villemaire, professeur au département d'informatique de l'Université du Québec à Montréal (codirecteur de recherche)
Date / heure
Lieu
Montréal (QC)