Soutenances de thèses
STAVRIANOU Anna : Modélisation et fouille de discussions du Web
Jury : Jean-Gabriel Ganascia (Université Paris 6), Pascal Poncelet (Université Montpellier 2), Marc El-Beze (Université d’Avignon), Stefan Trausan-Matu (Académie Roumaine), Jean-Hugues Chauchat (Université Lyon 2), Julien Velcin (Université Lyon 2).
Le développement du Web 2.0 a donné lieu à la production d’une grande
quantité de discussions en ligne. La fouille et l’extraction de
données de qualité de ces discussions en ligne sont importantes dans
de nombreux domaines (industrie, marketing) et particulièrement pour
toutes les applications de commerce électronique. Les discussions de
ce type contiennent des opinions et des croyances de personnes et cela
explique l’intérêt de développer des outils d’analyse efficaces pour
ces discussions.
L’objectif de cette thèse est de définir un modèle qui représente les
discussions en ligne et facilite leur analyse. Nous proposons un
modèle basé sur des graphes. Les sommets du graphe représentent les
objets de type message. Chaque objet de type message contient des
informations comme son contenu, son auteur, l’orientation de l’opinion
qui y été exprimée et la date où il a été posté. Les liens parmi les
objets message montrent une relation de type "répondre à ". En d’autres
termes, ils montrent quels objets répondent à quoi, conséquence
directe de la structure de la discussion en ligne.
Avec ce nouveau modèle, nous proposons un certain nombre de mesures
qui guident la fouille au sein de la discussion et permettent
d’extraire des informations pertinentes. Les mesures sont définies par
la structure de la discussion et la façon dont les objets messages
sont liés entre eux. Il existe des mesures centrées sur l’analyse de
l’opinion qui traitent de l’évolution de l’opinion au sein de la
discussion. Nous définissons également des mesures centrées sur le
temps, qui exploitent la dimension temporelle du modèle, alors que les
mesures centrées sur le sujet peuvent être utilisées pour mesurer la
présence de sujets dans une discussion.
La représentation d’une discussion en ligne de la manière proposée
permet à un utilisateur de "zoomer" dans une discussion. Une liste de
messages clés est recommandée à l’utilisateur pour permettre une
participation plus efficace au sein de la discussion.
De plus, un système prototype a été implémenté pour permettre Ã
l’utilisateur de fouiller les discussions en ligne en sélectionnant un
sous ensemble d’objets de type message et naviguer à travers ceux-ci
de manière efficace.