Mes intérêts de recherche actuels incluent : Mes activités de recherches sont financées par le CRSNG, MITACS et PROMPT. Je vous invite à me contacter si vous êtes intéressés à collaborer sur un projet.

Forage de données d'assurance : techniques, éthique, et sécurité
  La compagnie d'assurances canadienne La Capitale Assurance et Services Financiers a accumulé, à travers le temps, plusieurs bases de données massives traitant de leurs clients dans leurs divers programmes d'assurances. Ils recherchent actuellement un moyen d'exploiter ces données afin de mieux comprendre leur clientèle, et ainsi personnaliser leur offre de produits d'assurance aux besoins de chaque individu. Ceci doit être réalisé dans le respect de normes éthiques strictes et des contraintes que les utilisateurs eux-même peuvent vouloir mettre sur l'utilisation de leurs données. Et, considérant la nature personnelle des informations qui seront obtenues sur les individus, la sécurité des données se doit d'être extrêmement robuste.

Ce programme de recherche s'oriente donc autour de trois axes fondamentaux. L'axe de forage des données vise à développer de nouveaux algorithmes pour inférer des informations sur les clients à partir de données d'interactions avec la compagnie. L'axe d'éthique et de l'acceptabilité sociale étudie les attentes des clients face à ce forage de données, tant du point de vue des bénéfices qu'ils veulent en tirer que de la protection de leurs vies privées. Et l'axe de sécurité des données développe de nouvelles techniques pour garantir la confidentialité, l'intégrité, la disponibilité, et la traçabilité de ces données.

L'industrie de l'assurance vaut plusieurs milliards de dollars dans l'économie canadienne, et la protection des informations personnelles est un sujet d'une grande importance pour la majorité de la population canadienne. Les outils de gestion d'information et de découverte de connaissance que nous allons développer vont donner aux compagnies canadiennes un avantage important dans ce marché international compétitif, tout en garantissant à la population canadienne un contrôle et une protection de ses informations personnelles.

Virage numérique de la presse québécoise
  Ce programme de recherche vise à épauler les compagnies de presse francophones dans la création et l'adoption d'outils intelligents pour la pratique journalistique. Plus spécifiquement, nous allons développer des d'algorithmes de recommandation pour diriger les lecteurs et lectrices vers les articles susceptibles de les intéresser, et ainsi améliorer l'expérience client des abonnés de ces journaux. En complément, et compte tenu de la fragilité financière des journaux régionaux, nous développerons des algorithmes de recommandation en charge de choisir les meilleures publicités à afficher sur un article et pour un lecteur, afin d'augmenter la rentabilité publicitaire du journal sans nuire à l'expérience du lecteur. Finalement, nous allons développer une gamme d'algorithmes visant à améliorer la distribution des articles sur les médias sociaux. Ceux-ci incluent des algorithmes éditoriaux dont l'objectif sera de présenter les articles d'une manière plus attrayante pour les utilisateurs des réseaux sociaux afin d'augmenter la visibilité et la diffusion de ces articles, et des algorithmes de modération afin de filtrer les commentaires toxiques souvent écrits à la suite d'articles sur les réseaux sociaux et encourager des discussions constructives et saines entre les lecteurs.

Traitement des nanoblog
  Le Traitement Automatique du Langage Naturel (TALN) a traditionnellement été fait avec de longs documents, et les tâches réalisées avec ces documents atteignent des performances très élevées et beaucoup sont même considérées comme « résolues ». La popularité de la messagerie SMS et la création de réseaux sociaux ont conduit à la popularisation de messages textes courts ou « microblogs », et de nombreuses tâches de TALN précédemment résolues sont redevenues des défis ouverts. Les nouvelles difficultés découlent de la courte longueur des messages, du peu d’information contextuelle disponible, de l’utilisation d’un langage nonconventionnel, et du caractère dynamique et social des conversations. Néanmoins, après une décennie de travaux de recherche, la majorité de ces problèmes ont été surmontés et les systèmes de traitement de microblogs atteignent régulièrement des performances comparables à celles du TALN traditionnel. Et grâce à ces avancées, les microblogs sont également devenus une ressource précieuse dans d’autres domaines de recherche.

La prochaine frontière du TALN viendra des messages de clavardage (« chat ») de plus en plus populaires dans les jeux en ligne et les communautés de jeux. Ces messages amplifient les problèmes des microblogs: ils sont encore plus courts, composés parfois d'un seul mot ou d'un acronyme et totalement dépourvus de contexte de message, ils utilisent un langage adapté au jeu auquel ils sont liés et qui est incompréhensible hors de ce contexte, et n’ont de sens que comme conversations en direct lors d’une partie. En raison de leur nature extrêmement courte, nous appelons ces conversations « nanoblogs ». L’objectif à long terme de cette proposition de recherche est d’être un pionnier dans le domaine du traitement du langage nanoblog et d’assurer le leadership du Canada dans ce domaine de recherche émergent. Pour ce faire, nous avons défini trois objectifs de recherche à court terme pour les cinq prochaines années. Objectif 1 : Nous allons concevoir, construire et étiqueter un corpus de nanoblogs obtenu à partir du monde réel. Objectif 2 : Nous allons créer des algorithmes de modélisation, de normalisation, et de détection de la langue pour le nanoblog. Objectif 3 : Nous allons créer des algorithmes de filtrage de cyberharcèlement pour les nanoblogs.