ArticlesAcceptesRECITAL

Articles longs

Ces articles feront l’objet d’une présentation orale lors d’une session de la conférence

Jérémy Ferrero (Compilatio, France). fr2sql : Interrogation de bases de données en français
Abstract: Les bases de données sont de plus en plus courantes et prennent de plus en plus d’ampleur au sein des applications et sites Web actuels. Elles sont souvent amenées à être utilisées par des personnes n’ayant pas une grande compétence en la matière et ne connaissant pas rigoureusement leur structure. C’est pour cette raison que des traducteurs du langage naturel aux requêtes SQL sont développés. Malheureusement, la plupart de ces traducteurs se cantonnent à une seule base du fait de la spécificité de l’architecture de celle-ci. Dans cet article, nous proposons une méthode visant à pouvoir interroger n’importe quelle base de données à partir du français. Nous évaluons notre application sur deux tables à la structure différente et nous montrons également qu’elle supporte plus d’opérations que la plupart des autres traducteurs.
Mokhtar Boumedyen Billami (LIF, Laboratoire d’Informatique Fondamentale de Marseille, France). Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques
Abstract: La désambiguïsation lexicale permet d’améliorer de nombreuses applications en traitement automatique des langues (TAL) comme la recherche d’information, l’extraction d’information, la traduction automatique, ou la simplification lexicale de textes. Schématiquement, il s’agit de choisir quel est le sens le plus approprié pour chaque mot d’un texte. Une des approches classiques consiste à estimer la similarité sémantique qui existe entre les sens de deux mots puis de l’étendre à l’ensemble des mots du texte. La méthode la plus directe donne un score de similarité à toutes les paires de sens de mots puis choisit la chaîne de sens qui retourne le meilleur score (on imagine la complexité exponentielle liée à cette approche exhaustive). Dans cet article, nous proposons d’utiliser une méta-heuristique d’optimisation combinatoire qui consiste à choisir une fenêtre contenant les voisins les plus proches par sélection distributionnelle autour du mot à désambiguïser. Le test et l’évaluation de notre méthode portent sur un corpus écrit en langue française en se servant du réseau sémantique BabelNet. Le taux d’exactitude obtenu est de 78% sur l’ensemble des noms et des verbes choisis pour l’évaluation.
Caroline Langlet (Telecom ParisTech, France). Vers un modèle de détection des affects, appréciations et jugements dans le cadre d’interactions humain-agent
Abstract: Cet article aborde la question de la détection des expressions d’attitude — affect, d’appréciation et de jugement (Martin and White, 2005)– dans le contenu verbal de l’utilisateur au cours d’interactions en face-à-face avec un agent conversationnel animé. Il propose un positionnement en terme de modèles et de méthodes pour le développement d’un système de détection adapté aux buts communicationnels de l’agent et à une parole conversationnelle. Après une description du modèle théorique de référence choisi, l’article propose un modèle d’annotation des attitudes dédié l’exploration de ce phénomène dans un corpus d’interaction humain-agent. Il présente ensuite une première version de notre système. Cette première version se concentre sur la détection des expressions d’attitudes pouvant référer à ce qu’aime ou n’aime pas l’utilisateur. Le système est conçu selon une approche symbolique fondée sur un ensemble de règles sémantiques et de représentations logico-sémantiques des énoncés.

Articles posters

Ces articles feront l’objet d’une présentation sous forme de poster

Maâli Mnasri (CEA LIST, France)Résumé Automatique Multi-Document Dynamique : État de l’art
Abstract: Les travaux menés dans le cadre du résumé automatique de texte ont montré des résultats à la fois très
encourageants mais qui sont toujours à améliorer. La problématique du résumé automatique ne cesse d’évoluer avec les
nouveaux champs d’application qui s’imposent, ce qui augmente les contraintes liées à cette tâche. Nous nous intéres-
sons au résumé extractif multi-document dynamique. Pour cela, nous examinons les différentes approches existantes en
mettant l’accent sur les travaux les plus récents. Nous montrons ensuite que la performance des systèmes de résumé
multi-document et dynamique est encore modeste. Trois contraintes supplémentaires sont ajoutées : la redondance inter-
document, la redondance à travers le temps et la grande taille des données à traiter. Nous essayons de déceler les insuffi-
sances des systèmes existants afin de bien définir notre problématique et guider ainsi nos prochains travaux.
Hugo Mougard (Laboratoire LINA, France)Alignement multimodal de ressources éducatives et scientifiques
Abstract: Cet article présente certaines questions de recherche liées au projet (anonymisé). L’ambition de ce projet est de valoriser les ressources éducatives et académiques en exploitant au mieux les différents médias disponibles (vidéos de cours ou de présentations d’articles, manuels éducatifs, articles scientifiques, présentations, etc). Dans un premier temps, nous décrirons le problème d’utilisation jointe de ressources multimédias éducatives ou scientifiques pour ensuite introduire l’état de l’art dans les domaines concernés. Cela nous permettra de présenter quelques questions de recherche sur lesquelles porteront des études ultérieures. Enfin nous finirons en introduisant trois prototypes développés pour analyser ces questions.
Soufian Salim (Laboratoire LINA, France)État de l’art : l’analyse du dialogue appliquée aux conversations écrites en ligne porteuses de demandes d’assistance
Abstract: Le développement du Web 2.0 et le processus de création et de consommation massive de contenus générés par les utilisateurs qu’elle a enclenché a permis le développement de nouveaux types d’interactions chez les internautes. En particulier, nous nous intéressons au développement du support en ligne et des plate-formes d’entraide. En effet, les archives de conversations en ligne porteuses de demandes d’assistance représentent une ressource inestimable, mais peu exploitée. L’exploitation de cette ressource permettrait non seulement d’améliorer les systèmes liés à la résolution collaborative des problèmes, mais également de perfectionner les canaux de support client proposés par les entreprises opérant sur le web. Pour ce faire, il est cependant nécessaire de définir un cadre formel pour l’analyse discursive de ce type de conversations. Cet article a pour objectif de présenter l’état de la recherche en analyse des conversations écrites en ligne, sous différents médiums, et de montrer dans quelle mesure les différentes méthodes exposées dans la littérature peuvent être appliquées à des conversations fonctionnelles inscrites dans le cadre de la résolution collaborative des problèmes utilisateurs.