Three-levels Approach for Arabic Question Answering Systems

Authors

Lahsen Abouenour
UNIVERSITE MOHAMMED V DE RABAT DEPARTEMENT GENIE INFORMATIQUE

Keywords:

Arabic language, linguistics, intelligent systems, question answering systems

Synopsis

Les travaux de cette thèse présentent l’évaluation et l’amélioration des méthodes surfaciques et profondes dans le cadre des systèmes de Question Réponse pour la langue Arabe. Malgré l’importance de ces systèmes pour l’atténuation du problème de surcharge d’information, ce domaine du traitement des langages naturels connait une rareté au niveau des recherches associées ainsi qu’au niveau des ressources linguistiques utilisables.
La méthode à trois niveaux proposée comporte un premier niveau de traitement des questions selon les mots clés enrichis à travers les relations sémantiques de la ressource Arabic WordNet (AWN), un deuxième niveau portant sur la comparaison en tenant compte de la structure et de la densité des mots en utilisant le modèle Distance Density N-gram (DDN) et un troisième niveau basé sur la représentation en graphes conceptuelles dans un premier temps, et le calcul du score de similarité sémantique en passant par l’analyse syntaxique du texte dans un deuxième temps.
Un volet d’investigation a également concerné la proposition de méthodes semi-automatiques telles que Maximal Frequent Sequences (MFS) pour l’enrichissement de la ressource AWN et l’évaluation de l’impact de ce travail sur les performance.
Pour illustrer les performance de la méthode à trois niveaux proposée, plusieurs tests d’évaluation ont été effectués en utilisant des panels de questions présentant une bonne représentativité en termes de nombre, de type et de complexité, et ce en adoptant des mesures reconnues dans le domaine telles que la précision, le Mean Receprocal Rank (MRR) et le C@1.
Les résultats obtenus répondent positivement à la question de recherche qui est la possibilité de développer un système de Question Réponse pour la langue Arabe à partir des ressources et outils existants, d’atteindre des performance acceptables et de pallier aux différents défis de tels systèmes sur le plan général ainsi que sur le plan spécifique à cette langue.

Downloads

Download data is not yet available.

Downloads

Published

October 19, 2014

Series

Details about this monograph

Physical Dimensions