Untitled

Mon mémoire de thèse

Source en PostScript (Fichier Zip)

Résumé en Français

Résumé en Anglais

Mots-clés

Retour à la page d'accueil

Résumé en Français

Cette thèse présente un analyseur syntaxique fondé sur une structure de chart. La première partie de ce mémoire décrit des extensions à l'algorithme d'analyse par Chart permettant un traitement syntaxique adapté aux contraintes de l'analyse vocale. Ces extensions permettent notamment un contrôle de la syntaxe au fur et à mesure de la réception des mots. Elles proposent également des solutions aux limitations et contraintes inhérentes au système de reconnaissance vocale en autorisant la prédiction des catégories possibles du prochain mot ainsi que la déduction de la catégorie d'un mot manqué par le système. Ces travaux ont donné lieu à une première implantation de l'analyseur qui a été intégré au sein d'un système de dialogue homme-machine pour l'aide à la navigation dans des mondes virtuels. La seconde partie de cette thèse présente un système plus ambitieux combinant une grammaire syntagmatique, des règles de précédence et une grammaire de dépendances. Ce système reprend des éléments du premier analyseur en se fondant sur une structure de Chart divisée en plusieurs niveaux hiérarchiques. Ces niveaux correspondent à différents secteurs d'analyse gérés par trois modules qui collaborent en apportant leur compétence linguistique propre. Au moyen d'une grammaire formelle, le module de segmentation syntagmatique opère un découpage de la phrase pour donner un treillis composé des groupes syntaxiques (sujet, verbe, compléments circonstanciels...), des mots de structure (conjonction...) et des signes de ponctuation. A l'aide des règles de précédence, le module d'élagage effectue une sélection parmi les éléments du treillis afin de ne considérer que les segments présentant une cohérence avec le reste de la phrase. Enfin, le module d'analyse des dépendances s'appuie sur une grammaire de dépendance pour relier les segments entre eux et construire ainsi une représentation structurelle de la phrase.

Mots-clés

Analyse automatique (linguistique), formalisation (linguistique) ; étiquetage,

grammaire de dépendances, Chart (Algorithme d'analyse syntaxique)

Abstract

This thesis presents a parser based on a chart structure. The first part of the dissertation describes extensions to the chart algorithm allowing a syntactic processing suitable for the constraints of voice processing. In particular, these extensions also propose solutions to the limitations and constraints inherent in the voice recognition system: They allow the prediction of the possible lexical categories of the word to come and make assumptions on the category of a word missed by the system. These works have given rise to a first implementation of the parser which have been integrated into a conversational agent to navigate in virtual words. The second part of this thesis describes the integration of the first parser into a more ambitious system. The system uses a chart split in several hierarchical levels and combines a phrase structure grammar, a set of precedence rules and a dependency grammar. The hierarchical levels correspond to different stages of the parsing process managed by three modules. Each of these modules collaborates to the parsing bringing its linguistic competence to the system. The Segmentation Module

carries out a segmentation of the sentence to yield a lattice of constituents (subject, verb, adverbial complements . . . ), structural words (conjunctions . . . ) and punctuation signs. The Pruning Module performs a selection amongst the lattice elements in order to retain only the segments which are well integrated with the rest of the sentence. Finally, the Dependency Parser Module links these segments to construct the dependency graph of the sentence