Titre: Weka4UIMA

Encadrant(s): Nicolas.Hernandez(@univ-nantes.fr)

Thème: Intelligence artificielle, Traitement automatique du langage, Apprentissage automatique

Sujet: Dans le domaine de l'Intelligence Artificielle, un des enjeux est de permettre aux machines d'apprendre des connaissances automatiquement. Un des moyens est d'exploiter les énormes masses de texte que l'on peut trouver sur le web et ailleurs. Parmis les techniques d'apprentissage automatique il existe celles qui sont supervisées et qui consistent à montrer des exemples de ce que l'on veut apprendre et celles non supervisées où l'on demande à la machine d'extraire elle-même des similarités et des différentes des données qu'on lui fourni. Weka est une bibliothèque Java qui implémente une multitude d'algorithmes d'apprentissage. Apache UIMA est une plate-forme logicielle en Java permettant de faire de l'analyse de textes et par conséquent de fournir des exemples de données et des informations que peuveut utiliser des algorithmes d'apprentissage.

L'objectif du projet est de réaliser (au moins) deux composants au sein de la plate-forme UIMA. Le premier composant prendra en entrée une quelconque analyse de texte fournie par des composants antérieurs et selon son paramètrage utilisera Weka pour construire un modèle de connaissances. Le second composant prendra en entrée un modèle de connaissances et utilisera à nouveau Weka pour reconnaître ces connaissances sur de nouveaux textes.

 
teaching/projet/weka4uima.txt · Last modified: 2010/05/13 12:35 (external edit)
 
Recent changes RSS feed Creative Commons License Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki