L'unité MIG et l'unité MIAJ ont fusionné au 1er janvier 2015. Elles constituent dorénavant la nouvelle unité MaIAGE dont le site internet est accessible via l'URL suivante : http://maiage.jouy.inra.fr.

Extraction de connaissances à partir de textes pour la modélisation en biologie

Equipe Bibliome

Les documents scientifiques ou techniques contiennent des connaissances qui ne sont pas disponibles ailleurs. Pour être utilisables de façon extensive et automatisée, ces connaissances doivent être interprétées à partir de leur formulation en langage naturel.
L'équipe Bibliome développe des méthodes d'analyse sémantique profonde utilisées pour de nombreuses applications pour la biologie : extraction d’information, recherche sémantique documentaire, construction d'ontologie, etc.

Les méthodes mises en jeu sont complexes et variées. Par exemple, pour identifier une information factuelle précise, par exemple, la fonction d’une enzyme, les outils exploitent de nombreuses connaissances linguistiques spécifiques au domaine étudié (terminologie, morphologie, syntaxe, etc.), des connaissances sous la forme d’ontologies (une enzyme est une protéine) et des connaissances sur l’organisation et la structure des documents. Ces diverses connaissances spécialisées peuvent être acquises automatiquement à partir de corpus d’entraînement. Les méthodes utilisées pour l’acquisition de ces ressources relèvent de l’apprentissage automatique associé à des méthodes linguistiques.

Site Web de l'équipe Bibliome