Les technologies clés

* Technologies de l'information et de la communication

Ingéniérie linguistique

Fiche Technologie-clé n : 51

VERSION 3


Présentation de la technologie

*Définition

L'ingénierie linguistique est l'ensemble des méthodes et des techniques à l'intersection de l'informatique et de la linguistique. Elle vise à mettre en oeuvre l'ensemble des techniques informatiques (souvent les plus avancées) pour le développement d'applications dotées d'une compréhension plus ou moins large de la langue naturelle.

*Techniques mises en oeuvre

Les techniques informatiques sont souvent les plus avancées :

Objectifs de la technologie

*Contexte concurrentiel et économique

Alors que la France dispose de compétences internationalement reconnues dans ce domaine (voir "Pôles de compétences français"), les produits français commercialisés sont rares et la suprématie américaine s'installe. Mais le marché n'en est qu'à ses balbutiements et constitue l'un des grands enjeux à venir pour la société de l'information. La France devrait rapidement promouvoir une offre commerciale dans ce domaine.

*Fonctions remplies :

L'ingénierie linguistique vise à permettre à l'ordinateur ou à des applications logicielles en particulier de comprendre le sens du "langage naturel" (par opposition aux langages informatiques).

Ceci doit permettre à terme :

Environnement technologique

*Technologies concurrentes :

On distingue les outils de gestion documentaire qui s'appuient sur le principe de l'indexation manuelle par mots clés pour l'identification des contenus, des documents et bases de données (relationnelles) utilisées traditionnellement pour la gestion de données structurées où le texte n'a pas une importance centrale.

*Evolutions technologiques :

Les outils de gestion documentaire s'appuient de plus en plus sur des bases de données relationnelles pour tirer partie de la sémantique de l'organisation des données en fichiers reliés. Ils intègrent quasiment tous des fonctions plus ou moins avancées de recherche en texte intégral sur les documents numérisés. Les bases de données relationnelles intègrent également de plus en plus des fonctions avancées de recherche en texte intégral.

A terme, avec l'évolution des techniques de numérisation et grâce aux progrès de l'ingénierie linguistique, l'indexation automatique devra remplacer l'indexation manuelle des documents.

L'ingénierie linguistique joue un rôle fondamental dans le développement des techniques de reconnaissance de la parole (pour déclencher une action ou transformer automatiquement la parole en écrit - ex : dictée automatique -).

Le résumé automatique et la génération de texte sont vraisemblablement les prochains développements technologiques.

*Programmes de recherche :

Projets Eurêka GRAAL (Grammaires réutilisables pour l'analyse automatique des langues) et GENELEX (Generic Lexicon)

retour

nous écrire