laboratoire Analyse et Traitement Informatique de la Langue Française (ATILF)
CNRS Université de Lorraine

Membre de
ILF
FEDER
Accueil > La recherche > Équipes > Ressources, normalisation, annotation et exploitation

Ressources, normalisation, annotation et exploitation

Compétences scientifiques, champs des travaux


L’équipe "Ressources, normalisation, exploitation et annotation" mène des recherches linguistiques et littéraires sur grands corpus. Son objectif est d’échantillonner, assembler et annoter des corpus thématisés. Des analyses sont ensuite menées sur ces ensembles textuels, grâce à des outils de recherche automatisés, selon des axes :

lexicographiques (évolution d’un lemme en contexte)
thématiques / historiques (vocabulaire du politique, de la guerre)
sociologiques (prises en compte du genre sexué, de l’aire linguistique, des éditeurs, des formats)
génétiques (comparaison de versions de textes imprimés)
génériques (réflexion sur la théorie des genres par observation de traits linguistiques donnés).

Le versement dans des infrastructures, la pérennisation de l’archivage et la mise à disposition des corpus dans le respect du droit d’auteur font également partie des missions de l’équipe RNAE. Elle gère en particulier la base de données Frantext, dont elle assure l’enrichissement et l’exploitation.

La gestion des corpus et leur normalisation, gage de leur pérennité et de leur diffusion devient en effet un enjeu scientifique. Notre conviction est qu’une telle gestion nécessite tout autant des compétences techniques qu’une expertise scientifique. Nos compétences portent donc :
* sur les normes (TEI, MAF, CMDI, ..), à l’évolution desquelles nous participons,
* sur l’instanciation de ces normes en matière de textes littéraires et non littéraires.


  Annuaire | Contact | Courriel | Intranet | Plan d'accès | Autres sites | Crédits | Mentions légales