laboratoire Analyse et Traitement Informatique de la Langue Française (ATILF)
CNRS Université de Lorraine

Membre de
ILF
FEDER
Accueil > Les actualités > Mise à disposition de Yan Greub, directeur-adjoint de l’ATILF

Mise à disposition de Yan Greub, directeur-adjoint de l’ATILF

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Depuis le 1er juillet 2018, Yan Greub, chargé de recherche CNRS et responsable de l’équipe de recherche Linguistique historique française et romane et directeur-adjoint du laboratoire ATILF depuis le 01/01/2018, bénéficie d’une mise à disposition à 30 % à l’Université de Neuchâtel, et ce pour une période d’1,5 ans (juillet 2018 > décembre 2019).

L’équipe Linguistique historique française et romane fait de la recherche fondamentale, particulièrement en lexicologie, lexicographie et syntaxe historiques françaises, galloromanes et romanes.

 

Par ses qualités scientifiques, Yan Greub dirige en Suisse une institution d’une douzaine de personnes, linguistes qui concourent à rédiger le Glossaire des patois de la Suisse romande ; il s’agit d’un des quatre vocabulaires nationaux suisses, soutenus par l’Académie suisse des sciences humaines. Celui-ci est en cours de rédaction depuis 1924, enrichi au fil de l’eau par des publications par fascicules (à ce jour à la lettre G).

 

Le 12 septembre dernier, une journée a été dédiée à l’ouverture du portail web de ce Glossaire.

Note historique, dixit Yan Greub

Le Glossaire des patois de la Suisse romande a une longue histoire, qui commence à la fin du 19e siècle. Son fondateur, Louis Gauchat, qui constatait, comme le faisaient les savants français au même moment, la disparition prévisible des patois, a voulu préserver le patrimoine linguistique de la Suisse romande pendant qu’il était encore temps. Mais le but patriotique du Glossaire n’était pas limité à la langue : c’est tout le patrimoine culturel qu’il s’agissait de conserver. Quels moyens fallait-il employer ? Ceux qui connaissent le Glossaire savent qu’ils ont été considérables : la collection des dictionnaires patois, la recherche des sources anciennes, ont été une œuvre immense, mais la grande richesse du Glossaire, ce sont les enquêtes directes, et en particulier la grande enquête par correspondance, qui s’est étendue sans interruption sur 12 ans et a impliqué des dizaines de collaborateurs bénévoles. La richesse des réponses, d’ailleurs, dépassa tout ce que les rédacteurs avaient imaginé. La conception de cette enquête est admirable, mais la reconnaissance va peut-être tout particulièrement aux correspondants, simples patoisants, normalement sans formation linguistique, qui ont pris sur leur temps celui de porter témoignage, pour l’avenir, de leur langue et de leurs croyances. Cette reconnaissance crée un devoir envers ceux qui nous ont laissé une documentation semblable dans le but qu’elle soit conservée, mais aussi diffusée et connue. La valeur de ce témoignage est d’autant plus grande que, Yan Greub y a fait allusion, elle ne concerne pas que le vocabulaire, mais que les concepteurs de l’enquête demandaient à leurs correspondants de relever également les dictons, les proverbes, les phrases courantes de la vie de tous les jours, et qu’ils qu’ils voulaient décrire aussi les traditions populaires et à la vie culturelle.

 

Dès le premier projet, Louis Gauchat prévoyait que le « glossaire ne se bornerait pas à réunir des matériaux linguistiques, mais [qu’] il renfermerait, en outre, une bonne partie de l’histoire de la civilisation de la Suisse romande ». Ces éléments occupent ensemble une place considérable dans le Glossaire : il ne s’agit pas seulement des parties encyclopédiques des articles, ou les dessins et les photographies, mais de toutes les phrases citées comme exemples, qui ont de ce point de vue une importance considérable et sont un des plaisirs de sa lecture.

 

Quant à la langue, le Glossaire est bien plus que le dictionnaire des patois romands. Si cet élément y est primordial, on y trouve aussi le français régional, les éléments linguistiques anciens, les noms de lieux et les noms de famille.
Dès le premier projet de Glossaire, la question du meilleur moyen de rendre facilement accessible son contenu au public le plus large a été centrale, et la justification des décisions prises à ce sujet occupe une bonne part de la première préface et des documents antérieurs. Dans un certain sens, il s’agit là de la préhistoire de l’informatisation du Glossaire, qui n’est pas autre chose qu’un moyen de rendre accessible la prodigieuse matière qu’il contient, et parfois dissimule. L’histoire de l’informatisation est en quelque sorte celle d’un dévoilement, dont la première étape a été la publication de l’index des quatre premiers volumes, en 1970. Il était cependant limité aux formes françaises et latines.
C’est ensuite seulement qu’a commencé l’approche informatique, avec la Base de données du Glossaire appelée BDD. C’est par le travail à cette base de données, en tout cas, que Yan Greub est entré pour la première fois en rapport professionnel avec le Glossaire, en 2001, mais il se trouve dans la même situation que bien des rédacteurs actuels, et quelques autres personnes.
La BDD a d’abord servi à la rédaction, et avait pour but initial de réaliser automatiquement les index de fin de volume ; ce n’est qu’après de nombreuses années qu’elle a été utilisée pour une fonction directement utile au public : c’est elle qui forme la base de la recherche en ligne qui était disponible jusqu’aujourd’hui, et qu’elle continue à être alimentée et enrichie, et qu’elle continuera à permettre des recherches ciblées.

 

Une troisième étape a donc été la mise à disposition du public du Glossaire scanné, accessible par une recherche avancée qui reposait sur cette BDD. Sont en accès ainsi des images de toutes les pages du Glossaire, ce qui permet de le lire de chez soi, d’une manière à certains égards plus commode que la version imprimée, grâce à l’indexation que fournit la recherche avancée.

 

Aujourd’hui, enfin, le Glossaire est présenté sous une forme entièrement rétroconvertie, c’est-à-dire que les utilisateurs ne disposent pas seulement d’une base de données reprenant des données choisies, ou d’une reproduction du dictionnaire, mais de l’ensemble de son texte sous une forme informatique, et ceci dans une version corrigée et revue, et donc très sûre, même si le Glossaire imprimé continue à faire foi en cas de désaccord.

 

Cette BDD permet des recherches très variées, et d’ailleurs si variées qu’elles peuvent très bien aller au delà de ce que les rédacteurs ont imaginé : il y a de la place pour toutes les questions que nous n’avons pas encore eu l’idée de poser, contrairement à ce qu’on avait jusque là, où les questions étaient déterminées par ce qui avait été prévu au moment de la constitution de la BDD.

 

Pourquoi ce nouveau mode d’interrogation, pourquoi une informatisation complète du dictionnaire, à quoi cela sert-il ?

Tout d’abord, le Glossaire a, depuis sa création, un devoir patrimonial. Il le partage avec les autres vocabulaires nationaux. Il remplit ce devoir par la publication des volumes papier, plus une diffusion plus large, attendue dans le monde actuel, et d’autant plus que, c’est le but collectif espéré atteint, l’accès au Glossaire sera rendu plus facile pour le grand public.
La conservation du patrimoine et la facilitation de son accès sont deux aspects du même devoir qui incombe à cette équipe.
La plus grande facilité d’accès n’aura pas seulement des avantages pour le grand public, mais aussi pour le public "savant", puisque celui-ci n’est pas nécessairement spécialisé dans ce domaine exactement. Le gain de facilité de l’accès aux données du Glossaire devrait permettre aux linguistes, et en particulier aux linguistes du français, de manipuler plus facilement les données, mais cela s’applique aussi aux spécialistes d’autres langues, ainsi qu’aux ethnologues ou aux historiens.

 

Le gain de facilité aux données est un gain de temps dans les recherches, mais aussi la possibilité d’un gain de complexité dans celles-ci. Des données présentes dans le Glossaire, mais jusqu’ici très difficiles à atteindre, ou impossibles à mettre en relation, deviennent maintenant accessibles.
Il s’agit bien de la réalité grâce à l’expérience des rédacteurs eux-mêmes, qui ont pu utiliser le Glossaire rétroconverti en phase de test.
L’informatisation du Glossaire n’est pas un isolat. Beaucoup des grands dictionnaires comparables sont passés par là eux aussi, ou sont en train de le faire.

 

L’informatisation du Glossaire a eu lieu en deux temps : extractions des données triées, puis rétroconversion de l’ensemble. C’est un cas de figure qui ne s’est pas nécessairement rencontré ailleurs. Si nous prenons l’exemple de l’autre dictionnaire pour lequel Yan Greub travaille, le Französisches Etymologisches Wörterbuch | FEW, ce processus d’informatisation, qui a commencé il y a longtemps mais n’a pas encore été mené à terme, dépend d’un seul acte de rétroconversion, et d’une interprétation automatisée des différentes parties de l’article, qui crée la base de la recherche par champ. Cette interprétation est très délicate, et il a fallu tout une thèse de doctorat pour proposer un outil qui la réalise.

 

Dans le cas d’un autre dictionnaire voisin, du fait de sa matière, et ami, le Dictionnaire étymologique de l’ancien français, l’informatisation était intégrée dès la conception initiale, et la confection d’index aurait pu être automatisée, mais l’évolution trop rapide des programmes informatiques, et leur obsolescence, fait que le travail a dû être recommencé de nombreuses fois. Les index imprimés restent, heureusement.
Un autre dictionnaire de l’ancienne langue française est le Dictionnaire du moyen français | DMF. Dans son cas, l’idée d’une version papier a été très tôt abandonnée dans le processus de rédaction, et le dictionnaire n’est accessible que sous forme informatique. Il n’y a donc jamais eu de rétroconversion.

 

Enfin, le principal dictionnaire du français, le Trésor de la langue française | TLF est l’exemple le plus encourageant pour ceux qui espèrent augmenter leur lectorat. Sous sa forme papier, sa diffusion a été très décevante, et bien inférieure à son mérite, à tel point que lorsque tous les exemplaires restants d’un volume ont disparu dans l’incendie d’un entrepôt, personne n’a envisagé un nouveau tirage, et qu’il n’est plus possible depuis longtemps d’acheter le dictionnaire sous cette forme. Il ne sait pas si le CD-Rom qui en a été tiré a eu beaucoup d succès, mais sur internet, en accès libre, il est consulté 600 000 fois par jour. Ce n’est pas l’objectif fixé pour le portail web du Glossaire.

 

La rétroconversion, c’est-à-dire la possibilité d’accéder au texte complet du Glossaire sous forme informatique ouvre des possibilités qui ne sont pas encore exploitées, et qui seront sans doute un prochain chantier : celui de l’interconnexion entre les dictionnaires européens, à laquelle le Glossaire est maintenant parfaitement en mesure de prendre part.

 

L’informatisation du Glossaire a été une opération très coûteuse, qui a été réalisée grâce à plusieurs crédits de l’Académie suisse des sciences humaines. En 1895, John Clerc, conseiller d’état neuchâtelois en charge de l’instruction publique, s’était convaincu de l’utilité du projet de glossaire des patois romands, avait convoqué ses homologues des cantons romands et les avait convaincus de soutenir la vision de Louis Gauchat, avec l’aide de la Confédération. Aujourd’hui encore, la Conférence intercantonale de l’instruction publique continue à soutenir le Glossaire, comme le fait la Confédération par l’intermédiaire de l’Académie suisse des sciences humaines.
=> Consulter le site du Glossaire des patois de la suisse romande : https://www.unine.ch/gpsr

 

 

Dernière mise à jour : 12/12/2018 - DB © L. Gobert communication ATILF - source : Yan Greub