Élicitation

De Arbres

Une élicitation est une séance de recherche linguistique de terrain avec au moins un ou une locutrice. La liste de tâches ou de questions est appelé un protocole d'élicitation.

Le travail d'élicitation consiste à confronter un locuteur natif avec ses intuitions grammaticales dans sa propre langue. Il existe de multiples tâches d'élicitation possibles dans un protocole: compréhension, traduction, jeux de question-réponse, permutations de données libres... Telle phrase dans tel contexte est-elle grammaticale ? Est-elle aussi pertinente dans le contexte donné ? Comment décrire une image donnée ? Si l'ordre des mots est inversé, la phrase reste-t-elle grammaticale ?

L'élicitation est une des sources possibles des bases empiriques d'une grammaire, à côté des relevés de corpus ou des études statistiques d'usage. Ses résultats sont précieux car l'élicitation est la seule source de données qui fournit des données négatives, c'est-à-dire des jugements grammaticaux par un locuteur natif que, du moins dans sa variété de langue propre, une forme donnée est agrammaticale. Par définition, les formes agrammaticales ne se trouvent effectivement pas dans les corpus, et une absence statistique prouve juste que la forme en question n'est pas répandue. L'élicitation permet donc de tracer les limites de ce qui est possible dans un système linguistique donné.

Ce site comprend une centrale d'élicitation. Les résultats bruts des protocoles y sont postés en ligne. Ils alimentent la recherche en syntaxe formelle, mais aussi la grammaire descriptive ARBRES sur ce site.


Définition d'un protocole d'élicitation

Une structure grammaticale peut être étudiée en lui faisant subir des tests assez similaires aux tests mis en place en chimie pour analyser une matière. Pour étudier un adverbe, on va par exemple le mettre dans tous les endroits possibles dans la phrase et vérifier si les résultats sont grammaticaux ou agrammaticaux pour les locuteurs natifs. On pourra aussi mettre la phrase à différentes valeurs temporelles ou aspectuelles, et voir si les adverbes restent grammaticaux avec ces différentes valeurs. Pour un adverbe donné, on pourra chercher à le modifier, à le mettre sous un focus, à le bouger dans la phrase ou à le cliticiser, pour dégager un portrait syntaxique le plus complet possible, qui rendra compte au plus près de la compétence d'un locuteur, afin de modéliser sa grammaire interne.

Les tâches prévues dans une séance d'élicitation (traductions, jugements de grammaticalité, descriptions d'images, etc.) sont réunies dans ce qui est appelé un protocole.

élicitation vs. étude de corpus

L'élicitation et l'étude de corpus sont des méthodes distinctes. Il est important de comprendre les différences entre ces deux méthodes de récolte des données. Ce sont des techniques différentes et leurs résultats sont aussi de natures différentes. Leur utilisation pourra en être différenciée.

Une fois différenciés, l'élicitation et l'étude de corpus n'ont pas à être opposées. Ces méthodes peuvent être menées en combinaison, comme c'est le cas sur ce site de la wikigrammaire des dialectes du breton.

L'élicitation fournit des informations précieuses que le corpus ne peut fournir. Jamais un corpus ne nous dira les limites d'une structure donnée. Le corpus est limité par la performance, et non par la compétence. Il peut tout au plus nous donner une idée des contextes favorables à l'apparition de structures grammaticales. Le travail d'élicitation nous fournit en plus l'assurance que pour un locuteur donné, telle ou telle structure n'est pas possible. Ce sont ces limites précisément que la grammaire générative cherche à expliquer. De plus, l'élicitation peut étudier des structures rares en corpus mais cependant solidement grammaticales. L'élicitation permet d'étudier la compétence des sujets parlants, la connaissance interne fine qu'ils ont du système de la grammaire de leur langue.

Dans la tradition des études du breton, la tradition d'analyse structuraliste s'est plutôt restreinte aux études de corpus. En 1971, à une question de Wolfgang Dressler qui demande si au cours des enquêtes il faut se contenter des expressions spontanées, Per denez répond qu'il faut se garder toujours de solliciter des formes précises (Denis (1972:152), sans plus argumenter. La tradition linguistique anglo-saxonne et générativiste au sens large introduit plus tard les techniques d'élicitation.

Réplicabilité

Sprouse & Almeida (2012) ont testé la réplicabilité des résultats obtenus par élicitation. Ils trouvé un taux minimum de réplication de 98% des résultats d'élicitation en prenant les 469 données d'un manuel d'introduction à la syntaxe.

L'élicitation implique de relever différents défis liés à mise en interaction d'une ou un linguiste avec des locuteurs. La culture des locuteurs, leurs représentations culturelles sur leurs propres formes langagières entre aussi en compte. Le défi consiste à obtenir des jugements de grammaticalité et d'agrammaticalité de la part de locuteurs qui résistent culturellement à exprimer des jugements grammaticaux et tendent à se référer à des normes (existantes ou imaginées) extérieures à eux-mêmes (D'Alessandro & al. 2021).

Études qualitatives vs. études quantitatives

langues minorisées, langues d'héritage

Les locuteurs des langues minorisées et des langues d'héritage sont aussi les locuteurs les moins nombreux, et les moins enclins à répondre en masse ou par internet. Par nature, ces langues sont moins facilement approchables scientifiquement par les approches quantitatives. Là où les études statistiques ne peuvent fournir que des résultats statistiquement non-significatifs, l'élicitation fournit des données qualitatives.

humains, IA et données rares

Les humains savent apprendre d'une information nouvelle accédée une seule fois. En contraste, les systèmes artificiels doivent être entraînés des centaines de fois avec les mêmes informations pour les apprendre. L'étude de l'apprentissage linguistique par des données statistiquement non-significatives est aussi l'étude d'une propriété pour l'instant spécifiquement humaine dans l'apprentissage.

Bibliographie

  • D'Alessandro Roberta, David Natvig & Michael Putnam. 2021. 'Addressing Challenges in Formal Research on Moribund Heritage Languages: A Path Forward', Frontiers in Psychology 12, texte.
  • Sprouse, J., & Almeida, D. 2012. 'Assessing the reliability of textbook data in syntax: Adger's "Core Syntax"', Journal of Linguistics 48:3, 609-652.
  • Broekhuis, Hans. 2019. 'Why I will not become a corpus linguist, The use of introspection data and corpus data in synchronic syntactic research', ms. texte.