Mortensen & al. (2023)

De Arbres
  • David R. Mortensen, Ela Gulsen, Taiqi He, Nathaniel Robinson, Jonathan Amith, Lindia Tjuatja, & Lori Levin. 2023. 'Generalized Glossing Guidelines: An Explicit, Human- and Machine-Readable, Item-and-Process Convention for Morphological Annotation', Proceedings of the 20th SIGMORPHON workshop on Computational Research in Phonetics, Phonology, and Morphology, Toronto, Canada. Association for Computational Linguistics, 58–67. texte.


lecture critique

Cet article propose un système de gloses morphologiques universelles, qui puissent capturer la vaste diversité des morphèmes et opérations morphologiques à travers les langues du monde. Les annotations bienvenues sont proposées pour des processus très répandus typologiquement, et présents en breton, comme la réduplication ou les pluriels internes. Cependant, le système des mutations consonantiques, représenté entre autres dans toutes les langues celtiques, et au-delà dans différentes langues d'Afrique de l'Ouest et des Amériques, est ignoré. Le terme de "mutation" apparaît même dans l'introduction sans référer aux mutations consonnantiques, et l'irlandais est cité uniquement pour un exemple de pluriel interne.

Pour les mutations, pour Me 'gomz brezhoneg, 'Je parle breton', on utiliserait leur réécriture segmentale. Mais au moment d'écrire la glose, on n'a pas la possibilité de noter ce que l'initiale mutée nous dit de la particule vide devant.

 donnée : Me 'gomz brezhoneg.
 lx: me {k>g}omz brezhoneg
 sr: me {g}omz brezhoneg
 gl: 1SG  ??
 traduction: 'Je parle breton'


Si l'on compare cette annotation avec celle utilisée dans le présent site ARBRES, la perte d'information est notable sur deux points:

(i) l'association d'une mutation avec son déclencheur, ici non-réalisé (rannig a).
(ii) l'identification du set de mutations qui est impliqué (ici, la lénition)
(iii) le fait que la mutation soit ou non dépendante de traits présents sur l'élément muté (ici non, mais c'est courant dans le domaine nominal).

Pour un traitement automatique, on peut évidemment décider que l'on prendra en charge en aval le passage de la description pure de la surface phonologique à la reconstruction des paradigmes morphologiques, en rapport avec le contexte syntaxique et les traits particuliers des éléments en jeu. Cependant, cette décision revient fondamentalement à appauvrir l'annotation morphologique. Dans l'exemple ci-dessus, l'opération morphologique n'est pas /k>g/, mais l'application d'un changement régulier, la lénition, opposée au set de mutations mixtes qui aurait donné /k>X/, qui aurait alors révélé une autre particule verbale, le rannig e. C'est la connaissance du paradigme entier des transformations à l'initiale, et l'occurrence d'une seule opération choisie dans ce paradigme qui est morphologiquement signifiante.

Nos descriptions linguistiques nécessitent la possibilité de noter en gloses de quel set de mutations nous voyons la marque. Sur ARBRES, cette information est donnée par un système de numéro noté en superscript. Par exemple la lénition correspond au 1. Le set des mutations mixtes correspond au 4. Une règle de colocation du superscript ouvre de plus la possibilité de noter les traits de quels éléments sont nécessaires au calcul de cette mutation (le superscritp est accolé sur le déclencheur ou sur l'élément qui est muté suivant les traits qu'il doit considérer).