Jouitteau (2023d)

De Arbres
  • Jouitteau, Mélanie. 2023d. 'Guide de survie des langues minorisées à l'heure de l'intelligence artificielle : Appel aux communautés parlantes', Lapurdum, numéro spécial 6, texte.


 Résumé:
 "Cet article s'adresse à la fois aux chercheurs en sciences humaines et aux structures de politique linguistique des langues minorisées. Il comprend un résumé compréhensible de la chaîne de développement du numérique pour le Traitement Automatique des Langues (TAL), avec une attention particulière pour ces langues qui n'ont pas des corpus aussi vastes que le français ou l'anglais. Dans le contexte de la révolution de l'Intelligence Artificielle (IA), dont j'explique les enjeux pour ces langues à corpus restreint, je liste les recommandations indispensables au développement de ressources pérennes à même d'assurer un développement durable, avec une liste des pièges et mécompréhensions les plus courantes. L'article prend le breton comme exemple illustratif d'une langue à corpus restreint démontrant des ressources et applications numériques émergentes. Ses conclusions s'appliquent largement à toutes les langues à corpus restreint dont le développement numérique est amorcé, mais encore insuffisant pour profiter directement des applications d'IA développées actuellement pour les langues à corpus massif."


Cet article s'adresse à un large lectorat. Il sert de socle à un support de vulgarisation en préparation, conçu par Mélanie Jouitteau et Lynda Kehli dans le cadre de DORANUM, plateforme de formation en ligne sur la gestion et le partage des données de la recherche selon les principes FAIR (Facile à trouver, Accessible, Interopérable et Réutilisable) de la science ouverte, réalisée par l'Inist-CNRS et le GIS « Réseau Urfist ».