Jouitteau (2023d)

De Arbres
Révision datée du 7 septembre 2024 à 09:15 par Mjouitteau (discussion | contributions) (→‎histoire éditoriale)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
  • Jouitteau, Mélanie. 2023d. 'Guide de survie des langues minorisées à l'heure de l'intelligence artificielle : Appel aux communautés parlantes', Lapurdum, numéro spécial 6, texte.


 Résumé:
 "Cet article s'adresse à la fois aux chercheurs en sciences humaines et aux structures de politique linguistique des langues minorisées. Il comprend un résumé compréhensible de la chaîne de développement du numérique pour le Traitement Automatique des Langues (TAL), avec une attention particulière pour ces langues qui n'ont pas des corpus aussi vastes que le français ou l'anglais. Dans le contexte de la révolution de l'Intelligence Artificielle (IA), dont j'explique les enjeux pour ces langues à corpus restreint, je liste les recommandations indispensables au développement de ressources pérennes à même d'assurer un développement durable, avec une liste des pièges et mécompréhensions les plus courantes. L'article prend le breton comme exemple illustratif d'une langue à corpus restreint démontrant des ressources et applications numériques émergentes. Ses conclusions s'appliquent largement à toutes les langues à corpus restreint dont le développement numérique est amorcé, mais encore insuffisant pour profiter directement des applications d'IA développées actuellement pour les langues à corpus massif."


histoire éditoriale

Cet article s'adresse à un large lectorat et a été publié en ligne en accès ouvert dans la revue Lapurdum, journal du laboratoire basque IKER, sensibilisé aux problématiques des langues à corpus restreint.

Il sert de socle à un support de vulgarisation conçu par Mélanie Jouitteau et Lynda Kehli dans le cadre de DORANUM, plateforme de formation en ligne sur la gestion et le partage des données de la recherche selon les principes FAIR (Facile à trouver, Accessible, Interopérable et Réutilisable) de la science ouverte, réalisée par l'Inist-CNRS et le GIS « Réseau Urfist ».


En 2024, Eva Vetter et Lena Kratochwil à l'université de Vienne en ont produit une adaptation MOOC avec des exercices qu'elles ont traduit en anglais, allemand et espagnol.

  • CALLISTO: The basics of corpora and NLP for low-resource languages.