Duval-Guennoc (2024)

De Arbres

présentation de 14h40-15h10 - Anaouder, développement d'un outil de reconnaissance du breton oral

Gweltaz Duval-Guennoc, développeur indépendant

30 min + 10 min questions

Les systèmes de reconnaissance automatique de la parole (RAS) peuvent constituer des ressources inestimables pour la communauté bretonne, tant pour les apprenant.e.s que pour les locutrices et locuteurs compétents. Des technologies telles que la dictée par SMS sur les smartphones ou le sous-titrage automatique pourraient potentiellement améliorer l'exposition à la langue en l'incorporant dans les appareils portables de tous les jours et en équipant les créateurs de contenu de meilleurs outils.

Plusieurs initiatives notables ont été prises pour développer des modèles de synthèse vocale pour le breton (Alan Entem, Holly Montalvo BlueRacoonTech, Xavier Marjou), mais nous sommes encore loin de disposer de logiciels fiables et conviviaux pour les utilisateurs finaux. L'une de ces initiatives est Duval-Guennoc (2022-) Anaouder, qui se concentre particulièrement sur la création de solutions sur les appareils pour donner la priorité à la vie privée et à l'autonomie des utilisateurs.

Nous avons formé des modèles en utilisant le cadre Kaldi avec environ 60 heures de données audio transcrites. Ces modèles sont intégrés dans un module Python qui offre des outils en ligne de commande pour l'inférence en temps réel et en continu à partir d'un microphone ou de fichiers audio, en utilisant Vosk comme backend. Le code et les modèles sont disponibles sous une licence open-source MIT sur GitHub et PyPi.

En outre, nous avons développé une boîte à outils TAL légère basée sur des règles pour rationaliser le traitement des données textuelles et audio. Cette boîte à outils comprend des fonctions telles que la segmentation des phrases, la pré-tokénisation, la phonétisation, la normalisation du texte et la normalisation inverse. Les tâches de TAL basées sur des règles restent très pertinentes pour les langues à faibles ressources comme le breton.

Enfin, nous présentons une application de bureau qui en est à ses premiers stades de développement. Cette application vise à simplifier la création de transcriptions en breton tout en étant suffisamment polyvalente pour aider à l'alignement et à la vérification des données pour le développement de corpus texte-audio en breton.