Tyers & Ravishankar (2018)

De Arbres
Aller à : navigation, rechercher
  • Tyers, Francis M. & Vinit Ravishankar. 2018. 'A prototype dependency treebank for Breton', Actes de la conférence Traitement Automatique de la Langue Naturelle, TALN 2018, 197-204. texte.


Cet article décrit la construction d'un corpus tree-bank annoté de 10 000 tokens. Le corpus est disponible sous licence gratuite open-source.
https://github.com/UniversalDependencies/UD_Breton-KEB


 Résumé:
 "Cet article décrit le développement du premier corpus syntaxiquement annoté de breton. Le corpus fait partie du projet «Universal Dependencies». Dans cet article, nous décrivons la préparation du corpus, certaines constructions spécifiques au breton qui avaient besoin d’un traitement spécial et nous donnons des résultats de l’analyse syntaxique de breton par un nombre d’analyseurs syntaxiques.
 Berr-skrid: 
 "Deskrivañ a ra ar pennad-mañ savidigezh ar c’horpus kentañ bet notennet e ereadurezh e brezhoneg. Ul lodenn eus ar raktres «Universal Dependencies» eo ar c’horpus-se. En teuliad e teskrivomp penaos e oa bet prientet ar c’horpus ha penaos e oa bet pledet gant frammoù dibar zo eus ar brezhoneg. Ouzhpenn-se, reiñ a reomp disoc’hoù dezrannadur ereadurel ar brezhoneg gant dezrannerioù ereadurel zo."
 Abstract:
 "This paper describes the development of the first syntactically-annotated corpus of Breton. The corpus is part of the Universal Dependencies project. In the paper we describe how the corpus was prepared, some Breton-specific constructions that required special treatment, and in addition we give results for parsing Breton using a number of off-the-shelf data-driven parsers."