Différences entre les versions de « Corpus »
Ligne 80 : | Ligne 80 : | ||
: [[faits de langue Comes 1981]] | : [[faits de langue Comes 1981]] | ||
* traducteur Cosey (il semble constant sur les différents albums) | * traducteur Cosey (il semble constant sur les différents albums) | ||
: 1983. 'Hag ar menez a gano evidoc'h', Jonathan 2, Keit Vimp Beo | : 1983. 'Hag ar menez a gano evidoc'h', Jonathan 2, Keit Vimp Beo | ||
: 1983. 'Kate', Jonathan 7, Keit Vimp Beo | : 1983. 'Kate', Jonathan 7, Keit Vimp Beo | ||
:: [[faits de langue Cosey 1983]] | |||
: [[faits de langue Cosey 1983]] | |||
* traducteur Derib, 1982. ''Ar sekred'', Buddy Longway 5, Keit Vimp Beo. | * traducteur Derib, 1982. ''Ar sekred'', Buddy Longway 5, Keit Vimp Beo. | ||
:: [[faits de langue Derib 1982]] | |||
: [[faits de langue Derib | * traducteur Derib, 1982. ''An orignal'', Buddy Longway 6, Keit Vimp Beo. | ||
:: [[faits de langue Derib 1982b]] | |||
* traducteur Derib, 1983. ''An abadennou chaseal kentan'', Buddy Longway 9, Keit Vimp Beo. | * traducteur Derib, 1983. ''An abadennou chaseal kentan'', Buddy Longway 9, Keit Vimp Beo. | ||
:: [[faits de langue Derib 1983]] | |||
: [[faits de langue Derib 1983]] | |||
Version du 30 juin 2009 à 00:51
Cette page sert à référencer les différents types de corpus disponibles pour l'étude de la langue.
Corpus écrit
Il existe de très nombreux corpus écrits réalisés par des locuteurs natifs de différents dialectes. Les oeuvres pouvant servir de corpus écrit sont référencées sur ce site par auteur, dans la liste des auteurs natifs.
Outre les ouvrages créés par des locuteurs natifs, il se trouve aussi des ouvrages d'interview retranscrits de locuteurs natifs.
- Mellouet, P. & A. Pennec, Blaz an douar, le goût de la terre, Blaz an douar (ed.), Dastum Bro Leon - avec CD audio.
- interview retranscrites et traduites de paysans du Léon
- Dastum Bro Leon (ed.) 2003. Amañ 'z eus plijadur
- [Léon]
- retranscriptions de contes et joutes orales
- Madeg, Mikael, (ed.) Marvaillou, 13 volumes.
- [oral stories and autobiographies transcripts: 1, Gorre Leon; 2, Leon - Bro Bagan; 3, Goueled Leon; 5, Leon (Cléder); 8, Leon; 11, Traoñ Kerne; 13 Meneziou Kerne]
- An Uhel, Fañch (François Luzell). Kontadennou ar bobl. vol. 1. 19C.
- [surtout Treger (auteur de Plouaret)]
- [collection de contes et légendes édités]
Corpus de texte en API
Liste des corpus de texte transcris en Alphabet Phonétique International (API)
- Humphreys, H.L. 1995. Phonologie et morphosyntaxe du parler breton de Bothoa, Brest, Emglev Breizh, 430-459.
- Press, I. 1986. A Grammar of Modern Breton, Mouton, Berlin. preview
- - with English glosses -
- Wmffre, I. 1998. Central Breton. [= Languages of the World Materials 152] Unterschleißheim: Lincom Europa, 58-62.
- - with English glosses -
- Bureau, L. 1878, 'Le dialecte breton du bourg de Batz (Loire-Inférieure)', Revue Celtique III: 230-231. e-livre
- sans gloses
- ...
Corpus de transcription d'enregistrement audio
De plus en plus de corpus audios sont disponibles sous forme d'une bande son numérique avec sa transcription. Cette tendance devrait s'accélérer avec la possibilité de déposer des fichiers son sur des archives ouvertes (type CRDO).
Il existe aussi aujourd’hui de nombreux outils informatiques: des logiciels d’aide à la transcription, essentiellement orthographique (Transcriber) tantôt couplée à de l’analyse multi-modale (Transana), tantôt couplée à une analyse de la voix (Praat), des logiciels d’assistance à l’analyse quantitative et/ou qualitative (Unitex). D’autres logiciels, non spécialisés dans le traitement des données orales, sont aussi utilisables (Lexico 3, Unitext ou encore les logiciels d’étiquetage comme Tree Tagger).
- Certains fichiers son de NALBB sont consultables en ligne dans l'archive ouverte du CRDO.
- Mellouet, P. & A. Pennec, Blaz an douar, le goût de la terre, Blaz an douar (ed.), Dastum Bro Leon - avec CD audio.
- ...
- ...
Corpus dessiné
Les bandes dessinées en breton sont massivement des traductions. Les traductions fournissent des données dont il faut se méfier, car le traducteur subit l'influence de la langue source.
Les bandes dessinées sont surtout intéressantes linguistiquement car elles fournissent des informations complexes sur le cadre énonciatif sans que ces informations entrent pour autant dans l'énoncé. Cette situation rapproche le corpus dessiné de la situation orale normale par rapport à un texte en prose, où toute information doit apparaitre dans l'énoncé. (Par ailleurs, l'intérêt pédagogique de ce support attractif n'est pas à négliger).
Ci-dessous, quelques corpus dessinés ont été listés, avec un petit travail de ciblage dialectal et de relevé de faits de langue.
- traducteur Comes, 1984. ar gaerell, Casterman, Keit Vimp Beo.
- traducteur Comes, 1981. skeud ar vran, Keit Vimp Beo.
- traducteur Cosey (il semble constant sur les différents albums)
- 1983. 'Hag ar menez a gano evidoc'h', Jonathan 2, Keit Vimp Beo
- 1983. 'Kate', Jonathan 7, Keit Vimp Beo
- traducteur Derib, 1982. Ar sekred, Buddy Longway 5, Keit Vimp Beo.
- traducteur Derib, 1982. An orignal, Buddy Longway 6, Keit Vimp Beo.
- traducteur Derib, 1983. An abadennou chaseal kentan, Buddy Longway 9, Keit Vimp Beo.
- Divi Kervella 2002. Troioù-kaer Tintin: Al Lotuz Glas, An Here 2002 (éd.), traduction de Hergé. 1946. le Lotus Bleu.
- Preder 1977. Emgann ar Pennoù, Armor diffusion, traduction de le combat des chefs, Dargaud 1966.
Corpus video
- à référencer -