Différences entre les versions de « Corpus »

De Arbres
Ligne 62 : Ligne 62 :
:retranscriptions de contes et joutes orales
:retranscriptions de contes et joutes orales


* Madeg, Mikael, (éd.) [[[Madeg Marvaillou|''Marvaillou'']], 13 volumes.  
* Madeg, Mikael, (éd.) [[Madeg Marvaillou|''Marvaillou'']], 13 volumes.  
::[oral stories and autobiographies transcripts: 1, Gorre Leon; 2, Leon - Bro Bagan; 3, Goueled Leon; 5, Leon (Cléder); 8, Leon; 11, Traoñ Kerne; 13 Meneziou Kerne]
::[oral stories and autobiographies transcripts: 1, Gorre Leon; 2, Leon - Bro Bagan; 3, Goueled Leon; 5, Leon (Cléder); 8, Leon; 11, Traoñ Kerne; 13 Meneziou Kerne]
:: [[Madeg (2010)|Madeg (2010]]:136):
:: [[Madeg (2010)|Madeg (2010]]:136):
Ligne 110 : Ligne 110 :


Le fichier son du corpus oral est, à ma connaissance, inaccessible.
Le fichier son du corpus oral est, à ma connaissance, inaccessible.


== Corpus dessiné ==
== Corpus dessiné ==

Version du 18 octobre 2010 à 19:48

Cette page sert à référencer les différents types de corpus disponibles pour l'étude de la langue.


Corpus écrit

Il existe en breton de très nombreux corpus écrits réalisés par des locuteurs natifs de différents dialectes.

Ce site comprend différents outils permettant de choisir un corpus d'étude:


La liste des auteurs natifs, pour l'instant très loin d'être exhaustive, permet de chercher des corpus selon le dialecte utilisé.
Une carte de type googlemap situe différents corpus dans l'espace, ce qui permet d'appréhender la provenance des œuvres avec un visuel géographisé. Cette carte est évolutive.
La page des références de corpus recense en permanence les œuvres dont des exemples ont été utilisés jusqu'à présent sur ce site. Il est possible d'accéder à la liste de tous les exemples tirés d'une oeuvre en allant sur la page de cette référence bibliographique, puis en cliquant sur "pages liées", dans le cartouche en bas à gauche.


Corpus de texte en API

Liste des corpus de texte transcris en Alphabet Phonétique International (API)


  • Humphreys, H.L. 1995. Phonologie et morphosyntaxe du parler breton de Bothoa, Brest, Emglev Breizh, 430-459.


- with English glosses -


  • Wmffre, I. 1998. Central Breton, [= Languages of the World Materials 152] Unterschleißheim: Lincom Europa, 58-62.


- with English glosses -


  • Bureau, L. 1878, 'Le dialecte breton du bourg de Batz (Loire-Inférieure)', Revue Celtique III: 230-231. e-livre
sans gloses


  • ...


Corpus de transcription d'enregistrement audio

De plus en plus de corpus audios sont disponibles sous forme d'une bande son numérique avec sa transcription. Cette tendance devrait s'accélérer avec la possibilité de déposer des fichiers son sur des archives ouvertes (type CRDO).

Il existe aussi aujourd’hui de nombreux outils informatiques: des logiciels d’aide à la transcription, essentiellement orthographique (Transcriber) tantôt couplée à de l’analyse multi-modale (Transana), tantôt couplée à une analyse de la voix (Praat), des logiciels d’assistance à l’analyse quantitative et/ou qualitative (Unitex). D’autres logiciels, non spécialisés dans le traitement des données orales, sont aussi utilisables (Lexico 3, Unitext ou encore les logiciels d’étiquetage comme Tree Tagger).


  • Certains fichiers son de NALBB sont consultables en ligne dans l'archive ouverte du CRDO avec une transcription.
  • Per kouk met en ligne des transcriptions d'enregistrements fait par 'Kazetenn ar Menez' en 1981 sur son blog brezhoneg digor
interview retranscrites et traduites de paysans du Léon
  • Dastum Bro Leon (éd.) 2003. Amañ 'z eus plijadur
[Léon]
retranscriptions de contes et joutes orales
[oral stories and autobiographies transcripts: 1, Gorre Leon; 2, Leon - Bro Bagan; 3, Goueled Leon; 5, Leon (Cléder); 8, Leon; 11, Traoñ Kerne; 13 Meneziou Kerne]
Madeg (2010:136):
 "J'ai lancé ces collections et j'ai soit réalisé soit regroupé les 
 enregistrements. Elle consiste en 15 cassettes avec livrets de 
 transcription intégrale. La numérisation étant en cours au moment 
 où j'écris, on pourra à terme disposer de CD. 
 Chaque cassette dure environ 55 minutes."
Marvaillou 1: Gorre-Leon
13 histoires: Commana, Guimiliau, Plounéour-Menez, Landivisiau, Bodilis, Plouvorn, Lampaul-Guimiliau, Guimiliau, Plouenan, St-Pol-de-Léon, Carantec, Henvic.
Marvaillou 2: Bro-Bagan hag an arzou
huit histoires: Brignogan, Plouider, Kernilis, Guissény, Plougerneau.
Marvaillou 3: Goueled-Leon
neuf histoires: Ploudalmézeau, Plourin, Plouvien, Plounéour-Trêz, St-Divy, Landunvez, Le Drennec.
Marvaillou 4: Plougastell
sept histoires: six de Plougastel, une de St-Urbain.
Marvaillou 5: Laboused e Bro-Leon
ornithologie orale en breton de Cléder.
Marvaillou 6: Kleuziad ha kaea
28 léonards (de tout le pays) parlant de la technique de construction des talus.
Marvaillou 7: Eun tañva euz brezoneg Leon
textes coruts émanant de 34 communes réparties dans le Léon.
Marvaillou 8: Bezin e Bro-Leon
huit léonards de la côte parlant du travail de récolte du goëmon: Plouarzel, Porspoder, St-Pabu, Landéda, Kerlouan, Plouider, Plouescat, St-Pol-de-Léon.
Marvaillou 9: ?
Marvaillou 10: Kontadennou euz Bro-Gwened
Lignol, Plouay, Pluméliau, Languidic, Brec'h, Plouhinec.
Marvaillou 11: Kontadennou euz Traoñ Kerne
huit histoires en breton de Plomeur, Pont-L'Abbé, Briec, Coray, Tourc'h, Bannalec, Trégunc et Riec.
Marvaillou 12: Kontadennou euz Bro-Dreger ha Gouelo
dix histoires dont huit du Trégor: Ploulec'h, Cavan, Pleumeur-Bodou, Pleumeur Gauthier, Quimper-Guézennec, Trégonneau, et deux du Goëlo: Goudelin et Kerfot.
Marvaillou 13: Kontadennou euz Meneziou Kerne
huit histoires de haute-Cornouaille: Rosnoen, Pleyben, Plonevez du Faou, St-Hernin, Huelgoat, Poullaouen et Caniuhel.
Marvaillou 14: ?
Marvaillou 15: Blaz ar brezhoneg
trente enregistrements répartis sur toute la Bretagne.
5 en Léon, 4 en Trégor, 8 en Cornouaille, 8 en région de transition (2 en Goëlo, trois en Cornouaille et 4 en Bas-vannetais), et 4 en Haut-Vannetais (surtout maritime).


  • La revue Hor Yezh a publié quelques transcriptions de corpus oraux:
région de Douarnenez, Hor Yezh (1983)
Testeni an Itron Pensel (Hor Yezh n°126)
Testeni an Itron Ar Bihan (Hor Yezh n°130)
Testeni an Itron Kamilh Douarinou (Hor Yezh n°133)
Testeni an Aotrou Per Olier (Hor Yezh n°138 et 147)

Le fichier son du corpus oral est, à ma connaissance, inaccessible.

Corpus dessiné

Les bandes dessinées en breton sont massivement des traductions. Les traductions fournissent des données dont il faut se méfier, car le traducteur subit l'influence de la langue source.

Les bandes dessinées sont surtout intéressantes linguistiquement car elles fournissent des informations complexes sur le cadre énonciatif sans que ces informations entrent pour autant dans l'énoncé. Cette situation rapproche le corpus dessiné de la situation orale normale par rapport à un texte en prose, où toute information doit apparaitre dans l'énoncé. (Par ailleurs, l'intérêt pédagogique de ce support attractif n'est pas à négliger).

Ci-dessous, quelques corpus dessinés ont été listés, avec un petit travail de ciblage dialectal et de relevé de faits de langue.

  • traducteur Comes, 1984. ar gaerell, Casterman, Keit Vimp Beo.
faits de langue Comes 1984


  • traducteur Comes, 1981. skeud ar vran, Keit Vimp Beo.
faits de langue Comes 1981


  • traducteur Cosey (il semble constant sur les différents albums)
1983. Hag ar menez a gano evidoc'h, Jonathan 2, Keit Vimp Beo
1983. Kate, Jonathan 7, Keit Vimp Beo
faits de langue Cosey


  • traducteur Derib, 1982, 1982b: (il semble constant sur les différents albums), plausiblement du sud Cornouailles.
Ar sekred, Buddy Longway 5, Keit Vimp Beo.
faits de langue Derib 1982
An orignal, Buddy Longway 6, Keit Vimp Beo.
faits de langue Derib 1982b


  • traducteur Derib, 1983. An abadennou chaseal kentan, Buddy Longway 9, Keit Vimp Beo.
faits de langue Derib 1983


  • Divi Kervella 2002. Troioù-kaer Tintin: Al Lotuz Glas, An Here 2002 (éd.), traduction de Hergé. 1946. le Lotus Bleu.


  • Preder 1977. Emgann ar pennoù, Armor diffusion, traduction de le combat des chefs, Dargaud 1966.

Corpus video

- à référencer -