Corpus : Différence entre versions

De Arbres
Aller à : navigation, rechercher
(en ligne)
(corpus dessiné)
 
(78 révisions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
Cette page sert à référencer les différents types de corpus disponibles pour l'étude de la langue.
+
Le '''corpus''' est une des sources possibles des bases empiriques d'une grammaire.
 +
 
 +
Le corpus est un outil limité (Scheer 2013). Les points forts du corpus font aussi ses défauts: les données sont limitées ou transformées par la [[performance]] du locuteur, en opposition à sa [[compétence]], sa grammaire interne. Par définition, les corpus ne sont pas non plus à même de fournir de phrases dont les linguistes sauraient avec certitude qu'elles sont [[agrammaticales]]. Le fait de trouver ou de ne pas trouver telle ou telle phrase dans un corpus ne détermine pas son statut grammatical, car des tournures peuvent être rares à l'usage mais parfaitement formées. Dans la [[grammaire générative]], qui se donne pour but de dessiner les limites de ce qui est possible dans une langue donnée, le travail d'analyse de corpus est donc complété par le travail d'[[élicitation]], où des locuteurs se prononcent sur la grammaticalité des phrases, et sur leurs interprétations possibles.
 +
 
 +
Le corpus est aussi un outil précieux en ce qu'il confronte les linguistes avec des structures qu'il ne leur serait pas forcément venu à l'esprit de tester. Les structures apparaissent aussi en corpus dans un contexte complet à tous les niveaux: sociolinguistique, affectif, temporel, interactif, pragmatique et syntaxique.
 +
 
 +
 
 +
La qualité d'une étude de corpus tient à la qualité de choix de ce corpus, selon les besoins de l'étude. Cette page sert à référencer les différents types de corpus disponibles pour l'étude de la langue bretonne. On pourra aussi se reporter à l'article sur le [[traitement automatique des langues]] qui recence des corpus plus spécialisés sur la lecture par des algorithmes.
  
  
 
== Corpus écrit ==
 
== Corpus écrit ==
  
Il existe en breton de très nombreux corpus écrits réalisés par des locuteurs natifs de différents dialectes.
+
Il existe en breton de très nombreux corpus écrits réalisés par des locuteurs natifs de différents dialectes. Ce site comprend différents outils permettant de choisir un corpus d'étude:
  
Ce site comprend différents outils permettant de choisir un corpus d'étude:
 
  
 +
* La [[liste des auteurs natifs d'un dialecte du breton|liste des auteurs natifs]], pour l'instant très loin d'être exhaustive, permet de chercher des corpus selon le dialecte utilisé et selon si l'auteur en est natif du breton.
  
: La '''[[liste des auteurs natifs d'un dialecte du breton|liste des auteurs natifs]]''', pour l'instant très loin d'être exhaustive, permet de chercher des corpus selon le dialecte utilisé.
+
* Une [[carte]] de type googlemap situe différents corpus dans l'espace, ce qui permet d'appréhender la provenance des œuvres avec un visuel géographisé. Cette carte est évolutive.
  
: Une '''[http://makino.linguist.jussieu.fr/ARBRES/index.php/Carte carte]''' de type googlemap situe différents corpus dans l'espace, ce qui permet d'appréhender la provenance des œuvres avec un visuel géographisé. Cette carte est évolutive.
+
* La page des [[:Catégorie:Références_de_corpus|références de corpus]] recense en permanence tous les corpus dont des exemples ont été utilisés jusqu'à présent sur ce site (on en compte 399 fin 2021). A chaque référence de corpus est associée une notice bibliographique, et des renseignements sur ce corpus. Il est possible d'accéder à la liste de tous les exemples tirés d'une œuvre en allant sur la page de cette référence bibliographique, puis en cliquant sur "pages liées", dans le cartouche en bas à gauche.
  
: La page des '''[http://makino.linguist.jussieu.fr/ARBRES/index.php/Cat%C3%A9gorie:R%C3%A9f%C3%A9rences_de_corpus références de corpus]''' recense en permanence les œuvres dont des exemples ont été utilisés jusqu'à présent sur ce site. Il est possible d'accéder à la liste de tous les exemples tirés d'une oeuvre en allant sur la page de cette référence bibliographique, puis en cliquant sur "pages liées", dans le cartouche en bas à gauche.
+
* Ce site comprend enfin trois pages qui référencent les corpus suivant leur ordre chronologique: le [[vieux breton]], le [[moyen breton]], et enfin le [[breton pré-moderne]].
  
  
== Corpus de texte en API ==
+
== Parole orale ==
  
Liste des corpus de texte transcris en '''A'''lphabet '''P'''honétique '''I'''nternational (API)
+
=== texte en API ===
 +
 
 +
Liste des corpus de texte transcris en [[alphabet phonétique international]] ([[API]])
  
  
 
* [[Humphreys (1995)|Humphreys, H.L. 1995]]. ''Phonologie et morphosyntaxe du parler breton de Bothoa'', Brest, Emglev Breizh, 430-459.  
 
* [[Humphreys (1995)|Humphreys, H.L. 1995]]. ''Phonologie et morphosyntaxe du parler breton de Bothoa'', Brest, Emglev Breizh, 430-459.  
 
  
 
* [[Press (1986)|Press, I. 1986]]. ''A Grammar of Modern Breton'', Mouton, Berlin. [http://books.google.fr/books?id=SQYPenZO6SUC&printsec=frontcover&dq=breton&hl=en&sig=ACfU3U3sR-UFKtqtq0HZleq4hcsxKh6Cfw#PPR7,M1 preview]
 
* [[Press (1986)|Press, I. 1986]]. ''A Grammar of Modern Breton'', Mouton, Berlin. [http://books.google.fr/books?id=SQYPenZO6SUC&printsec=frontcover&dq=breton&hl=en&sig=ACfU3U3sR-UFKtqtq0HZleq4hcsxKh6Cfw#PPR7,M1 preview]
 
 
: ''- with English glosses -''
 
: ''- with English glosses -''
 
  
 
* [[Wmffre (1998)|Wmffre, I. 1998]]. ''Central Breton'', [= Languages of the World Materials 152] Unterschleißheim: Lincom Europa, 58-62.
 
* [[Wmffre (1998)|Wmffre, I. 1998]]. ''Central Breton'', [= Languages of the World Materials 152] Unterschleißheim: Lincom Europa, 58-62.
 
 
 
: ''- with English glosses -''
 
: ''- with English glosses -''
  
 
+
* [[Bureau (1878)|Bureau, L. 1878]]. 'Le dialecte breton du bourg de Batz (Loire-Inférieure)', [[Revue Celtique, Table des matières |''Revue Celtique'']] III, 230-231. [http://www.archive.org/stream/revueceltique00lothgoog texte].
* Bureau, L. 1878, 'Le dialecte breton du bourg de Batz (Loire-Inférieure)', [[Revue Celtique, Table des matières |''Revue Celtique'']] III: 230-231. [http://www.archive.org/stream/revueceltique00lothgoog e-livre]
 
 
 
 
: sans gloses
 
: sans gloses
 
  
 
* ...
 
* ...
  
 
+
=== transcriptions d'enregistrement audio ===
== Corpus de transcription d'enregistrement audio ==
 
 
 
  
 
De plus en plus de corpus audios sont disponibles sous forme d'une bande son numérique avec sa transcription. Cette tendance devrait s'accélérer avec la possibilité de déposer des fichiers son sur des archives ouvertes (type [http://crdo.up.univ-aix.fr/ CRDO]).
 
De plus en plus de corpus audios sont disponibles sous forme d'une bande son numérique avec sa transcription. Cette tendance devrait s'accélérer avec la possibilité de déposer des fichiers son sur des archives ouvertes (type [http://crdo.up.univ-aix.fr/ CRDO]).
Ligne 50 : Ligne 49 :
 
Il existe aussi aujourd’hui de nombreux outils informatiques: des logiciels d’aide à la transcription, essentiellement orthographique (Transcriber) tantôt couplée à de l’analyse multi-modale (Transana), tantôt couplée à une analyse de la voix (Praat), des logiciels d’assistance à l’analyse quantitative et/ou qualitative (Unitex). D’autres logiciels, non spécialisés dans le traitement des données orales, sont aussi utilisables (Lexico 3, Unitext ou encore les logiciels d’étiquetage comme Tree Tagger).
 
Il existe aussi aujourd’hui de nombreux outils informatiques: des logiciels d’aide à la transcription, essentiellement orthographique (Transcriber) tantôt couplée à de l’analyse multi-modale (Transana), tantôt couplée à une analyse de la voix (Praat), des logiciels d’assistance à l’analyse quantitative et/ou qualitative (Unitex). D’autres logiciels, non spécialisés dans le traitement des données orales, sont aussi utilisables (Lexico 3, Unitext ou encore les logiciels d’étiquetage comme Tree Tagger).
  
=== Productions universitaires ===
+
==== productions universitaires ====
 
 
* Certains [http://crdo.risc.cnrs.fr/exist/crdo/rechercher.xq?term1=*&field1=Toutes&mode1=near&langue=Breton&howmany=100 fichiers son de NALBB] sont consultables en ligne dans l'archive ouverte du CRDO avec une transcription.
 
  
 
* La revue [[Bibliographie#Revues_bretonnes_de_linguistique|Hor Yezh]] a publié quelques transcriptions de corpus oraux:
 
* La revue [[Bibliographie#Revues_bretonnes_de_linguistique|Hor Yezh]] a publié quelques transcriptions de corpus oraux:
Ligne 64 : Ligne 61 :
 
Cependant, le fichier son du corpus oral est, à ma connaissance, inaccessible.
 
Cependant, le fichier son du corpus oral est, à ma connaissance, inaccessible.
  
=== Collection 'Marvaillou', Emgleo Breiz ===
+
==== collection 'Marvaillou', Emgleo Breiz ====
  
 
* Madeg, Mikael, (éd.) [[Madeg Marvaillou|''Marvaillou'']], 13 volumes, [http://www.emgleobreiz.com/ Emgleo Breiz].  
 
* Madeg, Mikael, (éd.) [[Madeg Marvaillou|''Marvaillou'']], 13 volumes, [http://www.emgleobreiz.com/ Emgleo Breiz].  
Ligne 70 : Ligne 67 :
  
 
   [[Madeg (2010)|Madeg (2010]]:136):
 
   [[Madeg (2010)|Madeg (2010]]:136):
   "J'ai lancé ces collections et j'ai soit réalisé soit regroupé les  
+
   "J'ai lancé ces collections et j'ai soit réalisé soit regroupé les enregistrements. Elle consiste en 15 cassettes avec livrets de transcription intégrale. La numérisation étant en cours au moment où j'écris, on pourra à terme disposer de CD. Chaque cassette dure environ 55 minutes."
  enregistrements. Elle consiste en 15 cassettes avec livrets de  
 
  transcription intégrale. La numérisation étant en cours au moment  
 
  où j'écris, on pourra à terme disposer de CD.  
 
  Chaque cassette dure environ 55 minutes."
 
 
 
  
 
* ''Marvaillou 1'': ''Gorre-Leon''  
 
* ''Marvaillou 1'': ''Gorre-Leon''  
:: 13 histoires: Commana, Guimiliau, Plounéour-Menez, Landivisiau, Bodilis, Plouvorn, Lampaul-Guimiliau, Guimiliau, Plouenan, St-Pol-de-Léon, Carantec, Henvic.
+
: 13 histoires: Commana, Guimiliau, Plounéour-Menez, Landivisiau, Bodilis, Plouvorn, Lampaul-Guimiliau, Guimiliau, Plouenan, St-Pol-de-Léon, Carantec, Henvic.
 
* ''Marvaillou 2'': ''Bro-Bagan hag an arzou''  
 
* ''Marvaillou 2'': ''Bro-Bagan hag an arzou''  
:: huit histoires: Brignogan, Plouider, Kernilis, Guissény, Plougerneau.  
+
: huit histoires: Brignogan, Plouider, Kernilis, Guissény, Plougerneau.  
 
* ''Marvaillou 3'': ''Goueled-Leon''  
 
* ''Marvaillou 3'': ''Goueled-Leon''  
:: neuf histoires: Ploudalmézeau, Plourin, Plouvien, Plounéour-Trêz, St-Divy, Landunvez, Le Drennec.
+
: neuf histoires: Ploudalmézeau, Plourin, Plouvien, Plounéour-Trêz, St-Divy, Landunvez, Le Drennec.
 
* ''Marvaillou 4'': ''Plougastell''  
 
* ''Marvaillou 4'': ''Plougastell''  
:: sept histoires: six de Plougastel, une de St-Urbain.
+
: sept histoires: six de Plougastel, une de St-Urbain.
 
* ''Marvaillou 5'': ''Laboused  e Bro-Leon''  
 
* ''Marvaillou 5'': ''Laboused  e Bro-Leon''  
:: ornithologie orale en breton de Cléder.
+
: ornithologie orale en breton de Cléder.
 
* ''Marvaillou 6'': ''Kleuziad ha kaea''  
 
* ''Marvaillou 6'': ''Kleuziad ha kaea''  
:: 28 léonards (de tout le pays) parlant de la technique de construction des talus.
+
: 28 léonards (de tout le pays) parlant de la technique de construction des talus.
 
* ''Marvaillou 7'': ''Eun tañva euz brezoneg Leon''  
 
* ''Marvaillou 7'': ''Eun tañva euz brezoneg Leon''  
:: textes coruts émanant de 34 communes réparties dans le Léon.
+
: textes coruts émanant de 34 communes réparties dans le Léon.
 
* ''Marvaillou 8'': ''Bezin e Bro-Leon''  
 
* ''Marvaillou 8'': ''Bezin e Bro-Leon''  
:: huit léonards de la côte parlant du travail de récolte du goëmon: Plouarzel, Porspoder, St-Pabu, Landéda, Kerlouan, Plouider, Plouescat, St-Pol-de-Léon.
+
: huit léonards de la côte parlant du travail de récolte du goëmon: Plouarzel, Porspoder, St-Pabu, Landéda, Kerlouan, Plouider, Plouescat, St-Pol-de-Léon.
 
* ''Marvaillou 9'': ''?''  
 
* ''Marvaillou 9'': ''?''  
 
* ''Marvaillou 10'': ''Kontadennou euz Bro-Gwened''
 
* ''Marvaillou 10'': ''Kontadennou euz Bro-Gwened''
:: Lignol, Plouay, Pluméliau, Languidic, Brec'h, Plouhinec.  
+
: Lignol, Plouay, Pluméliau, Languidic, Brec'h, Plouhinec.  
 
* ''Marvaillou 11'': ''Kontadennou euz Traoñ Kerne''  
 
* ''Marvaillou 11'': ''Kontadennou euz Traoñ Kerne''  
:: huit histoires en breton de Plomeur, Pont-L'Abbé, Briec, Coray, Tourc'h, Bannalec, Trégunc et Riec.
+
: huit histoires en breton de Plomeur, Pont-L'Abbé, Briec, Coray, Tourc'h, Bannalec, Trégunc et Riec.
 
* ''Marvaillou 12'': ''Kontadennou euz Bro-Dreger ha Gouelo''  
 
* ''Marvaillou 12'': ''Kontadennou euz Bro-Dreger ha Gouelo''  
:: dix histoires dont huit du Trégor: Ploulec'h, Cavan, Pleumeur-Bodou, Pleumeur Gauthier, Quimper-Guézennec, Trégonneau, et deux du Goëlo: Goudelin et Kerfot.  
+
: dix histoires dont huit du Trégor: Ploulec'h, Cavan, Pleumeur-Bodou, Pleumeur Gauthier, Quimper-Guézennec, Trégonneau, et deux du Goëlo: Goudelin et Kerfot.  
 
* ''Marvaillou 13'': ''Kontadennou euz Meneziou Kerne''  
 
* ''Marvaillou 13'': ''Kontadennou euz Meneziou Kerne''  
:: huit histoires de haute-Cornouaille: Rosnoen, Pleyben, Plonevez du Faou, St-Hernin, Huelgoat, Poullaouen et Caniuhel.
+
: huit histoires de Haute-Cornouaille: Rosnoen, Pleyben, Plonevez du Faou, St-Hernin, Huelgoat, Poullaouen et Caniuhel.
 
* ''Marvaillou 14'': ''?''
 
* ''Marvaillou 14'': ''?''
 
*''Marvaillou 15'': ''Blaz ar brezhoneg''
 
*''Marvaillou 15'': ''Blaz ar brezhoneg''
:: trente enregistrements répartis sur toute la Bretagne.
+
: trente enregistrements répartis sur toute la Bretagne.
:: 5 en Léon, 4 en Trégor, 8 en Cornouaille, 8 en région de transition (2 en Goëlo, trois en Cornouaille et 4 en Bas-vannetais), et 4 en Haut-Vannetais (surtout maritime).
+
: 5 en Léon, 4 en Trégor, 8 en Cornouaille, 8 en région de transition (2 en Goëlo, trois en Cornouaille et 4 en Bas-vannetais), et 4 en Haut-Vannetais (surtout maritime).
  
=== Collection 'enregistrements' Emgleo Breiz ===
+
==== collection 'enregistrements' Emgleo Breiz ====
  
 
sketches et lectures de textes
 
sketches et lectures de textes
  
 
* ''Enregistrement 1'', ''Pevar skrivagner a Vro-Gerne''
 
* ''Enregistrement 1'', ''Pevar skrivagner a Vro-Gerne''
:: lus par les auteurs eux-mêmes, Charlez ar Gall (L'Hôpital-Camfrout), Youenn Brusq (Tréboul), Rémi Derrien (Nord de Quimperlé)
+
: lus par les auteurs eux-mêmes, Charlez ar Gall (L'Hôpital-Camfrout), Youenn Brusq (Tréboul), Rémi Derrien (Nord de Quimperlé)
 
* ''Enregistrement 2'', ''Eun toullad kontadennou''
 
* ''Enregistrement 2'', ''Eun toullad kontadennou''
:: Lus par Maria Prat (Lannion)
+
: Lus par Maria Prat (Lannion)
 
* ''Enregistrement 3'', ''Diwar c'hoarzin''
 
* ''Enregistrement 3'', ''Diwar c'hoarzin''
::textes du père Médard (centre Léon: Lanarvily)
+
:textes du père Médard (centre Léon: Lanarvily)
 
* ''Enregistrement 4'', ''Biskoaz kemend-all''
 
* ''Enregistrement 4'', ''Biskoaz kemend-all''
:: deux sketches radio joués de P.J. Helias (Plozévet), joués avec P. Trépos (Pouldreuzic)  
+
: deux sketches radio joués de P.J. Helias (Plozévet), joués avec P. Trépos (Pouldreuzic)  
 
* ''Enregistrement 5'', ''Rimodellou kostez Uhelgoad''
 
* ''Enregistrement 5'', ''Rimodellou kostez Uhelgoad''
:: J. M. Skragn
+
: J. M. Skragn
 
* ''Enregistrement 6'', ''En-dro da vantan Sant-Jeg''
 
* ''Enregistrement 6'', ''En-dro da vantan Sant-Jeg''
:: Sylvain Loguillard (Yvias)
+
: Sylvain Loguillard (Yvias)
  
=== Dastum ===
+
==== Dastum ====
  
==== Collection 'Komz' ====  
+
===== collection 'Komz' =====  
  
 
* K1, ''Doareoù an Ankou''
 
* K1, ''Doareoù an Ankou''
Ligne 133 : Ligne 125 :
 
:: conté par J.-L. Rolland (Trébrivan)
 
:: conté par J.-L. Rolland (Trébrivan)
 
* K3, ''C'hwec'h kontadenn eus Arvor Bro-Vigoudenn''
 
* K3, ''C'hwec'h kontadenn eus Arvor Bro-Vigoudenn''
:: contés par M. Divannac'h (Lesconil)
+
:: contés par M. Divanac'h (Lesconil)
 
* K4, ''Erwan Pier ar C'horr''
 
* K4, ''Erwan Pier ar C'horr''
 
:: 8 contes du pays Pourlet, contés par Loeiz Bevan (Lignol)
 
:: 8 contes du pays Pourlet, contés par Loeiz Bevan (Lignol)
Ligne 141 : Ligne 133 :
 
:: (Glomel, Bonel)
 
:: (Glomel, Bonel)
  
==== Journal an tri c'hanton ====
+
===== Journal an tri c'hanton =====
  
 
Cassettes audio (au moins trois numéros) enregistrées dans les années 70/80, dans les cantons de Gourin, Le Faouet et Guemene.
 
Cassettes audio (au moins trois numéros) enregistrées dans les années 70/80, dans les cantons de Gourin, Le Faouet et Guemene.
  
casette 1: RUMMAD TCHOU 1 – miz EOST  
+
cassette 1: RUMMAD TCHOU 1 – miz EOST  
  
 
   Langonned gwechall - Laerien kezeg - Konskriou Gourin
 
   Langonned gwechall - Laerien kezeg - Konskriou Gourin
Ligne 157 : Ligne 149 :
  
  
casette 2: RUMMAD TCHOU 2  - bloavezh mat
+
cassette 2: RUMMAD TCHOU 2  - bloavezh mat
  
 
   Ton da zañsal
 
   Ton da zañsal
Ligne 168 : Ligne 160 :
 
   Ton da zansal
 
   Ton da zansal
  
==== Keloù bro Dardoup ====
+
===== Keloù bro Dardoup =====
 
 
* K7 enregistrée dans les années 70/80
 
  
 +
* cassette audio enregistrée dans les années 70/80
  
==== autres ====
+
===== autres =====
  
 
* Dastum Bro Leon (éd.) ''O! Kement-se! Istorioù farsus''
 
* Dastum Bro Leon (éd.) ''O! Kement-se! Istorioù farsus''
:: 3CD d'histoires en breton du Léon
+
: 3CD d'histoires en breton du Léon
:: transcriptions disponibles auprès de Dastum Bro-Leon (Lesneven).
+
: transcriptions disponibles auprès de Dastum Bro-Leon (Lesneven).
  
 
* Dastum Bro Leon (éd.) 2003. ''Amañ 'z eus plijadur''  
 
* Dastum Bro Leon (éd.) 2003. ''Amañ 'z eus plijadur''  
:: contes et joutes orales (Léon), avec transcriptions.  
+
: contes et joutes orales (Léon), avec transcriptions.
 +
:: utilisé comme corpus dans [[Rezac (2009)]].
  
 
* Dastum Bro Leon (éd.) ''Peñse Bro-Leon''
 
* Dastum Bro Leon (éd.) ''Peñse Bro-Leon''
:: 30 anecdotes par 18 léonards de la côte, surtout du Bas-Léon (de Plougonvelin à Goulven) et 4 du Haut-Léon (de Plouescat à Carantec), avec transcriptions.  
+
: 30 anecdotes par 18 léonards de la côte, surtout du Bas-Léon (de Plougonvelin à Goulven) et 4 du Haut-Léon (de Plouescat à Carantec), avec transcriptions.  
  
 
* ''Kontadennoù Marsel Guilloux'' (Lanrivain), Radio Kreiz-Breizh.
 
* ''Kontadennoù Marsel Guilloux'' (Lanrivain), Radio Kreiz-Breizh.
:: sans livret de retranscription
+
: sans livret de retranscription
  
 
* Dastum Bro-Dreger (éd.) ''Encyclopédie sonore du Trégor-Goelo'', Lannion, Dastum Bro-Dreger
 
* Dastum Bro-Dreger (éd.) ''Encyclopédie sonore du Trégor-Goelo'', Lannion, Dastum Bro-Dreger
:: sans livret de retranscription
+
: sans livret de retranscription
  
 
* TES (éd.) 2008. ''A-hed ar c'hantved'',  Sant-Brieg.
 
* TES (éd.) 2008. ''A-hed ar c'hantved'',  Sant-Brieg.
:: DVD 4: 'Treger-Goueloù'
+
: DVD 4: 'Treger-Goueloù'
 +
 
 +
==== autres transcriptions ====
  
=== autres transcriptions ===
+
* Gurvan Lozac'h met en ligne des enregistrements fait par 'Kazetenn ar Menez' en 1981, mais également ses propres enregistrements, qu'il transcrit par la suite. À lire et écouter sur son blog ''[http://brezhoneg-digor.blogspot.com/ brezhoneg digor]''.
  
* Per Kouk met en ligne des enregistrements fait par 'Kazetenn ar Menez' en 1981, mais également ses propres enregistrements, qu'il transcrit par la suite. À lire et écouter sur son blog [http://brezhoneg-digor.blogspot.com/ brezhoneg digor]
+
* Axel Landeau met en ligne des [https://komzeras.blogspot.fr/2017/11/ discussions en dialecte] du pays Fañch (Est Cornouaille: Ploneve, Rostrenn, Laruen, Laniskat, Zin Trevin, Tremargat, Pluzian). Il les retranscrit en orthographe dialectale et contruit un [https://komzeras.blogspot.fr/p/leksik-bro-vanch.html lexique en ligne].
  
* recueil d'interview retranscrites et traduites de paysans du Léon
+
* recueil d'interviews retranscrites et traduites de paysans du Léon
 
: [[Mellouet & Pennec (2004)|Mellouet, P. & A. Pennec. 2004]]. ''Blaz an douar, le goût de la terre'', Blaz an douar (éd.), Dastum Bro Leon - avec CD audio.
 
: [[Mellouet & Pennec (2004)|Mellouet, P. & A. Pennec. 2004]]. ''Blaz an douar, le goût de la terre'', Blaz an douar (éd.), Dastum Bro Leon - avec CD audio.
  
 
* En annexe de [[Humphreys (1995)]], on trouve la transcription phonétique traduite d'un enregistrement de ''Kazetenn ar Vro Plinn'', 11 (1979). François le Provost y est interviewé par René Richard.
 
* En annexe de [[Humphreys (1995)]], on trouve la transcription phonétique traduite d'un enregistrement de ''Kazetenn ar Vro Plinn'', 11 (1979). François le Provost y est interviewé par René Richard.
 +
: Les disques de [http://mediatheque.dastum.net/Record.htm?idlist=30&record=19284399124910025719 kazetenn ar Vro Plinn] sont listés sur le site de Dastum.
 +
 +
* [[Cheveau & Kersulec (2012-évolutif)|Cheveau, Loïc & Pierre-Yves Kersulec]]. 2012-évolutif. ''[http://dico.parlant.breton.free.fr/ Dictionnaires bretons parlants]''.
 +
: Ensemble de dictionnaires de parlers locaux disponibles en ligne.
 +
: Les fichiers audio ou même vidéo sont retranscrits en [[API]], en orthographe locale et standard et traduits en français.
 +
 +
* [[Yekel, Georgelin & Ar C'hozh (2015-2018)]]. ''[http://brezhonegbrovear.bzh/index.php Brezhoneg Bro-Vear]'', Blog kevredigezh ''Hent don''.
 +
: petits articles thématiques sur des points du breton de Bégard, illustrés d'exemples dont certains sont retranscrits et/ou écoutables en ligne.
 +
: les descriptions sont rassemblées à partir d'un corpus audio réalisé en enregistrant des locuteurs et locutrices natives du pays de Bégard, la plupart nés dans les années 1910/1920.
  
== Corpus audio numérisé non-transcrit ==
+
=== audio numérisé non-transcrit ===
  
=== Dastum ===
+
==== Dastum ====
  
==== en ligne ====
+
===== en ligne =====
  
 
Les enquêtes ethno-linguistiques de ''Spered ar Yezh'' sont écoutables en ligne:
 
Les enquêtes ethno-linguistiques de ''Spered ar Yezh'' sont écoutables en ligne:
Ligne 217 : Ligne 220 :
 
: Benjamin Texier-Pauton : [http://mediatheque.dastum.net/Record.htm?idlist=6&record=19218099124910362719 enquêtes]
 
: Benjamin Texier-Pauton : [http://mediatheque.dastum.net/Record.htm?idlist=6&record=19218099124910362719 enquêtes]
  
=== radios ===
+
==== radios ====
  
 
Toutes les radios en breton ont maintenant des fichiers numérisés des interviews conduites. Il n'existe cependant pas de classement permettant de trouver un enregistrement de locuteur natif.
 
Toutes les radios en breton ont maintenant des fichiers numérisés des interviews conduites. Il n'existe cependant pas de classement permettant de trouver un enregistrement de locuteur natif.
  
 +
== Corpus gestuel ==
 +
 +
La gestuelle associée à une langue enrichit les informations orales dans la dimension expressive, mais aussi parfois strictement lexicale ou grammmaticale (cf. [[gestes grammaticaux]]). L'étude de cette dimension du langage parlé peut se faire sur corpus.
  
== Corpus dessiné ==
 
  
Les bandes dessinées en breton sont massivement des traductions. Les traductions fournissent des données dont il faut se méfier, car le traducteur, même lorsqu'il est natif de la langue, subit l'influence de la langue source.
+
=== corpus dessiné ===
 +
 
 +
Les bandes dessinées en breton sont la plupart du temps des traductions. Les traductions fournissent des données dont il faut se méfier, car le traducteur, même lorsqu'il est natif de la langue, subit l'influence de la langue source.
 +
 
 +
L'intérêt pédagogique de ce support attractif n'est pas à négliger, mais les bandes dessinées sont aussi particulièrement intéressantes linguistiquement. Comme la parole en situation réelle, la parole en corpus dessiné fournit des informations complexes sur le [[cadre énonciatif]] (gestes, espace, temps) sans que ces informations entrent pour autant dans l'énoncé. Le style qui favorise les traits d'oralité regorgent aussi souvent d'effets de la [[morphologie expressive]] ([[interjections]], [[réduplications]], etc.). Le ciblage dialectal est parfois délicat lorsque ces corpus sont des traductions dont le, la ou les traducteurs ne sont pas identifiés dans la publication.
  
Les bandes dessinées sont surtout intéressantes linguistiquement en ce qu'elles fournissent des informations complexes sur le cadre énonciatif sans que ces informations entrent pour autant dans l'énoncé. Par rapport à un texte en prose, cette situation rapproche le corpus dessiné de la situation orale normale, où toute information doit apparaitre dans l'énoncé.
 
(Par ailleurs, l'intérêt pédagogique de ce support attractif n'est pas à négliger).
 
  
 
Ci-dessous, quelques corpus dessinés ont été listés, avec un petit travail de ciblage dialectal et de relevé de faits de langue.
 
Ci-dessous, quelques corpus dessinés ont été listés, avec un petit travail de ciblage dialectal et de relevé de faits de langue.
  
* traducteur Comes, 1984. ''ar gaerell'', Casterman, Keit Vimp Beo.
+
* [[Biguet (2017)|Biguet, Olier. 2017]]. ''Tintin en Amerika'', traduction de ''Tintin en Amérique'', Hergé, Casterman.
  
: [[faits de langue Comes 1984]]
+
* [[Ar Menn (2015)|Ar Menn, Brieg. 2015]]. ''Ar pevar gringo Dalton'', BZH5 (éd.), traduction de ''Tortillas pour les Dalton'', Morris, Goscinny. 1967.
 +
 
 +
* [[Bzh5 (2007)|Bzh5. 2007]]. ''Ar pevar Sant Dalton'', traduction de Goscinny & Morris. ''Les Dalton se rachètent'', Dargaud éditeur, 1971.
 +
 
 +
* [[Monfort (2007)|Monfort, Alan. 2007]]. ''Gaston'' 10, Yoran Embanner, traduction de ''Gaston'' 10, copyright Marsu 2007 par Franquin-Dupuis.
 +
 
 +
* [[Kervella (2006)|Kervella, Divi. 2006]]. ''Ar c'hazh e Breizh'', traduction de ''Le chat est content'' de Philippe Geluck, 2000. Casterman.
 +
 
 +
* [[Monfort (2006)|Monfort, Alan. 2006]]. ''Gaston 14'', traduction d'extraits de quatre albums de ''Gaston Lagaffe'' par Franquin - Dupuis, publié par Yoran Embanner.
 +
 
 +
* [[An Here (2003)|An Here. 2003]]. ''Nij 714 da Sydney'', traduction de ''Vol 714 pour Sydney'', Hergé, Casterman 1963.
 +
 
 +
* [[Kervella (2002b)|Kervella, Divi. 2002b]]. ''Troioù-kaer Tintin: An Enez du'', An Here (éd.), traduction en breton standard de Hergé. 1963. ''L'île noire'', Casterman.
 +
 
 +
* [[Kervella (2002)|Kervella, Divi. 2002]]. ''Troioù-kaer Tintin: [[Al Lotuz Glas]]'', An Here (éd.), traduction en breton standard de Hergé. 1946. ''Le Lotus Bleu'', Casterman.
 +
 
 +
* [[Kervella (2001)|Kervella, Divi 2001]]. ''Troioù-kaer Tintin: Bravigoù ar Gastafiorenn'', An Here (éd)., traduction en breton standard de Hergé (1963) ''Les bijoux de la castafiore'', Casterman.
  
 +
* [[Bannoù-Heol (2000)|Bannoù-Heol. 2000]]. ''Sell 'ta !, Boulig ha Billig'', traduction de Roba 1988. ''22! V'là Boule et Bill !'', Roba SPRL, 1988, Dargaud 1988.
  
* traducteur Comes, 1981. ''skeud ar vran'', Keit Vimp Beo.
+
* [[Le Saëc (1990)|Le Saëc, Erwan. 1990]]. ''Ar skarzherien'', Keit Vimp Bev.
  
: [[faits de langue Comes 1981]]
+
* [[Keit Vimp Bev (1984)|Keit Vimp Bev. 1984]]. ''Yahkari hag an estranjour'', traduction de Derib & Job. ''Yakari et l'étranger'', Casterman, 1982.
  
 +
* traducteur Comes, 1984. ''Ar gaerell'', Casterman, Keit Vimp Beo.
 +
: [[faits de langue Comes 1984]]
  
 
* traducteur Cosey (il semble à peu près constant sur les différents albums)
 
* traducteur Cosey (il semble à peu près constant sur les différents albums)
Ligne 246 : Ligne 272 :
 
:: [[faits de langue Cosey]]
 
:: [[faits de langue Cosey]]
  
 +
* traducteur Derib, 1983. ''An abadennou chaseal kentan'', Buddy Longway 9, Keit Vimp Beo.
 +
:: [[faits de langue Derib 1983]]
  
 
* traducteur Derib, 1982, 1982b: (il semble constant sur les différents albums), plausiblement du sud Cornouaille.
 
* traducteur Derib, 1982, 1982b: (il semble constant sur les différents albums), plausiblement du sud Cornouaille.
 
 
: ''Ar sekred'', Buddy Longway 5, Keit Vimp Beo.
 
: ''Ar sekred'', Buddy Longway 5, Keit Vimp Beo.
 
:: [[faits de langue Derib 1982]]
 
:: [[faits de langue Derib 1982]]
 
 
: ''An orignal'', Buddy Longway 6, Keit Vimp Beo.
 
: ''An orignal'', Buddy Longway 6, Keit Vimp Beo.
 
:: [[faits de langue Derib 1982b]]  
 
:: [[faits de langue Derib 1982b]]  
  
 +
* traducteur Comes, 1981. ''Skeud ar vran'', Keit Vimp Beo.
 +
: [[faits de langue Comes 1981]]
 +
 +
* [[Moulleg (1978)|Moulleg, Loeiz. 1978]]. ''An Ankou, troioù-kaer Spirou ha fantasio'', traduction de Fournier, éditions Dupuis 1976.
  
* traducteur Derib, 1983. ''An abadennou chaseal kentan'', Buddy Longway 9, Keit Vimp Beo.
+
* [[Preder & Armor (1977)|Preder & Armor. 1977]]. ''Emgann ar Pennoù'', Preder (éd.), Armor diffusion, traduction de ''Le combat des chefs'', Dargaud éditeur, 1966.
:: [[faits de langue Derib 1983]]
 
  
 +
=== corpus vidéo ===
  
* Divi Kervella 2002. ''Troioù-kaer Tintin: [[Al Lotuz Glas]]'', An Here 2002 (éd.), traduction de Hergé. 1946. ''le Lotus Bleu''.
+
==== films de l'INA ====
  
 +
* Des films courts et reportages en breton sont disponibles en ligne sur le site de l'INA (avec des transcriptions).
 +
: [http://www.ina.fr/fresques/ouest-en-memoire/liste/recherche/Langue/ll/bre#1-9-date-desc L'ouest en mémoire]
  
* [[Uderzo & Goscinny (1977)|Uderzo & Goscinny 1977]]. ''Emgann ar Pennoù'', Preder (ed.), Armor diffusion, traduction de "le combat des chefs", Dargaud 1966.
 
  
== Corpus video ==
+
==== Dizale ====
  
L'association [http://www.dizale.org/ Dizale] réalise des DVDs en langue bretonne.
+
L'association Dizale réalise des DVDs en langue bretonne. Catalogue complet et accessibilité des corpus sur le site [http://www.breizhvod.com/degemer.html breizhvod].
  
 
* 2009. ''Marc'h al lorc'h''
 
* 2009. ''Marc'h al lorc'h''
Ligne 273 : Ligne 304 :
 
   
 
   
 
* 2008. ''Columbo''
 
* 2008. ''Columbo''
:: Voix de Tangui Daniel pour Columbo
+
:: Voix de Tangi Daniel pour Columbo
  
 
* 2006. ''An Afer Sezneg''
 
* 2006. ''An Afer Sezneg''
::Voix de : Goulwen an Henaff, Corinne ar Mero, Keridwenn ar Mero, Erell Beloni, Klet Beyer, Aziliz Bourges, Mona Bouzeg, Sten Charbonneau, Loic de Chateaubriand, Louis Conan, Tangi Daniel, Remi Derrien, Dom Duff,...  
+
::Voix de : Goulwena an Henaff, Corinne ar Mero, Keridwenn ar Mero, Erell Beloni, Klet Beyer, Aziliz Bourges, Mona Bouzeg, Sten Charbonneau, Loic de Chateaubriand, Louis Conan, Tangi Daniel, Remi Derrien, Dom Duff,...
 +
 
 +
 
 +
=== chaines utube ===
 +
 
 +
* ''brezhoneg digor'', gant Gurvan Lozac'h
 +
 
 +
= Bibliographie =
  
 +
* Scheer, Tobias. 2013. '[http://corela.edel.univ-poitiers.fr/index.php?id=2952 The Corpus: A Tool among Others]', Laurence Vincent-Durroux et Philip Carr (dir.), ''Statut et utilisation des corpus en linguistique'', [http://corela.edel.univ-poitiers.fr/index.php?id=2950 Corela].
  
  
 
[[Category:ressources|Categories]]
 
[[Category:ressources|Categories]]

Version actuelle datée du 20 janvier 2022 à 15:27

Le corpus est une des sources possibles des bases empiriques d'une grammaire.

Le corpus est un outil limité (Scheer 2013). Les points forts du corpus font aussi ses défauts: les données sont limitées ou transformées par la performance du locuteur, en opposition à sa compétence, sa grammaire interne. Par définition, les corpus ne sont pas non plus à même de fournir de phrases dont les linguistes sauraient avec certitude qu'elles sont agrammaticales. Le fait de trouver ou de ne pas trouver telle ou telle phrase dans un corpus ne détermine pas son statut grammatical, car des tournures peuvent être rares à l'usage mais parfaitement formées. Dans la grammaire générative, qui se donne pour but de dessiner les limites de ce qui est possible dans une langue donnée, le travail d'analyse de corpus est donc complété par le travail d'élicitation, où des locuteurs se prononcent sur la grammaticalité des phrases, et sur leurs interprétations possibles.

Le corpus est aussi un outil précieux en ce qu'il confronte les linguistes avec des structures qu'il ne leur serait pas forcément venu à l'esprit de tester. Les structures apparaissent aussi en corpus dans un contexte complet à tous les niveaux: sociolinguistique, affectif, temporel, interactif, pragmatique et syntaxique.


La qualité d'une étude de corpus tient à la qualité de choix de ce corpus, selon les besoins de l'étude. Cette page sert à référencer les différents types de corpus disponibles pour l'étude de la langue bretonne. On pourra aussi se reporter à l'article sur le traitement automatique des langues qui recence des corpus plus spécialisés sur la lecture par des algorithmes.


Corpus écrit

Il existe en breton de très nombreux corpus écrits réalisés par des locuteurs natifs de différents dialectes. Ce site comprend différents outils permettant de choisir un corpus d'étude:


  • La liste des auteurs natifs, pour l'instant très loin d'être exhaustive, permet de chercher des corpus selon le dialecte utilisé et selon si l'auteur en est natif du breton.
  • Une carte de type googlemap situe différents corpus dans l'espace, ce qui permet d'appréhender la provenance des œuvres avec un visuel géographisé. Cette carte est évolutive.
  • La page des références de corpus recense en permanence tous les corpus dont des exemples ont été utilisés jusqu'à présent sur ce site (on en compte 399 fin 2021). A chaque référence de corpus est associée une notice bibliographique, et des renseignements sur ce corpus. Il est possible d'accéder à la liste de tous les exemples tirés d'une œuvre en allant sur la page de cette référence bibliographique, puis en cliquant sur "pages liées", dans le cartouche en bas à gauche.


Parole orale

texte en API

Liste des corpus de texte transcris en alphabet phonétique international (API)


  • Humphreys, H.L. 1995. Phonologie et morphosyntaxe du parler breton de Bothoa, Brest, Emglev Breizh, 430-459.
- with English glosses -
  • Wmffre, I. 1998. Central Breton, [= Languages of the World Materials 152] Unterschleißheim: Lincom Europa, 58-62.
- with English glosses -
sans gloses
  • ...

transcriptions d'enregistrement audio

De plus en plus de corpus audios sont disponibles sous forme d'une bande son numérique avec sa transcription. Cette tendance devrait s'accélérer avec la possibilité de déposer des fichiers son sur des archives ouvertes (type CRDO).

Il existe aussi aujourd’hui de nombreux outils informatiques: des logiciels d’aide à la transcription, essentiellement orthographique (Transcriber) tantôt couplée à de l’analyse multi-modale (Transana), tantôt couplée à une analyse de la voix (Praat), des logiciels d’assistance à l’analyse quantitative et/ou qualitative (Unitex). D’autres logiciels, non spécialisés dans le traitement des données orales, sont aussi utilisables (Lexico 3, Unitext ou encore les logiciels d’étiquetage comme Tree Tagger).

productions universitaires

  • La revue Hor Yezh a publié quelques transcriptions de corpus oraux:
région de Douarnenez, Hor Yezh (1983)
Kemener, Y. F. 1979. 'Testeni Itron Pensel', Hor Yezh 126, 47-73.
Testeni an Itron Ar Bihan (Hor Yezh 130)
Testeni an Itron Kamilh Douarinou (Hor Yezh 133)
Testeni an Aotrou Per Olier (Hor Yezh 138 et 147)

Cependant, le fichier son du corpus oral est, à ma connaissance, inaccessible.

collection 'Marvaillou', Emgleo Breiz


 Madeg (2010:136):
 "J'ai lancé ces collections et j'ai soit réalisé soit regroupé les enregistrements. Elle consiste en 15 cassettes avec livrets de transcription intégrale. La numérisation étant en cours au moment où j'écris, on pourra à terme disposer de CD. Chaque cassette dure environ 55 minutes."
  • Marvaillou 1: Gorre-Leon
13 histoires: Commana, Guimiliau, Plounéour-Menez, Landivisiau, Bodilis, Plouvorn, Lampaul-Guimiliau, Guimiliau, Plouenan, St-Pol-de-Léon, Carantec, Henvic.
  • Marvaillou 2: Bro-Bagan hag an arzou
huit histoires: Brignogan, Plouider, Kernilis, Guissény, Plougerneau.
  • Marvaillou 3: Goueled-Leon
neuf histoires: Ploudalmézeau, Plourin, Plouvien, Plounéour-Trêz, St-Divy, Landunvez, Le Drennec.
  • Marvaillou 4: Plougastell
sept histoires: six de Plougastel, une de St-Urbain.
  • Marvaillou 5: Laboused e Bro-Leon
ornithologie orale en breton de Cléder.
  • Marvaillou 6: Kleuziad ha kaea
28 léonards (de tout le pays) parlant de la technique de construction des talus.
  • Marvaillou 7: Eun tañva euz brezoneg Leon
textes coruts émanant de 34 communes réparties dans le Léon.
  • Marvaillou 8: Bezin e Bro-Leon
huit léonards de la côte parlant du travail de récolte du goëmon: Plouarzel, Porspoder, St-Pabu, Landéda, Kerlouan, Plouider, Plouescat, St-Pol-de-Léon.
  • Marvaillou 9: ?
  • Marvaillou 10: Kontadennou euz Bro-Gwened
Lignol, Plouay, Pluméliau, Languidic, Brec'h, Plouhinec.
  • Marvaillou 11: Kontadennou euz Traoñ Kerne
huit histoires en breton de Plomeur, Pont-L'Abbé, Briec, Coray, Tourc'h, Bannalec, Trégunc et Riec.
  • Marvaillou 12: Kontadennou euz Bro-Dreger ha Gouelo
dix histoires dont huit du Trégor: Ploulec'h, Cavan, Pleumeur-Bodou, Pleumeur Gauthier, Quimper-Guézennec, Trégonneau, et deux du Goëlo: Goudelin et Kerfot.
  • Marvaillou 13: Kontadennou euz Meneziou Kerne
huit histoires de Haute-Cornouaille: Rosnoen, Pleyben, Plonevez du Faou, St-Hernin, Huelgoat, Poullaouen et Caniuhel.
  • Marvaillou 14: ?
  • Marvaillou 15: Blaz ar brezhoneg
trente enregistrements répartis sur toute la Bretagne.
5 en Léon, 4 en Trégor, 8 en Cornouaille, 8 en région de transition (2 en Goëlo, trois en Cornouaille et 4 en Bas-vannetais), et 4 en Haut-Vannetais (surtout maritime).

collection 'enregistrements' Emgleo Breiz

sketches et lectures de textes

  • Enregistrement 1, Pevar skrivagner a Vro-Gerne
lus par les auteurs eux-mêmes, Charlez ar Gall (L'Hôpital-Camfrout), Youenn Brusq (Tréboul), Rémi Derrien (Nord de Quimperlé)
  • Enregistrement 2, Eun toullad kontadennou
Lus par Maria Prat (Lannion)
  • Enregistrement 3, Diwar c'hoarzin
textes du père Médard (centre Léon: Lanarvily)
  • Enregistrement 4, Biskoaz kemend-all
deux sketches radio joués de P.J. Helias (Plozévet), joués avec P. Trépos (Pouldreuzic)
  • Enregistrement 5, Rimodellou kostez Uhelgoad
J. M. Skragn
  • Enregistrement 6, En-dro da vantan Sant-Jeg
Sylvain Loguillard (Yvias)

Dastum

collection 'Komz'
  • K1, Doareoù an Ankou
30 anecdotes en breton du Léon et Cornouaille finistérienne de l'Ouest.
  • K2, Margodig an Dour Yen
conté par J.-L. Rolland (Trébrivan)
  • K3, C'hwec'h kontadenn eus Arvor Bro-Vigoudenn
contés par M. Divanac'h (Lesconil)
  • K4, Erwan Pier ar C'horr
8 contes du pays Pourlet, contés par Loeiz Bevan (Lignol)
  • K5, Ret vije deoc'h bezañ gwelet
13 histoires en breton du Trégor (Trémel, Rospez, Plestin, Ploubezre, Pleumeur-Gauthier, Lannion)
  • K6, Kontadennoù Groñvel
(Glomel, Bonel)
Journal an tri c'hanton

Cassettes audio (au moins trois numéros) enregistrées dans les années 70/80, dans les cantons de Gourin, Le Faouet et Guemene.

cassette 1: RUMMAD TCHOU 1 – miz EOST

 Langonned gwechall - Laerien kezeg - Konskriou Gourin
 Dime kentañ Marie - Bleidi ba Kermadou - Zon ga Joseph ha Jaffray
 Tenno pato ba Beloriant- Ton da zañsal- Teir zon - Kontenn Yann
 Petra oa digoueet ga Joseph hont da gas e vestrez d’ar ger
 Daou don da dañsal - Dansal doc’h zul
 
 Marie Goujard et Joseph Auffret
 musiciens : L.M. CARIO, C. DERRIEN, D. LE CRAS, D. POULERIGUEN, G. POUPON, J.Y. SIBERIL


cassette 2: RUMMAD TCHOU 2 - bloavezh mat

 Ton da zañsal
 Yves ha Mari Guern, Langonned
 Joseph Auffret, Gourin
 Yves Bris ha Marcel Guillou, Roudouallec
 Marie Kerdaffre, Ar Zent
 M. Guillou, Lanruon
 Louis Guern, maer Lanvenegen
 Ton da zansal
Keloù bro Dardoup
  • cassette audio enregistrée dans les années 70/80
autres
  • Dastum Bro Leon (éd.) O! Kement-se! Istorioù farsus
3CD d'histoires en breton du Léon
transcriptions disponibles auprès de Dastum Bro-Leon (Lesneven).
  • Dastum Bro Leon (éd.) 2003. Amañ 'z eus plijadur
contes et joutes orales (Léon), avec transcriptions.
utilisé comme corpus dans Rezac (2009).
  • Dastum Bro Leon (éd.) Peñse Bro-Leon
30 anecdotes par 18 léonards de la côte, surtout du Bas-Léon (de Plougonvelin à Goulven) et 4 du Haut-Léon (de Plouescat à Carantec), avec transcriptions.
  • Kontadennoù Marsel Guilloux (Lanrivain), Radio Kreiz-Breizh.
sans livret de retranscription
  • Dastum Bro-Dreger (éd.) Encyclopédie sonore du Trégor-Goelo, Lannion, Dastum Bro-Dreger
sans livret de retranscription
  • TES (éd.) 2008. A-hed ar c'hantved, Sant-Brieg.
DVD 4: 'Treger-Goueloù'

autres transcriptions

  • Gurvan Lozac'h met en ligne des enregistrements fait par 'Kazetenn ar Menez' en 1981, mais également ses propres enregistrements, qu'il transcrit par la suite. À lire et écouter sur son blog brezhoneg digor.
  • Axel Landeau met en ligne des discussions en dialecte du pays Fañch (Est Cornouaille: Ploneve, Rostrenn, Laruen, Laniskat, Zin Trevin, Tremargat, Pluzian). Il les retranscrit en orthographe dialectale et contruit un lexique en ligne.
  • recueil d'interviews retranscrites et traduites de paysans du Léon
Mellouet, P. & A. Pennec. 2004. Blaz an douar, le goût de la terre, Blaz an douar (éd.), Dastum Bro Leon - avec CD audio.
  • En annexe de Humphreys (1995), on trouve la transcription phonétique traduite d'un enregistrement de Kazetenn ar Vro Plinn, 11 (1979). François le Provost y est interviewé par René Richard.
Les disques de kazetenn ar Vro Plinn sont listés sur le site de Dastum.
Ensemble de dictionnaires de parlers locaux disponibles en ligne.
Les fichiers audio ou même vidéo sont retranscrits en API, en orthographe locale et standard et traduits en français.
petits articles thématiques sur des points du breton de Bégard, illustrés d'exemples dont certains sont retranscrits et/ou écoutables en ligne.
les descriptions sont rassemblées à partir d'un corpus audio réalisé en enregistrant des locuteurs et locutrices natives du pays de Bégard, la plupart nés dans les années 1910/1920.

audio numérisé non-transcrit

Dastum

en ligne

Les enquêtes ethno-linguistiques de Spered ar Yezh sont écoutables en ligne:

Christiane Fer : enquêtes.
Marie-Laure Groix : enquêtes
Eflamm Le Cornec : enquêtes
Anna Jouin : enquêtes
Natacha Le Floc'h : enquêtes (mais plusieurs locuteurs y parlent en même temps).
Benjamin Texier-Pauton : enquêtes

radios

Toutes les radios en breton ont maintenant des fichiers numérisés des interviews conduites. Il n'existe cependant pas de classement permettant de trouver un enregistrement de locuteur natif.

Corpus gestuel

La gestuelle associée à une langue enrichit les informations orales dans la dimension expressive, mais aussi parfois strictement lexicale ou grammmaticale (cf. gestes grammaticaux). L'étude de cette dimension du langage parlé peut se faire sur corpus.


corpus dessiné

Les bandes dessinées en breton sont la plupart du temps des traductions. Les traductions fournissent des données dont il faut se méfier, car le traducteur, même lorsqu'il est natif de la langue, subit l'influence de la langue source.

L'intérêt pédagogique de ce support attractif n'est pas à négliger, mais les bandes dessinées sont aussi particulièrement intéressantes linguistiquement. Comme la parole en situation réelle, la parole en corpus dessiné fournit des informations complexes sur le cadre énonciatif (gestes, espace, temps) sans que ces informations entrent pour autant dans l'énoncé. Le style qui favorise les traits d'oralité regorgent aussi souvent d'effets de la morphologie expressive (interjections, réduplications, etc.). Le ciblage dialectal est parfois délicat lorsque ces corpus sont des traductions dont le, la ou les traducteurs ne sont pas identifiés dans la publication.


Ci-dessous, quelques corpus dessinés ont été listés, avec un petit travail de ciblage dialectal et de relevé de faits de langue.

  • Ar Menn, Brieg. 2015. Ar pevar gringo Dalton, BZH5 (éd.), traduction de Tortillas pour les Dalton, Morris, Goscinny. 1967.
  • Bzh5. 2007. Ar pevar Sant Dalton, traduction de Goscinny & Morris. Les Dalton se rachètent, Dargaud éditeur, 1971.
  • Monfort, Alan. 2007. Gaston 10, Yoran Embanner, traduction de Gaston 10, copyright Marsu 2007 par Franquin-Dupuis.
  • Kervella, Divi. 2006. Ar c'hazh e Breizh, traduction de Le chat est content de Philippe Geluck, 2000. Casterman.
  • Monfort, Alan. 2006. Gaston 14, traduction d'extraits de quatre albums de Gaston Lagaffe par Franquin - Dupuis, publié par Yoran Embanner.
  • An Here. 2003. Nij 714 da Sydney, traduction de Vol 714 pour Sydney, Hergé, Casterman 1963.
  • Kervella, Divi. 2002b. Troioù-kaer Tintin: An Enez du, An Here (éd.), traduction en breton standard de Hergé. 1963. L'île noire, Casterman.
  • Kervella, Divi 2001. Troioù-kaer Tintin: Bravigoù ar Gastafiorenn, An Here (éd)., traduction en breton standard de Hergé (1963) Les bijoux de la castafiore, Casterman.
  • Bannoù-Heol. 2000. Sell 'ta !, Boulig ha Billig, traduction de Roba 1988. 22! V'là Boule et Bill !, Roba SPRL, 1988, Dargaud 1988.
  • Keit Vimp Bev. 1984. Yahkari hag an estranjour, traduction de Derib & Job. Yakari et l'étranger, Casterman, 1982.
  • traducteur Comes, 1984. Ar gaerell, Casterman, Keit Vimp Beo.
faits de langue Comes 1984
  • traducteur Cosey (il semble à peu près constant sur les différents albums)
1983. Hag ar menez a gano evidoc'h, Jonathan 2, Keit Vimp Beo
1983. Kate, Jonathan 7, Keit Vimp Beo
faits de langue Cosey
  • traducteur Derib, 1983. An abadennou chaseal kentan, Buddy Longway 9, Keit Vimp Beo.
faits de langue Derib 1983
  • traducteur Derib, 1982, 1982b: (il semble constant sur les différents albums), plausiblement du sud Cornouaille.
Ar sekred, Buddy Longway 5, Keit Vimp Beo.
faits de langue Derib 1982
An orignal, Buddy Longway 6, Keit Vimp Beo.
faits de langue Derib 1982b
  • traducteur Comes, 1981. Skeud ar vran, Keit Vimp Beo.
faits de langue Comes 1981
  • Moulleg, Loeiz. 1978. An Ankou, troioù-kaer Spirou ha fantasio, traduction de Fournier, éditions Dupuis 1976.
  • Preder & Armor. 1977. Emgann ar Pennoù, Preder (éd.), Armor diffusion, traduction de Le combat des chefs, Dargaud éditeur, 1966.

corpus vidéo

films de l'INA

  • Des films courts et reportages en breton sont disponibles en ligne sur le site de l'INA (avec des transcriptions).
L'ouest en mémoire


Dizale

L'association Dizale réalise des DVDs en langue bretonne. Catalogue complet et accessibilité des corpus sur le site breizhvod.

  • 2009. Marc'h al lorc'h
Voix de Marion Guen, Nolwenn Korbell, Manu Mehu, Gilles Pennec, Yann Vijer
  • 2008. Columbo
Voix de Tangi Daniel pour Columbo
  • 2006. An Afer Sezneg
Voix de : Goulwena an Henaff, Corinne ar Mero, Keridwenn ar Mero, Erell Beloni, Klet Beyer, Aziliz Bourges, Mona Bouzeg, Sten Charbonneau, Loic de Chateaubriand, Louis Conan, Tangi Daniel, Remi Derrien, Dom Duff,...


chaines utube

  • brezhoneg digor, gant Gurvan Lozac'h

Bibliographie