Description du projet ARBRES

De Arbres
Aller à : Navigation, rechercher

ARBRES est un projet de réalisation d'Atlas numérique des variations dialectales du breton en syntaxe.


Le but du site actuel

Le but du site ARBRES, depuis 2009, est de construire un pont entre d'une part les brittophones et les travailleurs de la langue et d'autre part une communauté internationale de recherche formelle en linguistique. Cette tâche est ardue car, entre autres, si les premiers ont accès au breton, les seconds publient en anglais. ARBRES est donc rédigé en français, langue maximalement accessible dans cette optique.

ARBRES est un site de recherche "à carnet ouvert". C'est une expérience de science ouverte et participative. J'en explique la philosophie en détail dans Jouitteau (2013b).


construire un outil pédagogique

ARBRES est pensé pour servir une audience plus large que la communauté scientifique. Chaque article de la grammaire du breton commence par une description de la donnée ou du phénomène. Cette description est la simple et la plus théoriquement neutre possible. On retrouve à ce niveau la décomposition morphologique, la répartition dialectale de la forme ou la description de son usage syntaxique.

Les implications et analyses théoriques, elles, sont traitées en bas de page, ce qui permet à l'utilisateur d'arrêter sa lecture au niveau qui lui convient. Un glossaire des termes descriptifs et formels utilisés est par ailleurs disponible en français, en breton et en anglais. Une bibliographie est associée à chaque page pour permettre d'aller plus loin dans l'étude.

En ce sens, la grammaire ouvre sur des utilisations pédagogiques et de vulgarisation scientifique, servant autant les lycéens Diwan, les adultes brittophones curieux, ou les étudiant.e.s universitaires des départements de breton ou de sciences du langage.


construire un outil de recherche

Cet outil est par ailleurs au service de la communauté des chercheurs en syntaxe formelle. Il doit servir l’enquête sur la compréhension des systèmes, des lieux et des limites de la variation syntaxique des langues humaines, c’est à dire la description structurale et formelle de la langue, ainsi que l’étude comparative des universaux et des invariants du langage.

Ce site doit donc satisfaire autant les grammairiens comparatistes spécialistes du gallois du Nord que les syntacticiens qui documentent les parallèles entre le breton et l’hébreu en terme d’accord avec les indéfinis postverbaux, et ce quel que soit leur cadre théorique formel.

Ce projet est pensé pour alimenter la recherche syntaxique en données claires, accessibles et organisées. Il nourrit:

  • l’établissement de généralisations morphosyntaxiques descriptivement valides à l’échelle d’un microdialecte ou d’un ensemble de langues
  • le portrait de parlers syntaxiquement homogènes ainsi que leurs corrélats historiques et géographiques
  • la recherche des limites de la variation syntaxique à l’intérieur d’un système donné
  • le(s) facteur(s) clé(s) de la variation syntaxique dans le modèle de la grammaire
  • la recherche des principales différences entre la macrovariation et la microvariation
  • l’enquête sur les universaux du langage


une formule participative

La taille de ce projet dépasse le cadre d’un apport individuel et c'est pourquoi j'ai choisi une formule participative. Comme dans toute technique wiki, tout utilisateur de ce site peut laisser un commentaire ou transformer le texte. Cette page de présentation est, avec la page d'accueil, la seule du site qui soit protégée en écriture. Toutes les autres pages sont modifiables (Il suffit de se créer un compte, en cliquant en haut à droite de l'écran).

Une page d'aide à l'utilisation est disponible.

Cela permet des contributions diverses, dont des retours ou questions concernant les thèmes traités. A chaque page de la grammaire est en effet associée une page de discussion qui peut "faire forum" sur le thème abordé.


Est-ce qu'un wiki peut être un outil scientifique?

Absolument. Tout d'abord, n'importe qui peut écrire sur ce site, mais pas n'importe quoi. Je suis entièrement responsable du contenu du site, et je vérifie personnellement toute modification apportée.

Ce site répond aux même critères scientifiques qu'un ouvrage papier. Comme pour un ouvrage scientifique papier, chaque source est dûment référencée à la page près. Les hypothèses d'analyse, au delà de leur mention, doivent y être argumentées et les arguments étayés.

L'outil wiki offre même un plus haut degré de sérieux scientifique qu'un livre papier pour différentes raisons:

  • Les erreurs éventuelles peuvent être corrigées longtemps après parution.
  • Le poids de l'ouvrage n'est pas un problème, et chaque ouvrage de recherche peut y être dûment cité. Le système de références cliquables rend la consultation des références facile, et permet d'accéder à la fiche descriptive de cet ouvrage, voire le lien internet vers l'ouvrage lui-même.
  • Il est facile de voir où exactement dans la grammaire a été référencé un ouvrage de recherche donné (aller sur la page associée à l'ouvrage de recherche, puis appuyer sur le lien "pages liées" dans la colonne de gauche. Une liste des pages de la grammaire citant cet ouvrage est automatiquement générée).
  • La génèse de chaque page de ce site est transparente: l'historique des transformations est librement accessible.
  • Les données brutes d'élicitation sont disponibles en ligne dans la centrale d'élicitation. Si une analyse grammaticale vient à négliger une partie des données, celles-ci ne disparaissent pas.
  • La traçabilité des données d'élicitation est optimale puisqu’il est possible à partir de chaque donnée de remonter au locuteur et à sa fiche personnelle (parcours linguistique, influences dialectales possibles, profil sociologique, etc.).


Prochaine étape: la base de données BRETON SYNTAX DATABASE

La seconde étape, actuellement en cours de recherche de financement, prévoit le déploiement d'un système local et web de gestions de données. Nous sommes aussi en recherche de partenaires.


équipe permanente porteuse de projet > Responsable de projet Mélanie Jouitteau IKER, CNRS, UMR 5478
Conseil scientifique Milan Rezac IKER, CNRS, UMR 5478
Conseil et suivi technique Reun Bideault indépendant


création d’une banque de données

Création d’une base de données SQL, avec un système d’étiquetage des données linguistiques selon les conventions adoptées au niveau européen. La banque de données est un outil de recherche et les gloses et traductions y sont disponibles en anglais.

Création d’un système de création de questionnaires (en ligne et en local) alimentant la base de données.

Un moteur de recherche intégré effectue des recherches croisées dans la banque de données et renvoie des résultats en fonction des paramètres de recherche proposés (mot de glose en français, mot de glose en anglais, lieu de collecte, tags morphologiques…).

Création d’un schéma des bases de données relationnelles (pour la correspondance entre les tables des bases de données européennes et locales) pour la connexion de la base de donnée avec les bases existantes italienne (ASIt), portuguaises (CORDIAL-SIN), estonien (EMK), anglais (FRED-S), nordiques (NDC), néerlandais (SAND) et slovène (SDDD) dans le projet de recherche européen Edisyn de l'institut Meerstens aux Pays Bas.

accès et convivialité

Création d’un site en accès libre regroupant les informations collectées dans une/des bases de données mises à disposition du public et des chercheurs. Le site est open source. Définir son type de système de gestion de contenu (CMS, content management system).

Création des cartes avec des outils de système d’information géographique (SIG) open source et OpenStreetMap (OSM). Réalisation du mappage des carte des pays bretons et limites linguistiques, réalisation de punaises localisantes personnalisées.

Suivi SEO sur la première année de fonctionnement.


adosser le site de la banque de données au site wiki ARBRES

Préalables:

Mise à niveau du wiki et passage au responsif (pour la lecture sur téléphones et tablettes).
Paramétrer les données sur ARBRES afin que google translation, déjà installé sur le site, puisse y reconnaître les langues (breton, anglais, français) de façon différenciée, et permettre ainsi une automatisation de l’export des données.

Installation et paramétrage d'un système ECM local reduplicable de traitements et échanges collaboratifs du travail sur les données. Cet outil permet de travailler à plusieurs, en croisant les données de la nouvelle banque de données, de ARBRES ou de données présentes sur d’autres sites ou documents.

Les buts à plus long terme

A terme, une grammaire sera aussi produite sur support papier avec:

  • une description linguistique des variables syntaxiques spécifiques
  • une discussion de la distribution des formes
  • une bibliographie


mise en réseau européenne en vue d'un dépôt de projet de financement spécifique

ARBRES a fait partie du projet européen Edisyn, projet de documentation de la microvariation dans les langues d’Europe, projet soutenu par la European Science Foundation. Il fait maintenant partie du projet Atheme, (Advancing the European Multilingual Experience).

La taille européenne du projet global est un avantage en soi. Elle ouvre naturellement accès aux financements des projets internationaux et à des recueils de publication de haut niveau, ce qui en retour sert à l’échelle internationale, nationale et locale. De plus, cette taille européenne force à penser en grand, à dépasser les limites de ce qu'il est habituellement pensé possible sur la documentation de langue bretonne.


documentation des langues d'Europe

Edisyn rassemble des projets de documentation de la variation syntaxique dans différentes langues d'Europe.

  • SAND (Syntactische Atlas van de Nederlandse Dialecten),
  • ScanDiaSyn (Atlas des dialectes scandinaves)
  • ASIS (Syntax variation in Nord-Italian dialects)
  • EDS (English dialect syntax, U. Freiburg)
  • Dialect Syntax of Swiss German (U. Zurich)

...

Le projet européen croise les organisations par pays (organisations des chercheurs) et par familles de langues (par exemple, pour nous, les langues celtiques).


méthodologies communes

Une littérature méthodologique conséquente existe pour les différents projets européens (bibliographie). Cette littérature est précieuse car elle nous permet de nous enrichir de l'expérience pratique de projets de collecte de données syntaxiques, ce qui est presque inédit en Bretagne.

Il est évident que toutes les méthodes de collecte appliquées sur, par exemple l'italien ou le néerlandais, ne peuvent pas être appliquées aveuglément sur une langue minorisée telle que le breton. En Bretagne, cependant, nous sommes loin de partir de rien.

Les ressources humaines au niveau local breton comptent les équipes et laboratoires de recherche en Bretagne (CRBC CNRS, LLING, EA 3827, membre de la Fédération Typologie et Universaux du CNRS).

Les chercheurs et chercheuses des universités de Rennes, Nantes et Brest représentent des perspectives théoriques variées :