1. Situation des Langues Régionales en France et support institutionnel
C’est aujourd’hui lieu commun que de considérer que l’avenir de nos langues se joue aujourd’hui en grande partie sur les réseaux numériques et l’observation de ces usages montre combien il est important d’assurer la présence du français et des langues de France dans cet univers (Jocelyn 2007). Il importe également que ces réseaux soient irrigués par une diversité de langues, de cultures, de savoirs et d’imaginaires. On peut envisager cette irrigation de deux points de vue : la diffusion « spontanée » d’une langue par des locuteurs scripteurs présents sur les réseaux et le soutien « volontariste » de cette présence par les institutions. En France, la Délégation Générale à la Langue Française et aux Langues de France (DGLFLF) élabore la politique linguistique du Gouvernement en liaison avec les autres départements ministériels. Organe de réflexion, d’évaluation et d’action, elle anime et coordonne l’action des pouvoirs publics pour la promotion et l’emploi du français et veille à favoriser son utilisation comme langue de communication internationale. Elle s’efforce de valoriser les langues de France et de développer le plurilinguisme (Adda/Cartier/Bohbot/Frontini/Schnedecker/Meyer/Dazéas/ar Mogn 2018). Grâce au soutien appuyé du Secrétariat d’État chargé du numérique et de l’innovation, deux appels à projets « langues et numérique » ont permis de disposer d’environ 600.000 euros sur deux ans (2016 et 2017). Ces appels faisaient la part belle à la dimension « traitement automatisé des langues », en particulier autour du web sémantique et du web de données, des technologies du langage, et des ressources linguistiques. Sur les deux ans, un peu plus de 200 projets ont été proposés et une quarantaine d’entre eux ont été sélectionnés. Les langues régionales ont bénéficié de ces opérations, mais de façon assez contrastée, et pour des financements somme toute assez limités : de 5.000 à 35.000 euros par projet, représentant environ 40% du budget total. Ce chiffre semble indiquer que les institutions sont devenues conscientes de la richesse d’un patrimoine culturel à préserver. Néanmoins, la situation des langues régionales en France est particulière dans la mesure où l’attachement à la « pureté de la langue » renvoie à des questions identitaires extrêmement profondes. Le français est, d’après la constitution, la seule langue pouvant prétendre au statut de langue officielle. Les langues régionales apparaissent seulement dans l’article 75-1 de la Constitution : « Les langues régionales appartiennent au patrimoine de la France », modification apportée après que la Charte Européenne des Langues régionales et minoritaires, créée en 1992 sous l’égide du Conseil de l’Europe et signée par la France en 1999, soit finalement rejetée par le Sénat en 2015.
De plus, toutes les langues de France n’ont pas réussi à s’inscrire dans le dispositif, loin de là. On trouve :
- cinq projets plus ou moins « génériques » (ne portant pas spécifiquement sur une langue) parmi lesquels un Atlas sonore des langues régionales de France (LIMSI-CNRS), un Projet de jeu vidéo pour découvrir les langues régionales, basé sur les données orales du corpus ESLO (Association LaboMedia), un projet de création de claviers prédictifs pour terminaux Android basés sur des lexiques flexionnels pour l’occitan, l’alsacien et le picard (ROLF, Congrès permanent de la langue occitane) ;
- des petits projets (autour de 5.000€) reliés spécifiquement à une langue parmi lesquels un Dictionnaire de lexicographie pour le picard (Agence pour le picard), un Atlas Marchois Atlantographie (Laboratoires BCL et INALCO), un projet dictionnairique d’alignement sémantique des expressions définitoires entre le breton et le français (IRISA), un projet de création de synthèse vocale pour le basque (IKER), un correcteur orthographique pour les dialectes alsaciens (LILPA);
- les projets les plus importants (plus de 15.000€) sont le projet Base de données outillée en francoprovençal porté par le laboratoire Dynamique du langage (DDL), le projet VERA porté par le laboratoire Bases, Corpus, Langages (BCL) visant à la traduction en français, transcription en graphie occitane, lemmatisation et étiquetage morphosyntaxique de toutes les occurrences de plusieurs corpus linguistiques et mise en ligne de ces ressources pour les rendre accessibles à tous et le projet LINE, porté par le laboratoire INALCO qui vise la production et mise en ligne de ressources linguistiques, sociolinguistiques, pédagogiques et didactiques sur et dans les langues parlées en Guyane.
On voit que le mouvement profond et le travail important fait autour de certaines langues régionales depuis une vingtaine d’années, intégré dans de gros laboratoires de recherche CNRS (visibles en haut lieu) porte ses fruits. On peut aussi s’étonner du peu de visibilité de certaines langues régionales à fortes revendications comme le basque et le corse. Toujours est-il que le poitevin-saintongeais ou parlanjhe n’en fait pas partie.
Après avoir présenté le contexte sociolinguistique de a langue (Section 2), l’objectif de cet article est, dans un premier temps, de dresser un état des lieux des ressources existantes pour le poitevin-saintongeais (Section 3) et, dans un second temps, d’évaluer la vitalité numérique de la langue en suivant les indicateurs du Digital Language Diversity Project (Ceberio Berger/Gurrutxaga Hernaiz/Baroni/Hicks/Kruse/Kochi/Russo/Salonen/Sarhimaa/Soria 2018) (Section 4).
2. Le poitevin-saintongeais ou parlanjhe: une situation socio-géo-politique délicate
2.1. De la difficile reconnaissance des langues d’oïl
Les langues régionales de France peinent donc à exister sur le territoire géographique et institutionnel en France. Le poitevin-saintongeais ne fait pas exception. D’autant plus que, comme toutes les variétés de langues d’oïl, le poitevin-saintongeais a souffert de sa proximité linguistique avec le français : on l’a souvent considéré comme une variante (dans le meilleur des cas) ou plutôt comme du français déformé. Cette considération est malheureusement encore bien ancrée dans les consciences même si de nombreuses études linguistiques (notamment Nowak 2010) corroborent la distinction du poitevin-saintongeais par rapport au français et aux autres langues d’oïl : il s’agit d’une langue d’oïl méridionale1 avec un fort substrat d’oc, parlée entre la Loire et la Garonne.
Cette difficulté à être identifiée comme langue per se se manifeste rapidement lorsqu’on circule dans ce qu’on pourrait appeler l’espace numérique du parlanjhe, y compris dans des endroits où on ne l’attend pas. Ainsi, on trouve la formulation suivante sous la plume d’un journaliste pourtant a priori bien intentionné, puisqu’il chronique positivement un spectacle de Yannick Jaulin, figure phare de la visibilité du parlanjhe : « À l'occasion de la présentation de sa conférence/spectacle, nous avons rencontré Yannick Jaulin. Il nous a parlé, dans un français parfois approximatif2, de son attachement à la langue, de son combat, du monolinguisme et de ses dégâts, de la fatigue de la langue française »3. Il est pourtant bien clair que M. Jaulin ne parle pas un français approximatif, mais parle deux langues et s’autorise de savoureux moments de code switching, tout en veillant à rester compréhensible pour les locuteurs dont la langue commune est le français. Cette opération linguistique n’est pas forcément identifiable en tant que telle puisqu’elle donne lieu à cette appréciation du journaliste : français approximatif. De tels « moments » rendent compréhensible la dimension revendicatrice des sites dédiés à la promotion du parlanjhe : par exemple « notre patois est une langue » ou encore : « Mais en tout état de cause, le poitevin-saintongeais, qui se forma en même temps que les autres langues romanes de France, ne peut être considéré ni comme de l’ancien français ni comme du français déformé ».
Par ailleurs, la nécessité de se positionner par rapport aux « autres langues » a un effet secondaire sur le parlanjhe lui-même : la fin du 20ème siècle se caractérise par cette idée que la sauvegarde de langues peu « armées »4 repose sur leur normalisation5, normalisation qui devrait accroître leur visibilité et donner des arguments pour constituer une « zone » géographique et linguistique suffisamment importante pour pouvoir poser des revendications auprès des pouvoirs publics, par exemple son enseignement. Or le parlanjhe se caractérise par une réelle variation diatopique, les substrats celtiques, germaniques ou occitan étant plus ou moins prégnants selon les zones géographiques. Les querelles n’ont donc pas manqué de s’ensuivre : qui détermine cette norme et comment se construit-elle ? Cette situation a donné lieu à toutes sortes de polémiques, dont celle sur l’orthographe, sur laquelle nous reviendrons plus loin. De plus, la dénomination de poitevin-saintongeais porte la trace de cette irréductibilité socio-politique, sans compter qu’elle exclut une partie de la zone, celle du parlanjhe de Vendàie . Or la Vendée fait bien partie de l’aire linguistique du poitevin-saintongeais. Cette « exclusion de fait » s’explique sans doute par le fait qu’il n’y a pas de terme traditionnel et unique pour désigner la région Poitou-Charentes-Vendée, le Poitou-Charentes ayant été historiquement, soit une région à part entière, soit une partie de l’Aquitaine (ce qu’il est de nouveau aujourd’hui) (http://arantele.org/langue.php), alors que la Vendée relevait d’une autre région. Les questions identitaires à l’intérieur de la zone du parlanjhe sont donc fortes, découpages administratifs et événements historiques remontant à la révolution ou aux guerres de religions semblent toujours façonner la « conscience d’appartenance ». Par exemple, en 1968-1969, des associations se sont groupées pour créer l’Union Pour la Culture Populaire en Poitou-Charentes et Vendée (UPCP), qui se donnait pour but la promotion « de la culture poitevine-saintongeaise ». La Vendée, pourtant évoquée en début de propos, est donc bien identifiée comme une zone de pratique du parlanjhe. Pourtant, elle n'apparaît ni dans le sigle,6 ni dans le projet de l’UPCP parlant exclusivement de la culture poitevine-saintongeaise. De plus, c’est le maintien de la distinction en Poitou et Saintonge qui a été privilégiée, alors même que le terme de parlanjhe aurait pu être retenu dès l’abord, en ce qu’il désigne la langue ou la langue orale sur toute la zone (Poitou, Saintonge, Vendée). Quant à nous, c’est ce terme de parlanjhe que nous retiendrons pour la suite de cette contribution.
2.2. De quelques caractéristiques linguistiques du parlanjhe
Y en avét prtant yin, sou l’enpire de Badinghét, qui fàetét jhamé la mort de sun gorét é qu’alét jhamé menjhàe de boudins. (Lés boudins a Nicolét)
‘Il en était pourtant un, sous l’empire de Badinget, qui ne fêtait jamais la mort de son cochon et qui n'allait jamais manger de boudin.’ (Les boudins de Nicolas)
Nous l’avons dit, le parlanjhe est une langue d’oïl méridionale, entre Loire et Gironde, au voisinage de la langue occitane. Le parlanjhe possède en outre un substrat d’oc que des états anciens de la langue attestent dans des textes du 11ème siècle par exemple, de même que la toponymie, en particulier la répartition des noms de lieux de suffixe -ac,7 résultat du suffixe celte latinisé -acos > -acum (le domaine de’).
Il s’agit d’une langue morphologiquement proche du français, qui se distingue des autres idiomes d’oïl par quelques traits saillants, repérables d’une part dans les zones de « mots grammaticaux » et de flexion verbale, d’autre part du fait de variations graphiques transposant évolutions et variations phonétiques.8.
- Pour les premières, on peut notamment mentionner la présence d’un pronom personnel sujet de 1° et 4° personne, i issu du latin ego : i me di qu’ol ét rén (‘je me dis que c’est rien’), i alun vére çheù (‘nous allons voir ça’), et celle du pronom neutre sujet o (ol devant voyelle et ou comme enclitique) et du pronom neutre complément d’objet direct (z-)ou : o moulle (‘il pleut’), vat-ou ? (‘est-ce que ça va ?’), i vae z-ou dire (‘je vais le dire’). On peut aussi donner ici la conjugaison de dounàe (‘donner’) au présent et au futur : doune, dounes, doune, dounun, dounéz, dounant / dounerae, douneraes, dounerat, dounerun, douneréz, dounerant.
- Pour les secondes, nous citerons la palatalisation des groupes issus du latin [p+l], [b+l], [c+l], [g+l] et [f+l] noté pll- [pj], bll- [bj], cll- [kj], gll- [gj] et fll- [fj] en graphie normalisée : pllanjhe (‘calme’), bllai (‘blé’), cllan (‘taon’), glla (‘glaçon’), flla (‘fléau’). Enfin, la plupart des auteurs ont par le passé effectué des choix de notation, parfois singuliers, selon des critères morpho-phonétiques propres au parler local, au détriment de la mise en valeur de traits communs, ou plus communs, de la zone linguistique. Le traitement de la variation graphique est donc un enjeu majeur pour l’étiquetage des textes. Nous en donnons ici quelques exemples :
français | ailleurs | aloi | beaucoup | domaines | fausseté | grand |
Gente Poitevinrie 1572 | aillours | alouay | beacot | demones | faussetez | grons |
Gente Poitevinrie 1646 | aillours | aloüay | beacop | demoynes | fausseti | grond |
Dictionnaire P-S Pivetea 1996 | allour | aloe | beacop | deménes | faussetez | grand grant |
Illustration de la variation graphique
De facto, les polémiques sont encore très virulentes sur la façon d’écrire la langue. Du Moyen-Âge jusqu’au dernier tiers du 20ème siècle, le parlanjhe ne connaît pas de normes graphiques. On peut généraliser en disant qu’il y a alors autant de graphies que d’auteurs. Néanmoins, ces graphies individuelles ont pour point commun d’utiliser les solutions orthographiques du français, tout en cherchant à rester fidèle aux prononciations locales (Dourdet 2011). L’examen de plusieurs ressources lexicographiques9 en ligne met en lumière l’extrême variété de formes possibles pour un mot comme jhàu (‘coq’) : jau, jaud, jhaud, jhau, jo, jao, jho, jha, variantes graphiques qu’on s’attend à trouver également dans tous les types de ressources écrites en parlanjhe. Ces variantes graphiques, dites localisées, rendent compte de la variation phonétique. Au cours du dernier tiers du 20ème siècle, plusieurs graphies officielles ont successivement vu le jour. Celle qui est probablement la plus répandue a été mise au point par l’UPCP10 car elle est utilisée dans tous les ouvrages édités par leurs soins (Geste Editions). Ce standard typo-orthographique, dit graphie normalisée, est diasystémique, autrement dit une graphie unique (une lettre ou un groupe de lettres) regroupe plusieurs variantes phonétiques possibles selon les variétés,11 comme par exemple jhàu plus haut. Cette graphie a aussi pour objectif de marquer l’originalité du parlanjhe par rapport au français (Jagueneau 2015).
2.3. De l’utilité d’une langue
Une langue est vivante dans la mesure où le nombre de locuteurs l’utilisant est vivant (transmission générationnelle) et dans la mesure où le sentiment de son utilité (communicationnelle et/ou identitaire) est, elle aussi, vivante. Sinon, elle est « en danger ». Tel est le cas du parlanjhe, considéré comme ‘sévèrement en danger’ (severely endangered) par l’UNESCO. S’il n’existe aucune estimation officielle du nombre de locuteurs,12 on sait cependant que la transmission générationnelle n’est plus effective depuis une ou deux générations (Eloy/Jagueneau), ce qui pose la question de sa survie « en milieu naturel », ce dont les derniers locuteurs sont bien conscients. Ainsi, sur la page YouTube consacrée à un spectacle de Yannick Jaulin, déjà évoqué plus haut : « Ma langue maternelle va mourir et j’ai du mal à vous parler d’amour », on trouve le commentaire suivant :13
« Le problème c’est qu’une langue c’est un moyen de communication. Moi aussi je suis un vieux Vendéen, comme Monsieur Jaulin j’adore parler notre patois. Mais maintenant que nous devenons vieux et que beaucoup partent, avec qui communiquer ? […] Une langue meurt simplement parce qu’elle n’est plus employée par un nombre suffisant de personnes. […] Bien sûr on ne trouve pas en français des envolées comme celle d’une de mes tantes parlant de son mari un peu bringueur : « le me ouille, le me venne, le me mine, li laissera sa pia cheut azirabie » ou encore de ce boulanger revenant du service militaire où il avait si mal mangé qu’il était « que de zou, que de zou » cad « qu’l’avé qu’la pia su les zous » Dommage. »
Ce commentaire permet en fait de bien comprendre les difficultés rencontrées par le parlanjhe en tant que langue régionale de France. Indépendamment du fait que la fonction communicationnelle ne s’impose plus (ce qui est le cas, à divers degrés, pour toutes les langues régionales), la relation identitaire à la langue se pose de façon particulière, comme en témoigne la référence au patois et à la Vendée : si le terme de patois n’a plus aujourd’hui la connotation méprisante qu’il avait dans la seconde moitié du 20ème siècle, cette dénomination situe néanmoins cette langue « par rapport » au français, et par rapport au reste de la zone du parlanjhe : lorsqu’on parle avec les gens concernés, la Vendée est perçue comme « un monde en soi », que ce soit par les vendéens ou par les autres.14
3. Ressources disponibles et valorisation
3.1. Attestations du parlanjhe à valoriser : des sources diverses remontant au Moyen-Age
Au contraire de certaines des langues de France qui souffrent parfois d’un manque de production écrite, on trouve pour le parlanjhe une production écrite et littéraire ininterrompue du Moyen-Âge à nos jours. La diffusion de ces textes a été marquée inauguralement par les recueils de textes intitulés La gente poitevinerie (Boiceau de la Borderie 1572) puis Le Rolea (Boiceau de la Borderie 1646). On trouve aussi des œuvres qui sont le fait d’un seul auteur (Besse 1955). Les œuvres littéraires en parlanjhe relèvent d’une grande variété de genres (pièces de théâtre, textes en vers et en prose : dialogues, lettres fictives, compliments, chansons). Le 20ème siècle se caractérise par une importante création théâtrale, mais aussi des œuvres de poésie narrative, lyrique ou satirique. Les textes en prose sont principalement des contes, plus ou moins inspirés de la tradition orale, et des récits de vie, relatant le mode de vie traditionnel. Au 21ème siècle, la littérature en poitevin-saintongeais s’inscrit à la fois dans la continuité et dans le renouveau, abordant des questions contemporaines, sociétales et spirituelles (Jagueneau 1999).
Les travaux que nous menons à l’heure actuelle s’inscrivent dans la lignée d’un projet ambitieux initié par Liliane Jagueneau : rassembler l’ensemble de la production écrite en poitevin-saintongeais, afin de remédier à la dispersion et la rareté de certaines ressources, pour jouer le rôle d’un « trésor de la langue poitevine-saintongeaise ». C’est ainsi que le projet TELPOS (Textes électroniques en poitevin-saintongeais) a vu le jour en 2006, porté par la MSHS de Poitiers (laboratoire FoReLLIS15) et soutenu par la région Poitou-Charentes dans le cadre d’une dynamique générale autour de la préservation du patrimoine culturel et de sa promotion par le numérique. TELPOS rassemble aujourd’hui des textes du 16ème siècle à nos jours, de l’ensemble de l’aire géographique (Vendée, Deux-Sèvres, Vienne, Charente-Maritime, centre et ouest de la Charente, Nord-Gironde), de tous les genres (poésie, récit, théâtre…) et écrits dans leur graphie d’origine. Les textes ont été collectés puis numérisés, corrigés manuellement et formatés (XML TEI P5) : l’objectif est de créer une base textuelle permettant de disposer des outils numériques d’exploration des textes, que ce soit à des fins d'études littéraires et linguistiques ou pour répondre à une demande sociale qui entre en résonance avec les politiques d’aménagement du territoire en matière linguistique.
Du côté de la littérature orale, des collectes ont débuté à la fin du 19ème siècle et ont parfois donné lieu à la publication d’ouvrages écrits en poitevin-saintongeais(Lacuve 1899). Enfin, il existe un fonds très important, le fond Valière, comportant 1.500 bandes magnétiques, des documents écrits (cahiers d’enquête, notes, documents complémentaires), des clichés photographiques et des témoignages filmés. Ce fonds a été constitué par Michel et Michèle Valière, en immersion dans des milieux sociaux et culturels allant de la moitié du 20ème au début du 21ème siècle. Il est actuellement en cours de numérisation par les archives départementales de la Vienne. Ce fonds a été présenté lors d’une exposition par les archives et le laboratoire FoReLLIS en décembre 2021. Même si l’on peut trouver des productions littéraires se basant sur des récits de vie, comme Amours paysannes, récit d’une vie de Galerne (Valière 1984), et en dépit d’une bonne présence sur le net (cf. Section 2), les ressources en parlanjhe ont rarement fait l’objet d’une quelconque valorisation.
Outre la base Telpos et le fonds Valière mentionnés ci-dessus, d’autres ressources mériteraient une meilleure visibilité numérique, comme la Grammaire du Poitevin-Saintongeais de (Gautier 1993), les données dialectologiques de l’Atlas linguistique et ethnographique de l’Ouest de (Horiot/Massignon 1971-1983), des données d’enquêtes orales rassemblées dans des buts de recherche spécifiques.
Les travaux que nous menons à Poitiers visent à contribuer à la visibilité des ressources constituées. La première phase de constitution de ressources au format numérique étant réalisée, la seconde étape a été de se doter des outils permettant l’analyse des faits linguistiques sur le plan phono-graphématique, lexical, morphosyntaxique et avec des données contextualisées et situées. Pour ce faire, il nous a fallu identifier les difficultés à surmonter : les éléments d’information portant sur les caractéristiques du parlanjhe (section 2) ont ainsi contribué à l’élaboration des stratégies pour le développement d’outils informatiques de traitement de la langue. L’étape suivante, la troisième, est celle du repérage d’entités nommées et de thématiques permettant un meilleur accès ciblé aux ressources.
3.2. Projets de valorisation des ressources en parlanjhe : impact des caractéristiques linguistiques sur le développement d’outils d’annotation à l’ère numérique
Les points de description de la langue abordés plus haut permettent de comprendre les paramètres linguistiques que l’on peut prendre en compte pour spécifier le développement d’outils de traitement de cette langue, en partant du mot (annotation morpho-syntaxique et entités nommées) jusqu’à obtenir une vision globale du contenu (annotation thématique) des textes disponibles : il s’agit d’une langue morphologiquement proche du français (aux éléments grammaticaux près), caractérisée par une forte hétérographie.
Les outils développés prennent en compte la « réalité du terrain » dans lequel se déroulent les projets : un projet d’analyse linguistique outillée, s’il veut aboutir, se doit d’intégrer les dimensions socio-techniques de sa mise en œuvre. Dans notre cas, les compétences en informatique sont faibles, et les personnes susceptibles de travailler sur les textes ne sont généralement pas en mesure de prendre véritablement en main des outils de TAL « classiques ». En conséquence, nous utilisons un outil léger AnaLog (Lay/Pincemin 2010), outil d’annotation manuelle développé précisément pour répondre à ce type de situation : il a été conçu initialement pour étiqueter des textes de français de la Renaissance, présentant les mêmes particularités, et nécessitant donc de disposer (1) d’un moteur de flexion graphique adapté et (2) d’un moteur de gestion de l’hétérographie, particulièrement créative chez un auteur comme Rabelais par exemple. La reconnaissance des formes graphiques se fait par rapport à un dictionnaire de français enrichi des flexions propres aux divers états de langue. Puis, un moteur d’expansion de requêtes basé sur des règles morpho-graphématiques (basé sur l’observation des mécanismes de variation graphique) permet de « reconnaître » une forme rencontrée dans un texte comme étant probablement à mettre en relation avec une forme décrite dans le dictionnaire de français standard (Lay/Duchet 2012). Pour le reste, la création des ressources lexicales se fait à la volée en cours d’annotation (ou de correction de l’annotation), AnaLog proposant diverses fonctionnalités permettant d'incrémenter les ressources en cours de traitement. C’est de nouveau dans le cadre de financements par la région Poitou-Charentes que ce projet d’annotation s’est mis en place, s’inscrivant dans la continuité du projet TELPOS.
Depuis 2018, nous avons choisi d’élargir l’ensemble des données que nous souhaitons mettre en valeur, en incluant le fond Valière, choisi aussi de les inscrire dans une mouvance « humanités numériques pour les langues peu dotées en ressources numériques ». La question est la suivante : généralement, l’accès aux données collectées (textes et enregistrements oraux) se fait (1) soit par la lecture linéaire ou l’écoute continue de documents disponibles, soit par des recherches sur mot clef, par l’intermédiaire de divers types de moteur de recherche. Ces modalités d’accès ne correspondent plus à ce que les utilisateurs potentiels ont comme habitudes de circulation dans l’information. Et elles impliquent que l’utilisateur soit prêt à se confronter à l’intégralité d’un document, ou le consulte à des fins extrêmement précisément définies, au niveau du mot. Notre objectif est de permettre l’accès aux textes en nous basant sur leur dimension thématique, ce qui permettra que les travaux puissent concerner à la fois les publics de chercheurs comme la communauté plus large des curieux des langues régionales. Une entreprise similaire peut être ici mentionnée (même si elle ne se base pas sur une localisation fine interne aux textes) : il s’agit des travaux menés par le CERDO (Centre d’Études, de Recherche et de Documentation sur l’Oralité) chargé de la conservation et de la valorisation du fonds documentaire constitué par le réseau UPCP-Métive depuis plus de 40 ans (archives sonores, écrites, photographiques et cinématographiques). On trouve sur le site des dossiers thématiques comme « le loup dans la tradition orale », « les êtres légendaires », « les métamorphoses ». On voit ici la problématique dans laquelle s’inscrivent de telles entreprises : la disponibilité de ressources au format numérique n’est pas à assimiler à une réelle disponibilité pour le public, la nécessité de véritablement travailler sur leur accessibilité puis sur leur diffusion s’impose et nous semble être un enjeu majeur d’une réelle « présence » sur les réseaux. Le travail sur des dimensions thématiques participe de ce mouvement qui permet à la fois de définir des problématiques de recherche et de rendre « vivants » les documents dont on dispose.
La seule mention des activités d’un laboratoire de recherche ne permet pas de se faire une idée précise des ressources disponibles de façon générale, sur l’initiative d’associations ou d’individus engagés. Il s’agit principalement de sites web, de documents PDF et d’ouvrages numérisés dans Gallica, inventoriés sur le site Lexilogos. C’est ce point que nous allons maintenant aborder.
3.3. Présence du parlanjhe sur le net
La présence du poitevin-saintongeais sur le net est discrète, mais tout à fait diversifiée. Nous proposons ici un inventaire des différents types de ressources manifestant cette présence : nous nous baserons sur le modèle d’état des lieux établi par la DGLFLF en 2014 dans l’Inventaire des ressources linguistiques des langues de France (Leixa/Mapelli/Choukri 2014). Ce rapport ne considère pas chaque langue d’oïl individuellement et indique un volume faible de ressources linguistiques pour les langues d’oïl, dont le poitevin-saintongeais fait partie, langue pour laquelle le rapport ne fait état que d’une seule ressource.16 Or, il existe, à l’heure actuelle, des ressources numériques concernant la seule langue poitevine-saintongeaise. S’il n’est pas exhaustif, ce rapport propose une classification des types de ressource, classification sur laquelle nous nous appuierons, au prix de modifications mineures : il est en effet utile de produire des résultats qui puissent être aisément comparés à d’autres inventaires.
Nous avons procédé à un inventaire en respectant la classification de l’inventaire de 2014 avec quelques modifications mineures (le parlanjhe ne disposant pas à ce jour de corpus parallèles alignés (0) ni de thésaurus (0)). La classification de la DGLFLF prévoit trois grands types de ressources, les données de type « corpus » et celles de type « lexique », en donnant à ces deux grandes catégories des définitions très larges, parfois peu consistantes. En tant que linguistes, nous aurions sans doute préféré opposer les données correspondant à la production d’un discours tout-venant et la production de discours descriptifs méta-linguistiques, regroupant les grammaires et ressources portant sur l’inventaire et l’organisation du lexique. Le troisième type identifié regroupe les médias radio17 et réseaux sociaux18 (5 pour le parlanjhe19), notamment des sites web d’associations, de radio, de presse locale, dont on peut signaler qu’ils sont aussi autant de ressources disponibles pour la constitution de corpus écrits, oraux et multimodaux20.
Quoiqu’il en soit nous avons identifié 33 ressources qui sont, pour la plupart, plutôt à concevoir comme des réservoirs permettant, après une série de transformations (extraction, balisage, formatage, renseignement des métadonnées), la constitution de lexiques et de corpus écrits, oraux ou multimodaux. Elles sont réparties comme suit dans les sous-catégories du rapport de 2014 : pour ce qui est des corpus, on trouve « Corpus de texte » (six pour le parlanjhe21), ce à quoi il faut ajouter l’ensemble des ouvrages numérisés dans Gallica ; « Corpus oraux » (quatre pour le parlanjhe22), et « Collections de médias » (sept pour le parlanjhe23). Pour ce qui est des ressources lexicographiques (dictionnaires et glossaires), on peut mentionner qu’il s’agit pour l’essentiel de ressources éparpillées sans structuration particulière, à l’exception du dictionnaire en ligne de Vianney Piveteau (Piveteau 2019a), qui est formaté, balisé et accompagné d’un outil de consultation en ligne.
Le détail de ces ressources, présenté suivant la classification du rapport DGLFLF est disponible à la fin de cet article (cf. Annexe en fin d’article.)
4. Évaluer la vitalité numérique du parlanjhe: les indicateurs du DLDP
Dans le cadre du Digital Language Diversity Project (DLDP, (Ceberio Berger/Gurrutxaga Hernaiz/Baroni/Hicks/Kruse/Kochi/Russo/Salonen/Sarhimaa/Soria 2018), des indicateurs sont établis pour évaluer la vitalité numérique d’une langue. Trois grands types d’indicateurs sont identifiés, qui visent à évaluer (1) la « capacité numérique », à savoir si les accès au réseau Internet sont garantis par les infrastructures aussi bien que par les compétences des utilisateurs ; (2) l’accès à des « ressources », un point central d’évaluation de la vitalité numérique d’une langue ; (3) la « performance numérique », qui regroupe les indicateurs relatifs aux possibilités numériques offertes. Chacun de ces trois groupes est ensuite détaillé en sous-indicateurs. Eux même sont associés à six valeurs Pré-numérique/Dormant/Emergent/En développement/Fort/Robuste,24 attribuées selon un protocole qui n’est pas toujours immédiat à saisir, dans le mesure où ce ne sont pas des points de repère « absolus », mais « relatifs », une valeur haute pouvant être néanmoins la valeur la plus basse de référence. Nous les mentionnerons néanmoins pour les curieux désireux de s’approprier plus à fond ce système d’évaluation de la vitalité numérique.
Nous avons établi cette échelle pour le parlanjhe à partir de nos connaissances du domaine, de l’inventaire des ressources présenté ci-dessus et en interrogeant des locuteurs du parlanjhe. Un questionnaire a été élaboré et réalisé en juillet 2020, exclusivement en ligne à l’aide d’un formulaire Survey Monkey.25 Les informateurs ont été principalement recrutés via nos réseaux, contacts institutionnels, et médias sociaux identifiés autour de la langue. Cette enquête connaîtra une nouvelle version : nous en améliorons le questionnaire et tentons d’élargir l’assiette des locuteurs concernés. Tous les informateurs ayant répondu au 30 novembre 2020, 78 au total, ont déclaré parler le poitevin-saintongeais. La maîtrise du numérique de ces informateurs est simplement garantie par le format numérique du questionnaire. Leurs réponses nous permettront d’incarner les différents résultats obtenus.
- Premier groupe d’indicateurs : la capacité numérique se subdivise en quatre critères :
Capacité numérique | |
Connectivité Internet | 2/2 |
Culture numérique | 1/2 |
Taille de la population numérique | 1/2 |
Codages des caractères | 6/6 |
Résultats obtenus pour l’indicateur Capacité numérique
Le premier des points à évaluer est donc celui de la capacité numérique qui porte autant sur la qualité des infrastructures que sur la taille d’une population disposant de compétences numériques. La possibilité, pour les locuteurs, d’avoir accès à un réseau Internet est incontestablement un préalable au développement numérique d’une langue. Pour autant, si la connectivité internet est bonne dans l’ère linguistique du parlanjhe, il est impossible de savoir précisément la proportion de la communauté disposant de ce qu’on peut qualifier de culture numérique ; et la définition de la « taille de la population numérique », basée sur le nombre de « personnes ayant eu accès au moins une fois à Internet au cours des 12 derniers mois à partir de n’importe quel type d’appareil » ne nous semble pas particulièrement pertinente pour élaborer une représentation de la diffusion d’une culture numérique : quelle culture se met en place avec une connexion par an ? En effet, l’accès au réseau n’implique pas nécessairement que les usagers d’une langue en aient une utilisation active, d’autant plus que les locuteurs du parlanjhe sont pour l’essentiel des personnes âgées vivant dans un milieu rural modeste. Or, nous savons que de nombreuses inégalités existent parmi les français avec comme facteurs principaux le territoire, le niveau de qualification et de revenus et enfin l’âge. Ce constat s’applique donc tout particulièrement à la communauté des locuteurs du parlanjhe : en conséquence, la vitalité numérique de la langue ne peut être vraisemblablement supportée que par une part minoritaire des locuteurs, même s’il existe incontestablement une part de locuteurs ayant les compétences requises pour utiliser les technologies de l’information et de la communication, et ce pour le travail, les loisirs, l’apprentissage et la communication, on peut sans grande marge d’erreur envisager que le potentiel numérique d’utilisation de la langue reste faible.
Pour ces locuteurs disposant d’une culture numérique, la disponibilité des « encodages de caractères » (ASCII, Unicode…) et du clavier azerty rend tout à fait possible l’écriture du parlanjhe (qui s’écrit avec un alphabet latin). Ce qui peut ici ralentir les usages numériques de la langue concerne le système d’écriture, ce dont fait état les réponses à notre questionnaire. À la question sur les difficultés rencontrées par les utilisateurs, sept commentaires sur 19 mentionnent des difficultés à écrire le parlanjhe, avec une remise en cause de la graphie normalisée dans cinq cas : « Je m’exprime principalement à l’oral. jai 65 ans et enfant, le ‘patois’ n’etait pas bien vu à l’ecole, voire interdit! Je participe modestement aux activités d’une association de defense du parlanjhe poitevin-saintongeais, mais l’ecrire reste pour moi assez difficile »26 (Anonyme). Le même constat est établi dans (Hesselbach 2022).
- Deuxième groupe d’indicateurs : l’accès à des ressources, autre prérequis à la vitalité numérique
Ressources | ||
Disponibilité des ressources linguistiques | 3/6 | 2 ressources linguistiques structurées : le corpus textuel TELPOS et le dictionnaire en ligne (Dicciounaere poetevin-séntunjhaes de Pivetea) |
Usages numériques pour la communication interpersonnelle | 3/6 | Utilisation faible des médiums de communication |
Usages numériques sur les médias sociaux | 3/6 | Utilisation faible des médias sociaux |
Médias Internet disponibles | 5/6 | Bonne variété de médias Internet (5 à 6) |
Wikipedia | 1/2 | Pas de Wikipedia |
résultats obtenus pour l’indicateur Vitalité numérique
Nous avons largement abordé le point des ressources nécessaires au développement d’outils de traitement automatique du langage dans la partie précédente (corpus, grammaires, lexiques au format numérique). Si elles demeurent relativement rares, elles sont a priori disponibles en nombre suffisant pour élaborer des applications allant du correcteur orthographique à la traduction automatique. Il est difficile de savoir si leur absence est due au fait que le développement de ces outils ne stimule personne ou si les liens avec la communauté des locuteurs en rendraient de toute façon la diffusion inefficace, ce qui bloque leur apparition. Concernant les « usages numériques pour la communication interpersonnelle et les médias sociaux », le parlanjhe est de plus en plus utilisé en particulier autour d’activités de revalorisation de la langue (Facebook, YouTube…). Néanmoins, les informateurs qui ont déclaré utiliser le parlanjhe pour la communication électronique sont minoritaires : environ un informateur sur trois déclare envoyer des messages (mails, sms, messagerie instantanée…), environ un informateur sur quatre déclare lire et commenter des sites web et communiquer via les réseaux sociaux, et enfin moins d’un informateur sur quatre déclare écouter la radio. Une des difficultés énoncées par nos informateurs concerne la rareté des « médias Internet disponibles ». Notre inventaire fait pourtant état de sites web, de blogs, streaming audio (radio), streaming vidéo (YouTube). Peut-être faudrait-il augmenter notre questionnaire pour savoir si les participants connaissent leur existence, et pour savoir quel type de ressources ils aimeraient trouver. On pourrait par exemple s’atteler à la réalisation d’un Wikipedia (ou de pages Wikipedia) en parlanjhe, leur existence étant considérée comme un indicateur de vitalité numérique (Kornai 2013b, 22), en tant qu’elle est une ressource numérique mais également en tant qu’elle signale un intérêt actif pour la création de contenu numérique.
- Troisième groupe d’indicateurs : la performance numérique, qui regroupe les cinq critères suivants :
Performance numérique | ||
Services Internet | 2/6 | Aucun service internet. |
Réseaux sociaux localisés | 3/6 | Aucune interface traduite. |
Logiciels localisés | 2/6 | Aucun logiciel localisé en parlanjhe. |
Outils / services de traduction automatique | 3/6 | Aucun outil de traduction automatique. |
Domaine Internet dédié | 5/6 | Pas de domaine Internet dédié. |
Résultats obtenus pour l’indicateur Performance numérique
La « performance numérique » regroupe les indicateurs relatifs aux possibilités numériques offertes, comme par exemple les services numériques disponibles (journaux en ligne, logiciel, traduction automatique…). Ceberio Berger/Gurrutxaga Hernaiz/Baroni/Hicks/Kruse/Kochi/Russo/Salonen/Sarhimaa/Soria 2018 nous alertent sur la faible disponibilité d’installations aussi avancées pour la plupart des langues régionales et minoritaires en Europe, liée a) à la non-reconnaissance officielle de ces langues et b) à son faible potentiel commercial. Le parlanjhe se trouve bien dans ce cas, et les cinq indicateurs sont au niveau le plus bas. En effet, rien de ce qui pourrait contribuer à une réelle visibilité de ressources disponibles en parlanjhe n’est disponible à ce jour.
Concernant les « services internet », retenus dans le cadre du DLDP (journaux en ligne, moteurs de recherche, jeux vidéo, applications numériques, sous-titrage vidéo, services de commerce électronique, banque en ligne, musées virtuels, agences de tourisme…), ils ne sont, à notre connaissance, strictement pas développés en parlanjhe à ce jour. Un autre indicateur de performance numérique concerne la présence des médias sociaux (Facebook, Twitter…) avec une interface traduite. Aucune interface de réseaux sociaux n’a été, à notre connaissance traduite en parlanjhe, pourtant cette présence sur les réseaux sociaux pourrait avoir une influence positive sur la perception de la langue comme étant moderne et adaptée à un usage numérique (Cunliffe/Morris/Prys 2013a ; Ceberio Berger/Gurrutxaga Hernaiz/Baroni/Hicks/Kruse/Kochi/Russo/Salonen/Sarhimaa/Soria 2018). Le deuxième indicateur concerne l’existence de « logiciels localisés » (adaptation d’un logiciel pour une langue spécifique avec ajout de composantes spécifiques à la langue et la traduction de l’interface), ce qui a notre connaissance n’est pas le cas pour le parlanjhe. Toutes ces entreprises sont de toute façon impossibles à valoriser pour le parlanjhe dans la mesure où le code pour identifier la langue sur les pages web, les services internet, réseaux sociaux ou logiciels n’existe pas (cf. infra). La langue ne pouvant pas être identifiée sur la toile, elle est aussi de ce fait difficilement visible.
La disponibilité d’outils ou services de traduction automatique est un indicateur fort de la présence numérique de la langue : en effet, disposer d’un tel outil signifie en amont que des ressources de grande taille et de grande qualité (corpus multilingues) sont disponibles. Les ressources aujourd’hui disponibles en parlanjhe (avec des traductions en français) constituent des ressources précieuses en vue du développement d’outils de traduction automatique, même si aucune entreprise de ce genre n’a encore vu le jour.
Enfin, le dernier indicateur concerne l’existence d’un domaine de premier niveau dédié à l’internet, notamment un domaine de premier niveau géographique consacré à une communauté linguistique et culturelle (par exemple .cat et .bhz pour respectivement les communautés linguistiques et culturelles de la catalogne et la bretagne) et du nombre de sites web associés au domaine. Le parlanjhe ne dispose pas d’un domaine de premier niveau géographique.
Le score attribué au parlanjhe est de 2,7 (moyenne de tous les indicateurs), autrement dit le score d’une langue numérique émergente : la langue commence à être utilisée numériquement. La pénétration d’Internet est bonne, une partie des locuteurs sont alphabétisés numériquement. Dans l’ensemble, la langue bénéficie d’un soutien technologique suffisant (par exemple, les polices de caractères et les claviers) et de ressources linguistiques numériques (telles que des dictionnaires électroniques et des collections de textes). La communication électronique (mails, texto, messagerie instantanée) ainsi que les médias sociaux commencent à être utilisés dans la langue, mais pas encore de manière intensive.
5. Conclusion
Dans cet article, nous avons souhaité faire un bilan de la situation du parlanjhe, tant du point de vue sociolinguistique que du point de vue numérique. Du point de vue sociolinguistique, le parlanjhe est une langue en sérieux danger d’extinction et aucune politique actuelle ne vise à inverser cette tendance. Du point de vue numérique, la langue est aussi en sérieux danger d’extinction. Pourtant, le parlanjhe est désormais visible sur les médias sociaux avec des acteurs comme Yannick Jaulin qui créent des vidéos divertissantes et pédagogiques (YouTube, Facebook…). Le web représente une opportunité pour les langues minoritaires, qui, contrairement aux autres médias, offre des espaces gratuits, avec un contrôle limité (Soria/Mariani 2013). Soria et Mariani signalent alors que les technologies du langage sont absolument nécessaires pour toutes les langues qui souhaitent conquérir un espace numérique. En effet, nous observons que des usagers des langues régionales en France se sont saisis des ressources et outils développés dans le cadre du projet RESTAURE,27 notamment pour l’enseignement et la traduction (Bernhard/Bras/Ligozat/Miletic/Sibille/Todirascu/Vergez-Couret 2020), (Bras/Vergez-Couret 2024). Les objectifs du projet visait en premier lieu la sauvegarde et la diffusion d’un patrimoine culturel mais, par rebond, les livrables du projet (corpus, lexiques, outils…) contribuent rendre les langues plus visibles et plus accessibles (création de claviers prédictifs dans le cadre du projet ROLF).
De plus, développer ressources et outils pour le parlanjhe permettrait de répondre, au moins, à deux difficultés mentionnées par les participants du questionnaire : en premier lieu, augmenter les ressources disponibles en valorisant les ressources existantes (cf. Section 3) et en contribuant à la création de nouvelles ressources (par exemple des pages Wikipedia) et par rebond améliorer la visibilité de la langue, tout en contribuant à sa normalisation et son alphabétisation (Forcada 2006). Sur ce point, il s’agit aussi de diffuser des ressources normalisées, qui répondent à des enjeux d’enseignement et de transmission, tout en sortant des débats sans fin introduits par une imposition verticale de la norme. De notre point de vue, les travaux universitaires oeuvrent principalement en vue de la conservation, de la sauvegarde et de la diffusion de la diversité linguistique. C’est ensuite, le rôle des utilisateurs des langues de se saisir, s’ils le souhaitent, des ressources et outils proposés pour l’enseignement, la transmission et la visibilité de la langue (Ministre de la Culture, Dailymotion 2018b).
Quant à la revitalisation du parlanjhe, si elle est entendue comme une inversion de la courbe du nombre de locuteurs, il semble évident que nous ne sommes pas armées sans une véritable politique engagée de la part du gouvernement français, pour créer les conditions de nouvelle transmission de la langue, notamment via son enseignement. En revanche, participer au déploiement de la langue dans l’espace numérique participe à la revitalisation définie comme la tentative d’ajouter de nouvelles formes ou de nouvelles fonctions à la langue, dans le but d’accroître ses usages et ses utilisateurs (King 2001), que ce soit par militantisme ou simplement pour créer des espaces de plaisir aux amoureux et curieux des langues. Mais, même pour répondre à ce défi, il reste encore du chemin à parcourir pour faire reconnaître le parlanjhe comme langue à part, et non pas comme une variante de langues d’oïl. Cette difficulté qui se manifeste encore visiblement dans les consciences, a aussi des implications quant au développement des ressources et outils du point de vue informatique.
Webographie
Délégation Générale à la Langue Française et aux Langues de France, Les technologies de la langue et la normalisation.
Délégation Générale à la Langue Française et aux Langues de France (2013). Rapport du Comite consultatif pour la promotion des langues régionales et de la pluralité linguistique interne, 2013.
Délégation Générale à la Langue Française et aux Langues de France, Cahiers de l'Observatoire des pratiques linguistiques, n°3 Langues de France, langues en danger, aménagement et rôle des linguistes.
Ministère de la Culture, Dailymotion (2018a). Corpus et terrain : constituer des ressources linguistiques par le numérique.
Annexes
Ressources | Poitevin-saintongeais |
Collection de médias | 7 |
Corpus de textes | 6 |
Corpus oral | 4 |
Lexique | 11 |
TV-Radio-Réseaux sociaux | 5 |
Corpus parallèle aligné | ∅ |
Thesaurus/Wordnet | ∅ |
Collections de média (Sources pour des corpus écrits et oraux) :
- Site généraliste multilingue pour les langues d'oïl
- Site web de témoignages sur les patois du Bas-Poitou
- Site web d'UPCP-Metive
- Site web de l’association Parlanjhe vivant
- Site web de l’association Arantéle
- Site web de Radio Poitou
- Site web de l’académie de la langue poitevine pour l'enseignement du poitevin-saintongeais
Corpus de textes (sources pour des corpus écrits) :
- Le subiet : Presse locale numérisée par Gallica (BNF),
- Langues d’oïl : Site généraliste multilingue pour les langues d’oïl,
- Site web de Vianney Pivetea sur la langue poitevine-saintongeaise
- Site web du journal Bernancio en langue poitevine-saintongeaise
- Site web du journal en ligne gratuit des charentais
- Archives en ligne du journal La boulite de Saint Sauvant (86) avec quelques articles en poitevin-saintongeais
Corpus oral (sources pour des corpus oraux) :
- Site web du CERDO,
- La mallette pédagogique du poitevin-saintongeais
- Site web pour l'apprentissage du poitevin-saintongeais Ecoute zou
- Atlas sonore des langues régionales de France, Collection de documents sonores pour les langues régionales de France
- Emission radio diffusée sur RCF (Radio Chrétienne Francophone) Ol ét le moument
Lexique
- Dictionnaire français > poitevin-saintongeais en ligne
- Parler de Bouaine (nord de la Vendée) de Jean-Pierre Morisseau
- Le patois oléronais de Michel Nadreau
- Glossaires des patois et des parlers de l'Aunis et de la Saintonge de Georges Musset sur Gallica (BNF)
- Troospeanet, dictionnaire de patois vendéen
- La couésaille : quelques mots sur la géographie, la cuisine, les vêtements du pays de Retz
- Le parler Saint-Jurien (village du sud de la Vendée) par Jean-Claude Pubert & Christophe Cosson
- Parler gabaye par James Chauveau
- La Nature en parler vendéen d'autrefois
- Glossaire du patois de l'Île d'Elle (marais poitevin) par Augustin Simmoneau sur Gallica (BNF)
- Prénoms poitevin-saintongeais
Réseaux sociaux :
- Le Mooc de Jaulin : chaîne YouTube de vidéos de vocabulaire en poitevin-saintongeais
- Chaîne YouTube de Yannick Jaulin
- Chaîne YouTube d'Eric Nowak
- Blog La plume bleue par Alain Gautron
- Blog Laisse tes bananes
Bibliographie
- Adda/Cartier/Bohbot/Frontini/Schnedecker/Meyer/Dazéas/ar Mogn 2018 = Adda, Gilles / Cartier, Emmanuel / Bohbot, Hervé / Frontini, Francesca / Schnedecker, Catherine / Meyer, Jean-Paul / Dazéas, Bénaset / ar Mogn, Olier (2018): Quels sont les enjeux sociétaux des ressources linguistiques, Dailymotion, Ministère de la Culture.
- Bernhard/Bras/Ligozat/Miletic/Sibille/Todirascu/Vergez-Couret 2020 = Bernhard, Delphine / Bras, Myriam / Ligozat, Anne-Laure / Miletic, Aleksandra / Sibille, Jean / Todirascu, Amalia / Vergez-Couret, Marianne (2020): L’avenir numérique des langues minoritaires : bilan du projet RESTAURE pour l’alsacien, l’occitan et le picard, vol. Cahiers du plurilinguisme européen, 12.
- Besse 1955 = Besse, Joseph (1955): Manuscrit de Pons.
- Boiceau de la Borderie 1572 = Boiceau de la Borderie, Jean (1572): La gente poitevinrie tout de nouvea racoutrie, ou Tabelot bain, et bea : fat raiponse à Robinea lisez sou bain y ve prix, pre vou railly do sotrye, de beacot de Chiguanours qui fasan do moichan tours ; Aveque le preces de Jorget et de son vesin, et chansons jeouses compousi in bea poictevin... et chansons jeouses, Poeters : E. Mesner.
- Boiceau de la Borderie 1646 = Boiceau de la Borderie, Jean (1646): La Gente poictevin'rie... - Rolea divisy in beacot de peces ou l'universeou poictevinea fait pre dialoge, Poeters.
- Bras/Vergez-Couret 2024 = Bras, Myriam / Vergez-Couret, Marianne (2024): 19 Traitement automatique de l’occitan, in: Esher, Louise / Sibille, Jean (Eds.), Manuel de linguistique occitane, Berlin, Boston, De Gruyter, 543-562, ISBN: 9783110733433 (Link).
- Ceberio Berger/Gurrutxaga Hernaiz/Baroni/Hicks/Kruse/Kochi/Russo/Salonen/Sarhimaa/Soria 2018 = Ceberio Berger, Klara / Gurrutxaga Hernaiz, Antton / Baroni, Paula / Hicks, Davyth / Kruse, Eleonore / Kochi, Valeria / Russo, Irene / Salonen, Tuomo / Sarhimaa, Anneli / Soria, Claudia (2018): How to use the digital Language Vitality Scale, The Digital Language Diversity Project Website (Link).
- Cunliffe/Morris/Prys 2013a = Cunliffe, Daniel / Morris, Delyth / Prys, Cynog (2013): Young Bilinguals' Language Behaviour in Social Networking Sites: The Use of Welsh on Facebook, in: Journal of Computer-Mediated Communication, vol. 18, 3, 339-361, _eprint: https://academic.oup.com/jcmc/article-pdf/18/3/339/19492201/jjcmcom0339.pdf (Link).
- Dourdet 2011 = Dourdet, Jean-Christophe (2011): Normalisation graphique : usages et variations, pour qui, pour quoi ? Analyse comparée entre poitevin-saintongeais et occitan limousin, in: Actes du Colloque Standardisation et vitalité des langues de France, AULF-LESCLaP, Amiens.
- Eloy/Jagueneau = Eloy, Jean-Michel / Jagueneau, Liliane: Les langues d'oïl, in: Kremnitz, George (Ed.), Histoire sociale des langues de France, Rennes : Presses universitaires de Rennes.
- Forcada 2006 = Forcada, Mikel (2006): Open-source machine translation: an opportunity for minor languages.
- Gauthier/Perraudeau 2003 = Gauthier, Pierre / Perraudeau, Gilles (232003): Langue et littérature: la langue régionale : Les parlers vendéens dans l’espace linguistique poitevin-saintongeais, in: Bonneton, Christine (Ed.), Vendée, Encyclopédie Bonneton, Le Puy:Bonneton.
- Gautier 1993 = Gautier, Michel (1993): Grammaire du poitevin-saintongeais, Mougon : Geste Éditions.
- Goebl 2003c = Goebl, Hans (2003): Regards dialectométriques sur les données de l’Atlas linguistique de la France (ALF): relations quantitatives et structures de profondeur, in: Estudis Romànics 25, 59-121.
- Hesselbach 2022 = Hesselbach, Robert (2022): À propos d’une langue pont: perspectives meta-/sociolinguistiques sur le poitevin-saintongeais, in: Jannis Harjus, Nora Zapf (Ed.), Forum Junge Romanistik, vol. 26, München, AVM Verlag, 159-173, ISBN: 978-3-95477-132-5.
- Horiot/Massignon 1971-1983 = Horiot, Brigitte / Massignon, Geneviève (1971-1983): Horiot, B. & Massignon, G. (1971-1983). L’Atlas Linguistique et Ethnographique de l'Ouest, vol. 3, Paris, Editions du CNRS.
- Jagueneau 1994 = Jagueneau, Liliane (1994): Les Traits linguistiques du poitevin-saintongeais. La langue poitevine saintongeaise: identité et ouverture, La Crèche: Geste éditions.
- Jagueneau 1999 = Jagueneau, Liliane (1999): Le parlanjhe de Poitou-Charentes-Vendée en 30 questions, La Crèche: Geste éditions.
- Jagueneau 2015 = Jagueneau, Liliane (2015): Une graphie commune pour le poitevin-saintongeais, entre pragmatisme et innovation, in: Journée d'étude « Dialectes d’oïl, oralité et écriture : points de vue sociolinguistiques (Approches, théories, pratiques), CNRS à Villejuif (Paris).
- Jocelyn 2007 = Jocelyn, Pierre (2007): La langue au coeur du numérique : les enjeux culturels des technologies de la langue, Délégation Générale à la Langue Française et aux Langues de France (Link).
- King 2001 = King, Kendall A (2001): Language revitalization processes and prospects: Quichua in the Ecuadorian Andes, vol. 24, Multilingual Matters.
- Kornai 2013b = Kornai, András (2013): Digital Language Death, in: PLOS ONE, vol. 8, 10, Public Library of Science, 1-11 (Link).
- Lacuve 1899 = Lacuve, M.-R. (1899): Une brasserie de contes en bia langage poitevin.
- Lay/Duchet 2012 = Lay, Marie-Hélène / Duchet, Jean-Louis (2012): VariaLog: how to locate words in Early Modern Stages of French and English, in: Actes de EEBO-TCP conference 2012, Oxford.
- Lay/Pincemin 2010 = Lay, Marie-Hélène / Pincemin, Bénédicte (2010): Pour une exploration humaniste des textes : AnaLog, in: Bolasco, Sergio / Chiari, Isabella / Giuliano, Luca (Eds.), Statistical Analysis of Textual Data -Proceedings of 10th International Conference JADT 2010, Roma, Italy, Edizioni Universitarie di Lettere Economia Diritto, 1045-1056 (Link).
- Leixa/Mapelli/Choukri 2014 = Leixa, Jérémy / Mapelli, Valérie / Choukri, Khalid (2014): Inventaire des ressources linguistiques de langues de France, Organisme ELDA, ms. pour la DGLFLF.
- Nowak 2010 = Nowak, Eric (2010): Histoire et géographie des parlers poitevins et saintongeais, Cressé: Éditions des Régionalismes.
- Piveteau 2019a = Piveteau, Vianney (2019): Dictionnaire français poitevin-saintongeais, Geste édition.
- Soria/Mariani 2013 = Soria, Claudia / Mariani, Joseph (2013): Searching LTs for minority languages (Link).
- Terracher 1926a = Terracher, Louis Adolphe (11926): La rencontre des langues entre Loire et Dordogne, in: Le Centre Ouest de la France, encyclopédie régionale illustrée, vol. Tome 8, Toulouse: Occitania, 1-384.
- Valière 1984 = Valière, Michel (1984): Amours paysannes, récit d’une vie de Galerne, Geste Editions.