L’idéal et la réalité de la géolinguistique virtuelle (présentation)







Abstract

Dolores Huerta,

 

Motto: "¡Sí se puede!"
Dolores Huerta (Link

Une version élaborée de cette présentation se trouve sur
<https://www.kit.gwi.uni-muenchen.de/?p=121769&v=0>.

1. La mission idéale de la géolinguistique

les sciences du langage et la géolinguistique
progrès méthodologique au niveau empirique une augmentation des données (ling.)
au niveau théorique une modélisation plus différenciée de l'objet (ling.)
au niveau des médias  une intégration des technologies de l'internet (société en gén.)

1.1. La base empirique

Petite partie de la représentation géolinguistique actuelle de l'espace roman

World Atlas of’ Linguistic Structures (WALS)

les atlas linguistiques = une mission inaccomplie et impossible à accomplir

⇒ l’espace = une source continue et inépuisable de variation

1.2. L’approche théorique

  • les nombreux atlas: peu comparables à plusieurs égards
  • une différence fondamentale: l'orientation ethnolinguistique établie par l'AIS (et stimulé par Hugo Schuchardt; cf. Krefeld 2024c)
atlas orientation ethnolinguistique
ALF -  
AIS   +
atlas fra. régionaux   +
ALD -  
APV/1   +
Quelques atlas linguistiques romans et l’orientation ethnolinguistique
  • WALS: hétérogène du point de vue théorique
  • surtout: redéfinition (erronée) de ‘dialect(ologi)e

⇒ illusion de dimensions variationnelles équivalentes (diatopique, diastratique, diaphasique, diamesique etc.)

  • dialectologie pluridimensionelle; appliquée dans peu de projects d'atlas (par ex. l’ADDU, l’ALS et l’AsiCa2ALiB)
  • nouveau défi: la variation diatopique au niveau des variétés standard

⇒ indispensable: une masse très importante de nouvelles données empiriques
multiplication des informatrices/informateurs

  • conception adéquate de l’espace (‘espace communicatif’; cf. Krefeld 2023a)

savoir linguistique des locuteurs/locutrices
(cf. Krefeld/Pustka 2024a,Krefeld/Pustka 2024b)
(a) procédural (‘produire la parole’) (b) déclaratif (‘commenter la parole’)
dialectologie/linguistique perceptive (cf. Long/Preston 2002, Long/Preston 2003, Krefeld/Pustka 2010a)
  • une forte diversification de la recherche linguistique consacrée à la variation dans l'espace

1.3. Mise en œuvre des médias ou:  l’intégration des technologies de l'internet

  • publications imprimées = objets: fermés, statiques, conservés en biliothèque, rares

Les linguistes en route - d'un atlas à l'autre

    • médias éphémères:
      - phonogramme
      - disque (pionnier Ferdinand Brunot, Archives de la parole (1911-1913), cf. Hafner 2006, 28-34
      - cd rom (pionnier: l’ALD, depuis sa première conception en 1972 (cf. Goebl), ALD I-DVDRuffino 1997)
  • publications virtuelles: procédurales, dynamiques
  • rapport entre les activités de recherche et la publication complètement changé (cf. Krefeld 2023j)
    • recherche traditionnelle: publication = objectif du travail
    • recherche basée sur technologie web: toutes les activités = en public et en coopération
  • options:
      • collecte de données par internet
        - contact avec les informateurs prolongé
        - enquête à plusieurs, voire à de nombreux lieux en même temps  
      • nouvelles données collectées agrégées avec les données déjà disponibles
        ⇒ corpus de référence ouverts, dynamiques et intégrant (cf. Krefeld/Lücke 2023)
      • données reliées à des services web externes au projets
      • coop. avec nombreux partenaires scientifiques, en partageant les même banques de données
      • accès aux dates et aux analyses de la recherche partout, (exclusivité des sites des bibliothèques dépassée)
      • recherche universitaire radicalement démocratisée: accès aux scientifiques et au public intéressé

formule idéale pour la mission de la géolinguistique virtuelle:

observatoire internet permanent, correspondant aux options nommées

composantes essentielles d’un tel portail:

Composantes d'un espace internet collaboratif pour la géolinguistique

  • maxime: les données d’abord
    • transformer chaque donnée en objet numérique autonome
      • exemple d’application: utiliser les matériaux audio de l’AMDV pour  les comparer avec des données de la variété migratoire brésilienne talian (Monachesi Gaio 2018) (études perceptives e.a.)

1.3.1. conditio sine qua non: les principes FAIR

de nature technique, mais aussi juridique (cf. Krefeld/Lücke 2023a)

  • F — Findable
  • A — Accessible
  • I — Interoperable
  • R — Reusable

La géolinguistique virtuelle en nuage

  • conditions pour la géolinguistique idéale: réalisables et déjà réalisées en grande partie.

2. La réalité géolinguistique ou: l’héritage de VerbaAlpina

  • projet lexicologique conçu et réalisé exclusivement sur la base de technologie internet
    • cartographie purement virtuelle
  • vocabulaire des dialectes alpins
    • mettre en évidence la stratigraphie historique de l’espace alpin
  • dialectes appartenant aux trois grandes familles de langues européennes (romane, germanique et slave; cf. Krefeld 2023k)
  • domaines lexicaux: alpage, produits laitiers, faune, flore, formations du terrain
  • plusieurs sources empiriques (cf. la carte des sources):
    • des propres enquêtes via internet (Participer)
    • des atlas linguistiques français, suisses, italiens, allemands, autrichiens et slovènes , en parties leurs entières bases de données, par ex. dans le cas du  ALD
    • des dictionnaires dialectaux géo-localisables (DRG, GPSR,  VSIDizMT )
  • atlas plurilingue: solutions méthodologiques spécifiques
    • organisation des données, regroupement des nombreuses variantes
    • double logique de regroupement
      • selon les signifiants, ou: semasiologique
      • selon les concepts désignés, ou: onomasiologique

2.1. Piste semasiologique

  • diachronique

(1) types morpho-lexicaux constitués de
- variantes phonétiques de la même origine
- catégories morphologiques en commun (catégorie verbale, genre, affixes formatifs)
- toutes les variantes d’un type morpho-lexical: même famille de langue
- lemmatisation (i): variante standard plus diffuse (variantes françaises et/ou italiennes)
ex. diffusion du type fr. fromage/it. formaggio, ‘roa.’  (= ‘roman’)  selon le codage des langues/dialectes établi par ISO 639 (http://www.infoterm.info/standardization/iso_639_1_2002.php).

Diffusion du type fromage/formaggio (roa.); carte originale interactive sur VerbaAlpina <https://www.verba-alpina.gwi.uni-muenchen.de/fr?page_id=18&db=232&tk=5109>)

- lemmatisation (ii): variantes standard d’une langue moins diffuse (romanche, ladin); ex. type chaschöl ‘fromage’ (< lat. caseolus), forme lemmatisé reprise du DRG:

Diffusion du type chaschöl 'fromage'; carte originale interactive sur VerbaAlpina (<https://www.verba-alpina.gwi.uni-muenchen.de/fr?page_id=18&db=232&tk=5115>).

- lemmatisation (iii): definie par VerbaAlpina
- variantes lemmatisée (i), (ii): connectées avec des entrées correspondantes dans un dictionnaire de référence disponible online   

(2) types de base consistués de
- type lexical (év. plusieurs)
- emprunts du même type
- lemmatisation: par formes représentant la base étymologique
- exemple pour attribution des types à une attestation du type morpho-lexical fromage/formage:

Une attestation avec types attribués (carte originale interactive sur VerbaAlpina <https://www.verba-alpina.gwi.uni-muenchen.de/fr?page_id=18&db=232&tk=5118>)

types (1) et (2): suffisant pour mettre en évidence deux relations diachroniques:

  • cognats, développements historiques au cours de l’histoire d’une (famille de) langue (p.ex. latin > ancien français >   français moderne)
  • emprunts des variantes dans uns autre langue

ex. type de base lat. caseu(m) ‘fromage’, très diffus dans les dialectes germaniques (cf. all. standard Käse):

Diffusion du type de base lat. caseu(m) dans les domanines roman et germaniques (carte originale interactive sur VerbaAlpina <https://www.verba-alpina.gwi.uni-muenchen.de/fr?page_id=18&db=232&tk=5121>)

2.2. Piste onomasiologique

  • unités de référence universelles, indépendantes des langues et souvent aussi des époques historiques
    • ne pas référencées par des dictionnaires, mais par des encyclopédies
    • VerbaAlpina:  option offerte par la Wikimedia Foundation, le projet Wikidata
      • base de connaissance (angl. knowledge base) très riche construite
        - essentiellement avec des identifiants uniques des entrées de l’encyclopédie Wikipedia
        - identifiants (Q-ID): les constantes commune des différentes versions linguistiques de Wikipédia ayant un objet identique
        - ex. FROMAGE: entrées Wikipédia en 173 langues (au 02.09.2024), identifiant commun (
        Q10943)
        - combination des Q-IDs en forme de triplets  (web sémantique)
        - très utiles pour relier différentes sources de données; trouvables par des moteurs de recherche
        - ex.
        une attestation du type morpho-lexicale tomme/toma FROMAGE (clique sur l'icône de Wikidata → Q-ID de FROMAGE):

Le chemin d'une attestation au concept lié à son identifiant Wikidata (carte originale interactive de Wikipedia sur <https://www.verba-alpina.gwi.uni-muenchen.de/fr?page_id=18&db=232&tk=5124>)

  • si necéssaire: rajouter des identifiants Wikidata
  • enrichir la base de connaissance au maximum pour les objectifs de la (géo)linguistique
    • pas seulement pur des concepts lexicaux mais pour n'importe quelle catégorie langagière et linguistique

2.3. Les limites de la réalisation

  • réalisation de l'idéal géolinguistique virtuel empêchée par des raisons économiques, institutionnelles et politiques
  • le plus gros problème (dans la perspective allemande): la recherche sous forme de projets
    • par définition limités dans le temps
    • question existentielle: le destin des résultat après la fin du financement
  • chaque projet: réponse particulière
  • la résponse de VerbaAlpina (cf. Krefeld/Lücke 2023b):
domaines du projet perspective de durabilité
  • données structurées (relationelles; MySQL)
        • rétro-numérisées
        • partagées par partenairers du  project
        • augmentées par production participative (crowd sourcing)
  • précaire ; dépendant de
        • navigateurs (web browsers)
        • services internet externes (e.g. stamen)
problématique: liens externes
  • la lacune: une perspective disciplinaire pour tous les projets géolinguistiques
    • institution durable pour héberger le portail idéal esquissé
    • investissement pas excessif, mais avec modération permanente (pour réagir aux mises à jour imprévisibles des navigateurs/web brouwsers
  • solution éventuelle (ne pas aberrante du tout): dans le cadre de la Wikimedia Foundation
    • intégrer les formes dialectales dans Wikidata
    • LIDs
    • formuler des triplets pour représenter des relations diachroniques (cognat, emprunt)
    • géo-localisations possibles → visualisation cartographique
      • exemple: recherche d’un identifiant léxical (LID) à l'aide du préfixe ‘lexeme’ → ’lexeme:fromage’ :

Un identifiant lexical de la base Wikidata (source <https://www.wikidata.org/w/index.php?title=Lexeme:L26909&oldid=1767691941>)

Bibliographie

  • ADDU = Thun, Harald / Elizaincín, Adolfo (2000-): Atlas lingüístico diatópico y diastrático del Uruguay, Kiel, Westensee.
  • AIS = Jaberg, Karl / Jud, Jakob (1928-1940): Sprach- und Sachatlas Italiens und der Südschweiz, vol. 8 vol., Zofingen, Ringier, Reprint: Nendeln: Krauss 1971 (Link).
  • ALD = Goebl, Hans / Bauer, Roland / Haimerl, Edgar (Hrsgg.) (1998-2002): (ALD) Atlant linguistich dl ladin dolomitich y di dialec vejins. Atlante linguistico del ladino dolomitico e dei dialetti limitrofi. Sprachatlas des Dolomitenladinischen und angrenzender Dialekte, vol. Part I: 4 voll., Wiesbaden, Reichert, 3 CD-ROMs, 1 DVD.
  • ALD I-DVD = Goebl, Hans (Hrsg.) (2002): Sprechender Sprachatlas: vollständige Edition, Karten 1-884. Sprachatlas des Dolomitenladinischen und angrenzender Dialekte, 1. Teil, Salzburg, Universität - Institut für Romanistik (Link).
  • ALF = Gilliéron, Jules / Edmont, Edmond (Hrsgg.) (1902-1910): Atlas linguistique de la France (ALF), vol. 10 vol., Paris, Champion, Reprint: Bologna: Forni 1968 (Link).
  • ALiB = Cardoso, Suzana Alice Marcelino da Silva / Mota, Jacyra Andrade / Aguilera, Vanderci de Andrade / Aragão, Maria do Socorro Silva de / Isquerdo, Aparecida Negri / Razky, Abdelhak / Margotti, Felício Wessling / Altenhofen, Cléo Vilson (2014-): Atlas linguístico do Brasil, Londrina, Eduel (Link).
  • ALS = Ruffino, Giovanni (Hrsg.) (1991-): Atlante linguistico della Sicilia, Palermo, Centro di studi filologici e linguistici siciliani.
  • AMDV = Tisato, Graziano (Hrsg.) (2014): Multimedia Atlas of Veneto Dialects, Padova (Link).
  • APV/1 = Favre, Saverio / Raimondi, Gianmario (Hrsgg.) (2020): Atlas des patois valdôtains - Le lait et les activités laitières, vol. 1, Arvier, Le Château.
  • AsiCa2 = Englmeier, Tobias / Gacia, Veronika / Krefeld, Thomas / Lücke, Stephan (2019): Atlante sintattico della Calabria rielaborato (Asica2), München, LMU (Link).
  • Auer/Schmidt 2010 = Auer, Peter / Schmidt, J{\"u}rgen Erich (2010): Language and Space. Volume 1: Theories and Methods, in: Handbooks of Linguistics and Communication Science, s.l., Mouton de Gruyter (Link).
  • Coseriu 1988 = Coseriu, Eugenio (1988): Einführung in die Allgemeine Sprachwissenschaft, Tübingen, Francke.
  • Cugno/Massobrio 2010a = Cugno, Federica / Massobrio, Lorenzo (2010): Atlanti linguistici, in: Enciclopedia dell'Italiano (Link).
  • Cugno/Massobrio 2010b = Cugno, Federica / Massobrio, Lorenzo (2010): Gli atlanti linguistici della Romània, Alessandria, Edizioni dell'Orso.
  • DizMT = Grassi, Corrado (2009): Dizionario del dialetto di Montagne di Trento, San Michele all'Adige.
  • DRG = Melcher, Florian / De Planta, Robert (Hrsgg.) (1939-): Dicziunari Rumantsch Grischun, Cuoira, Società Retorumantscha (Link).
  • Goebl = Goebl, Hans: Vorstellung der beiden Teile des ALD (ALD-I und ALD-II), in: Krefeld/Lücke 2018 (Link).
  • GPSR = Gauchat, Louis (1924-): Glossaire des patois de la Suisse romande, Genève, Droz.
  • Hafner 2006 = Hafner, Jochen (2006): Ferdinand Brunot und die nationalphilologische Tradition der Sprachgeschichtsschreibung in Frankreich, Tübingen, Narr.
  • Harjus/Meisnitzer 2024 = Harjus, Jannis / Meisnitzer, Benjamin (Hrsgg.) (2024): Representações e perceções das variedades portuguesas no mundo lusófono, Berlin, Lang.
  • Heinz/Hinzelin/Filipponio forthcoming = Heinz, Matthias / Hinzelin, Marc-Olivier / Filipponio, Lorenzo (Hrsgg.) (forthcoming): Manual of Classification and Typology of the Romance Languages, Berlin, De Gruyter.
  • Idiotikon 1881 = Idiotikon, Schweizerisches (1881): Wörterbuch der schweizerdeutschen Sprache, in: Begonnen von Staub F. und Tobler L. Bearb. von Bachmann A. Bd. I—XIV. Frauenfeld.
  • Krefeld 2021e = Krefeld, Thomas (2021): Italienische Ethnolinguistik, in: Vorlesung dh-lehre, München, LMU (Link).
  • Krefeld 2023a = Krefeld, Thomas (32023): Sprecher:innen, Gemeinschaften – und Grenzen? Zur Modellierung des kommunikativen Raums, in: Korpus im Text, Serie A, 84354, München (Link).
  • Krefeld 2023j = Krefeld, Thomas (2023): Publication, in: Méthodologie, VerbaAlpina-fr 23/2 (Link).
  • Krefeld 2023k = Krefeld, Thomas (2023): Langues et familles linguistiques dans les Alpes, in: Méthodologie, VerbaAlpina-fr 23/2 (Link).
  • Krefeld 2023m = Krefeld, Thomas (2023): Stratigraphie, in: Méthodologie, VerbaAlpina-fr 23/2 (Link).
  • Krefeld 2024c = Krefeld, Thomas (2024): Hugo Schuchardt - und die romanischen Sprachatlanten, in: Füreder et al., 231-241.
  • Krefeld/Lücke 2018 = Krefeld, Thomas / Lücke, Stephan (2018): Kommunikative FAIRness in der Sprachwissenschaft (Bewerbung um den Communicator-Preis der DFG), in: VerbaAlpina, München (Link).
  • Krefeld/Lücke 2023 = Krefeld, Thomas / Lücke, Stephan (2023): Sketching out a Virtual Framework for Romance Geolinguistics,, in: Weiland / Quijada van den Berghe / Pustka (2023).
  • Krefeld/Lücke 2023a = Krefeld, Thomas / Lücke, Stephan (2023): FAIRNESS – Medien im methodologischen Zentrum der Geolinguistik, in: Krefeld/Lücke/Mutter 2023, München (Link).
  • Krefeld/Lücke 2023b = Krefeld, Thomas / Lücke, Stephan (2023): What will remain of VerbaAlpina?, in: Korpus im Text, Serie A, vol. 111124, München (Link).
  • Krefeld/Lücke/Mutter 2023 = Krefeld, Thomas / Lücke, Stephan / Mutter, Christina (Hrsgg.) (2023): Berichte aus der digitalen Geolinguistik (II): Vernetzung und Nachhaltigkeit, in: Korpus im Text 9, München, LMU (Link).
  • Krefeld/Pustka 2010a = Krefeld, Thomas / Pustka, Elissa (2010): Für eine perzeptive Varietätenlinguistik, in: Krefeld, Thomas / Pustka, Elissa (Hrsgg.), Krefeld/Pustka 2010c, 9-28.
  • Krefeld/Pustka 2024a = Krefeld, Thomas / Pustka, Elissa (2024): A cognitive approach to language varieties, in: Meisnitzer/Harjus 2024, 37-56.
  • Krefeld/Pustka 2024b = Krefeld, Thomas / Pustka, Elissa (2024): Uma abordagem cognitiva de variedades linguísticas, in: Harjus/Meisnitzer 2024, 57-77.
  • Lameli 2010 = Lameli, Alfred (2010): Linguistic atlases. Traditional and Modern, in: Auer/Schmidt 2010, 567–592.
  • Long/Preston 2002 = Long, Daniel / Preston, Dennis R (2002): Handbook of perceptual dialectology, vol. 2, John Benjamins Publishing.
  • Long/Preston 2003 = Long, Daniel / Preston, Dennis (Hrsgg.) (2003): Handbook of Perceptual Dialectology II, Amsterdam, John Benjamins Publishing.
  • Monachesi Gaio 2018 = Monachesi Gaio, Mario Luis (2018): L’italiano in Brasile, in: Thomas Krefeld & Roland Bauer (a cura di), Lo spazio comunicativo dell’Italia e delle varietà italiane. Korpus im Text. Versione 4, online, LMU (Link).
  • REWOnline 2022 = REWOnline (2022): Zacherl, Florian: Digitale Aufbereitung des Romanischen etymologischen Wörterbuches von Wilhelm Meyer-Lübke, München (Link).
  • Ruffino 1997 = Ruffino, Giovanni (Hrsg.) (1997): I giochi fanciulleschi tradizionali. I nomi della trottola e la memoria del gioco. Carte geolinguistiche con una carta sonora su CD-ROM e una guida ai testi e ai rilevamenti linguistico-etnografici, Palermo, Centro di studi filologici e linguistici siciliani.
  • Tisato/Vigolo 2016 = Tisato, Graziano / Vigolo, Maria Teresa (2016): Dagli Atlanti storici agli Atlanti multimediali: il NavigAIS e l'AMDV (Atlante Multimediale dei Dialetti Veneti), in: Francesco Avolio e Antonino Cigno ed. - Atti del Convegno Internazionale di Studi - Archivi Etnolinguistici Multimediali, Pescara, Museo delle Genti d’Abruzzo, 96-123.
  • Tosques 2014 = Tosques, Fabio (Hrsg.) (2014): 20 Jahre digitale Sprachgeographie (Tagungsband Berlin 02. bis 03. November 2012), Berlin, Humboldt-Universität (Link).
  • VSI = Sganzini, Silvio (1952-): Vocabolario dei dialetti della Svizzera italiana., Lugano, Tipografia la Commerciale.
  • WALS = Dryer, Matthew / Haspelmath, Martin (Hrsgg.) (2013): The World Atlas of Language Structures Online, Leipzig, Max Planck Institute for Evolutionary Anthropology, Accessed on 2018-04-20 (Link).
  • Zacherl 2022b = Zacherl, Florian (2022): Digitale Tiefenerschließung traditioneller Lexikographie - am Beispiel des Romanischen Etymologischen Wörterbuchs, LMU.

Schreibe einen Kommentar