Im November 2012 fand an der Berliner Humboldt-Universität eine Tagung statt, auf der Erfahrungen aus 20 Jahren digitaler Sprachgeographie ausgetauscht wurden; es hat sich also bereits eine ganz ansehnliche Forschungstradition entwickelt. Dennoch gibt es mittlerweile durchaus Neues zu berichten. Denn am 1. Oktober 2014 startete das Projekt VerbaAlpina (VA) mit einer von der DFG bewilligten initialen dreijährigen Förderphase.
Im Focus der Projektarbeit stand von Anbeginn ein neuer methodischer Gesichtspunkt: das Konzept einer ganz konkreten Vernetzung, die in mehrfacher Weise zum Tragen kommen sollte und inzwischen auch realisiert wurde. Sie erfolgt natürlich zunächst auf dem Terrain des primären Interesses, das den im Alpenraum verbreiteten Sprachdaten gilt; VA hat die einschlägigen bereits publizierten Quellen - Sprachatlanten und lokale Wörterbücher - durch Retrodigitalisierung vernetzt und kann so verborgene Verbindungslinien zwischen den romanischen, germanischen und slawischen Alpendialekten sichtbar machen. Da in den Alpen die drei großen europäischen Sprachfamilien, die romanische, die germanische und die slawische seit anderthalb Jahrtausenden in Kontakt stehen, ist die Quellenvernetzung durch Retrodigitalisierung gleichzeitig eine Sprachvernetzung nach dem Prinzip einer interlingualen Geolinguistik. Die Vernetzung von dialektalen Primärdaten aus unterschiedlichen Sprachen geht übrigens einher mit der Vernetzung mehrerer Beschreibungs- und Navigationssprachen (Deutsch, Français, Italiano, Rumantsch Grischun, Slovenščina) und damit zwangsläufig - daran denkt man nicht sofort - mit der Vernetzung unterschiedlicher Forschungstraditionen in Gestalt divergierender Transkriptionssysteme, die in einer sehr umfangreichen Codepage zusammengeführt und in IPA konvertiert werden. Da sich VA jedoch nicht mit bereits gedruckt vorliegenden historischen Quellen begnügt, sondern auch aktuelle Daten erhebt, werden neben den dokumentierten Sprachen auch ihre aktiven Sprecher vernetzt.
Die multiplen Vernetzungsleistungen werden zeitgemäß in einer online-Datenbank bewältigt, womit sogleich die Perspektive der Vernetzung im technischen Sinn eine Rolle zu spielen beginnt. Einmal im Internet verfügbare Daten schreien förmlich danach, mit anderen dort vorhandenen Daten verknüpft und kombiniert zu werden, wobei VA stets ein bidirektionales Szenario vor Augen hat, bei dem eigene Daten in fremde integriert und fremde in die eigenen eingebettet werden. Selbstverständlich muss ein derartiges Verfahren unter strikter Einhaltung der wissenschaftlichen "Spielregeln" erfolgen, die grundsätzlich die eindeutige Dokumentation der jeweiligen Urheberschaft von Daten verlangt. Es ist hervorzuheben, dass eine Vernetzung nicht zwingend zu einer Änderung der individuellen Datenstrukturen, Workflows und Methoden führen muss. Kompatibilität kann stets durch generische oder auch spezifische Schnittstellen hergestellt werden.
Die Datenbankarchitektur wurde so konzipiert, dass sie eine ganz direkte Vernetzung mit anderen digitalen Partnerprojekten gestattet, für die auf Wunsch jeweils eigene Datenbanken eingerichtet werden: die jeweiligen Daten werden allen Partnern zum Download zur Verfügung gestellt; kein Partner hat jedoch die Möglichkeit, die Daten der anderen Partner ungefragt zu modifizieren. Einen Überblick über die wichtigsten Datenbestände von Partnern und aus älteren gedruckten Quellen gibt die folgende, interaktive Live-Daten-Visualisierung1:
Es ist nun klar, dass neben der inhaltlichen und technischen Vernetzung auch die Vernetzung auf der Ebene der persönlichen, menschlichen Kontakte eine ganz wesentliche Rolle spielt - nicht zuletzt, um die Herausforderungen zu besprechen, die sich im Zusammenhang mit der inhaltlichen und technischen Vernetzung der Sprachdaten ergeben. Dem entsprechenden Austausch diente das erste Arbeitstreffen von VA mit seinen Kooperationspartnern im Juni 2016. Von den zahlreichen Partnern, mit denen VA offizielle Kooperationsvereinbarungen geschlossen hat, nahmen Vertreter von insgesamt 15 Institutionen aus Deutschland, Frankreich, Italien, Österreich, der Schweiz und Slowenien teil. Während des zweitägigen Treffens wurden im Senatssaal der Ludwig-Maximilians-Universität München eine Reihe interessanter Vorträge gehalten, die zusammengenommen einen guten Überblick über die verschiedenen aktuellen Projekte sowie die damit verfolgten Interessen und die angewandten Methoden auf dem Gebiet der digitalen Geolinguistik dokumentierten. Insgesamt sechs der auf dem Arbeitstreffen gehaltenen Vorträge können nun in ausgearbeiteter Form im vorliegenden Band 6 der KiT-Reihe präsentiert werden. Drei davon behandeln Sprachatlanten (David Gschösser/Julia Schönnach, Jožica Škofic und Hans Goebl), je zwei Wörterbücher (Rosemarie Lühr und Ursin Lutz) und Projekte aus dem Bereich der Toponymie (Federica Cusan und Claudine Fréchet). Damit sind die drei tragenden Säulen der geolinguistischen Forschung vertreten; auf die erste und zweite stützt sich VA - die umfassende und vernetzte Digitalisierung der dritten markiert, auch über VA hinaus, ein überaus komplexes Desiderat.
Welch große Bedeutung VA speziell der durch die technische Entwicklung erleichterten bzw. gar erst ermöglichten Vernetzung von Daten beimisst, wurde bereits deutlich. Die konsequente Umsetzung des Konzepts der Vernetzung zeigt jedoch auch Folgen für die Kultur der wissenschaftlichen Publikation. Die Präsentation von Texten im Internet erlaubt die nahezu unmittelbare Referenzierung auf bzw. gar die direkte Einbindung von Daten und Inhalten, die anderwärts im Internet verfügbar sind. Dies gilt jedoch nur in eingeschränktem Maß für Textdateien im PDF-Format, das sich zwischenzeitlich als Quasi-Standard auf dem Gebiet des wissenschaftlichen Publikationswesens etabliert hatte. Wir empfinden die mit dem PDF-Format verbundenen Einschränkungen als lästig und angesichts der Alternative einer genuinen Web-Publikation auf Basis von HTML/CSS als unnötig. In letzter Konsequenz stellt diese innovative Form der Publikation auch die traditionelle Unterscheidung zwischen 'Forschungsdaten' einerseits und darauf aufbauendem analytischen Text, der 'Publikation' im herkömmlichen Verständnis, andererseits grundsätzlich in Frage (vgl. Krefeld/Lücke 2017a). Die Reihe KiT möchte einen Beitrag zur Etablierung dieser von uns für zeitgemäß und vorteilhaft empfundenen Form der wissenschaftlichen Publikation leisten, und die Veröffentlichung des vorliegenden Tagungsbandes in dieser Reihe ist als ein Statement zu verstehen, das andere motivieren möge, sich ebenfalls in diese Richtung zu bewegen.
Zwischenzeitlich wurde VA die Förderung durch die DFG um weitere drei Jahre bewilligt. Wir werden den beschrittenen und mittlerweile bewährten Weg daher weiter verfolgen und freuen uns auf das zweite Treffen mit möglichst vielen unserer zahlreichen Projektpartner, das für die Mitte der zweiten Förderphase im Jahr 2019 geplant ist.
Thomas Krefeld und Stephan Lücke im Januar 2018
Bibliographie
- Krefeld 2017d = Krefeld, Thomas (2017): Interlinguale Geolinguistik, VerbaAlpina-de 17/2 (Link).
- Krefeld/Lücke 2017a = Krefeld, Thomas / Lücke, Stephan (2017a): Nachhaltigkeit – aus der Sicht virtueller Forschungsumgebungen, in: Korpus im Text (Link).
- Lücke 2017a = Lücke, Stephan (2017): Codepage, VerbaAlpina-de 17/2 (Link).