Web- und Zeitungskorpora für die Erfassung von regionalen Sprachvarianten







Abstract

Die Kernaufgabe der Projektgruppe des DWDS besteht darin, den in den Korpora enthaltenen Wortschatz lexikografisch und korpusbasiert zu beschreiben. Zu diesem Zweck bieten wir auf der DWDS-Plattform neben den Referenzkorpora eine Reihe von Spezialkorpora an.

Seit einigen Monaten sind zwei Web- und Zeitungskorpora nach Anmeldung verfügbar, die sich der Erfassung von regionalen Varianten widmen. Auf der Basis von einem Arealkonzept werden diese Sprachdaten mit Metadaten versehen, die eine diatopische Differenzierung bei Suchabfragen und Ergebnisdarstellungen ermöglichen:

– Das ZDL-Regionalkorpus ist ein Korpus mit Artikeln aus Lokal- und Regionalteilen deutscher Tageszeitungen, mit dessen Hilfe regionale Variation im deutschen Gebrauchsstandard untersucht werden kann.

– Das Webmonitorkorpus ist ein Korpus aus prominenten Online-Nachrichten. Ungefähr 90 Quellen, die explizite Regionalteile aufweisen, sind so wie im Regionalkorpus abfragbar. Neben zusätzlichen Ortspunkten für Deutschland sind auch Daten für Österreich, die Schweiz, Italien (Südtirol), Belgien (Ostbelgien), Luxemburg und Liechtenstein abfragbar.

Dieser Vortrag wird die DWDS-Plattform vorstellen, den Aufbau solcher Sprachressourcen erörtern und konkrete Beispiele für die erwähnten Korpora zeigen.

Schreibe einen Kommentar