Wikimoldia – Викимолдия. Rekonstruktion eines Projekts zur Vitalisierung der moldauischen Sprache

Version:



Schlagwörter: Moldauisch , Orthographie , Rumänisch , Wikipedia , Schriftlichkeit

Zitation:
  1. Referenz auf den gesamten Beitrag:
    Christian Koch (2024): Wikimoldia – Викимолдия. Rekonstruktion eines Projekts zur Vitalisierung der moldauischen Sprache, Version 1 (06.05.2024, 09:33). In: Robert Hesselbach (Hrsg.) (2024): Romanische Regional- und/oder Minderheitensprachen im Zeitalter der Digital Humanities (Korpus im Text 10), Version 5, url: http://www.kit.gwi.uni-muenchen.de/?p=62100&v=1
    Diese URL enthält einen Hinweis auf die unveränderliche Version (…v=nn)
  2. Referenz auf einen Abschnitt oder Nachweis eines Zitats: http://www.kit.gwi.uni-muenchen.de/?p=62100&v=1#p:1
    Diese URL enthält einen Hinweis auf einen spezifischen Abschnitt (…p:1). In diesem Fall ist sie mit dem ersten Absatz verknüpft. Eine vollständige Referenz kann jeweils über die Ziffern in den grauen Quadraten am rechten Rand des Satzspiegels abgegriffen werden.

1. Einleitung

Wikimoldia klingt wie der Name eines weiteren der zahlreichen Ableger von Wikipedia (vgl. Wikimedia, Wikisource usw.), spielt dabei jedoch auf einen geographischen Raum an, nämlich die Republik Moldau. Ruft man heute die Seite wikimoldia.org auf, so findet man nichts mehr davon, was zwischen September 2018 und September 2019 an dieser Stelle angeboten wurde: eine rumänische Wikipedia in kyrillischer Schrift.

Das Anliegen dieses Beitrags ist es, die technische Funktionsweise dieser automatisch generierten Seite zu rekonstruieren und dabei auf Potenziale und Schwierigkeiten des Vorhabens einzugehen. Weiterhin geht es um die soziolinguistischen Hintergründe, die das Projekt der Wikimoldia motiviert haben könnten. Im Verständnis von Sprachenvielfalt bei Wikipedia als Beitrag zur Minderheitensprachenvitalisierung (vgl. Coulmas 2018, 198f.) kann man auch bei Wikimoldia die Frage des Vitalisierungsversuchs aufwerfen und muss dabei gleichzeitig definieren, um was für eine Sprache es hierbei eigentlich geht. Denn der Terminus moldauische Sprache ist keineswegs unproblematisch, sondern verlangt gerade aus sprachwissenschaftlicher Perspektive eine kritische Analyse, auch in Anbetracht dessen, dass innerhalb der romanistischen Linguistik die romanophonen Varietäten im äußersten Osten Europas zu den eher unbekannten Gebieten gehören. Diesem Aspekt widmet sich der erste Teil des Beitrags, bevor in den folgenden Abschnitten die Wikimoldia aus technischer und aus funktionaler Sicht eine genauere Betrachtung erfährt.1

2. Zum Status der moldauischen Sprache

2.1. Etappen der Sprachbezeichnung

Die Bezeichnung moldauische Sprache (rum. limbă moldovenească) ist in verschiedenen politischen Kontexten und Zeiträumen unterschiedlich zu verstehen. Gabinskij betitelt das "Moldawische" als "(nichtwissenschaftliche) Alltagsbezeichnung" (2002, 133) für die Sprache der Republik Moldau, aber auch als "Subglottonym des Glottonyms Rumänisch" (2002, 139), was wiederum aus sprachwissenschaftlicher Perspektive annehmbar erscheinen mag, wenn man eher von einer (geographisch-politischen) Varietät des Rumänischen als von einer eigenen Sprache spricht. Allerdings scheint auch dies insofern problematisch, als in dialektologischer Beschreibung der moldauische Dialekt als geolektaler Großraum nördlich des dakorumänischen Dialekts verstanden wird (vgl. Olariu 2017, 108). Dieser geolektale Raum liegt jedoch zu einem Großteil innerhalb der politischen Grenzen Rumäniens.

Die heutige Republik blickt im 20. Jahrhundert auf eine bewegte Geschichte zurück: Das damalige, zuvor zum Russischen Kaiserreich gehörende Bessarabien wurde im Jahre 1918 mehrheitlich zu einem Teil von Großrumänien, dann ging es 1944 zur Moldauischen Sozialistischen Sowjetrepublik über, bevor 1991 die unabhängige Republik Moldau (auch Moldawien) entstanden ist. Die Zugehörigkeit zum Russischen Kaiserreich sowie zur Sowjetunion spiegeln sich bis heute in der Präsenz der russischen Sprache sowie des kyrillischen Alphabets wider. Dabei ist der heutige Staat seit seiner Gründung in die Regionen dies- und jenseits des Flusses Dnister (auch Dnjestr) politisch und in gewisser Weise auch sprachlich geteilt. Transnistrien als abtrünnige Republik mit einer halben Million Einwohnern im Osten Moldaus stellt das Land vor einen bis heute unlösbaren Konflikt, der es insbesondere bei der Eingliederung in europäische Institutionen sowie in der Annäherung an Rumänien behindert. Die sprachliche Trennung besteht seit Staatsgründung in der Verwendung der Schrift, da – mit Ausnahme Transnistriens – die lateinische Schrift in der unabhängigen Republik Moldau wiedereingeführt worden ist: "decretarea limbii române ca limbă de stat și reintroducerea alfabetului latin, din 3 noiembre 1990"2 (zit. n. Cimpoeșu/Musteață 2018, 50). Während in der hier zitierten Unabhängigkeitserklärung noch von der rumänischen Sprache die Rede ist, erfolgt im Jahre 1994 ein neuer Erlass: "limba de stat a Republicii Moldova este limba moldovenească"3 (zit. n. Olariu 2017, 22). Dies kann als Rückkehr zur sowjetischen Identitätsbildung verstanden werden, was die Rumänen Dorin Cimpoeșu und Sergiu Musteață in harten Worten anklagen: "au fost legiferate tezele staliniste false despre apartenența etnică și lingvistică a populației românești prin introducerea în legea fundamentală a sintagmelor 'limbă moldovenească' și 'popor moldovenesc' contrare adevărului științific și istoric"4 (Cimpoeșu/Musteață 2018, 61).  Man kann aber auch moderater von einer nationalen Identitätsbildung ausgehen, in der sich die Republik Moldau aus ihrer Stellung als Trabantenstaat Rumäniens löst und mit dem eigenen Glottonym auch die sprachliche Unabhängigkeit vorantreibt. Wenig später wurde auch die Nationalhymne mit dem Titel Limba Noastră festgelegt, die neben dem nationalen Feiertag Limba Noastră (cea Română) die herausragende Bedeutung der Nationalsprache in Moldau hervorhebt. Der Text der Hymne, der auf ein viel älteres Gedicht von Alexei Mateevici (1888-1917) zurückgeht, verwendet dabei den politisch wesentlich neutraleren Possessivbegleiter ('unsere Sprache') anstelle eines Glottonyms.

Als offizielle Amtssprache besaß die moldauische Sprache eine Kodierung im Standard ISO 639 als "mo"/"mol", die jedoch bereits 2008 aufgehoben worden ist (vgl. https://iso639-3.sil.org/code/rum). 2013 schließlich wurde beschlossen, im offiziellen Sprachgebrauch zur Bezeichnung limbă română zurückzukehren, wohl auch um die Verbundenheit mit Rumänien und damit die Brücke in die Europäische Union zu stärken. Dabei rechtfertigte man diesen Schritt mit der Benennung in der Unabhängigkeitserklärung: "prevederea conținută în Declarația de Independență referitoare la limba română ca limbă de stat a Republicii Moldova prevalează asupra prevederii referitoare la limba moldovenească conținute în articolul 13 al Constituției"5 (zit. n. Cimpoeșu/Musteață 2018, 24).

In Transnistrien folgte man der erneuten Umbenennung der Sprache nicht, sondern blieb beim Moldauischen in kyrillischer Schrift als offizieller Sprache (neben Russisch, Ukrainisch und regional Gagausisch). Nicht unerwähnt bleiben sollte an dieser Stelle auch, dass das rumänische Sprachgebiet über die östliche Grenze der Republik Moldau hinaus in die Ukraine reicht. Dort fühlen sich die rumänischsprachigen Minderheiten in Nordbukowina und dem ukrainischen Teil Transnistriens bzw. Bessarabiens, seltener jedoch in Transkarpatien, ebenfalls der moldauischen Identität näher (vgl. Dahmen 2018, 345ff.), wobei die Entwicklungen seit dem russischen Angriffskrieg im Februar 2022 noch nicht abzusehen sind. Durch die heute "offiziellen" Sprachennamen engt sich die Bezeichnung limbă moldovenească bzw. лимбэ молдовеняскэ verstärkt auf die Sprache Transnistriens und die genannten Regionen der Ukraine ein. Dabei ist die Begründung für die Verwendung dieser Sprachbezeichnung an politisch heikle transnistrische Normvorstellungen gekoppelt. Aus sprachwissenschaftlicher Perspektive kann man den Ausdruck moldauisch in diesem Kontext wohl am ehesten funktional zur Bezeichnung von 'kyrillisch verschriftetem Rumänisch' verwenden, ohne dabei eine politische Einordnung vorzunehmen. Dass dabei primär die Verschriftung und weniger die diatopische Varietät ausschlaggebend ist, hat mit der Art und Weise, wie transliteriert wird, zu tun. Hierum soll es im nächsten Abschnitt gehen.

2.2. Prinzipien der (neu-)kyrillischen Verschriftung des Rumänischen

Das Präfix neu- soll hier darauf hinweisen, dass die Prinzipien der kyrillischen Verschriftung im 20. Jahrhundert nicht in Beziehung zur Verwendung der Kyrilliza in der frühen rumänischen Verschriftung seit dem 16. Jahrhundert stehen, denn schon früher standen lateinische und kyrillische Buchstaben über 300 Jahre in Konkurrenz zueinander, bevor sich die lateinische Schrift durchsetzte (vgl. Onu 1989). Mit Beginn der Herrschaft Josef Stalins über die Sowjetunion wurde die kyrillische Schrift zum identitätsstiftenden Symbol für die meisten der zahlreichen Regionalsprachen des Weltreichs. In dem nicht zu Großrumänien gehörenden Teil Transnistriens wurde die Kyrilliza 1928 zur Verschriftung des Rumänischen eingeführt und mit einer kleinen Unterbrechung zwischen 1933 und 1937 fest etabliert (vgl. Kramer 1989, 15). Wie oben erwähnt, wurde Moldau 1944 dann sowjetisch und die kyrillische Schrift wurde in der gesamten Sowjetrepublik eingeführt, wo sie bis zur Unabhängigkeit 1991 Bestand hatte.

Wichtigstes Prinzip der kyrillischen Transliteration6 ab 1928 war – wie bei allen neuverschrifteten Sprachen der Sowjetunion – die größtmögliche Übereinstimmung mit den Phonem-Graphem-Korrespondenzen des Russischen. Allerdings wurde den Sprachen auch eine gewisse Autonomie eingeräumt, so dass die Buchstaben nicht alle Besonderheiten des Russischen berücksichtigen mussten. Einzelne Buchstaben des russischen Alphabets wurden umfunktioniert und neue Buchstaben wurden eingeführt – im Falle des Rumänischen genau einer. Dies soll anhand einiger Beispiele verdeutlicht werden (Tab. 1).

Beispiel Laut Russisch "Moldauisch" Rumänisch Beispiel
(1) [ɨ] ы ы â, î îmblânzi → ымблынзи
(2) [ʲ] ь ь i lupi → лупь
(3) [ə] (э ≙ [ɛ]) э ă după → дупэ
(4) [d͡ʒ] - ӂ g (+e/i) gelos → ӂелос
(5) [iʲa] ия ия ia România → Ромыния
(6) [l] ль л l albă → албэ
Beispiele der Wiedergabe rumänischer Buchstaben in kyrillischer Verschriftung
  1. Der ungerundete geschlossene Zentralvokal [ɨ] ist sowohl für das Russische als auch für das Rumänische charakteristisch, wobei die kyrillische Verschriftung das Problem der zwei Grapheme ‹â› und ‹î› des Rumänischen auflöst.
  2. Der Buchstabe ‹i› dient im Rumänischen u.a. zur Kennzeichnung der Palatalisierung von silben- bzw. zumeist wortfinalen Konsonanten. Hierfür folgt in einigen slavischen Sprachen das sog. Weichheitszeichen ‹ь› auf den palatalisierten Konsonanten. Die Schwierigkeit der Transliteration aufgrund der verschiedenen Funktionen von ‹i› wird weiter unten erläutert.
  3. Für das Rumänische ist der als ‹ă› geschriebene Schwa-Laut charakteristisch und auch in betonten Silben keine Seltenheit. Das Russische kennt den Laut nur in unbetonten Silben als Reduktionsstufe von ‹а› und ‹о›. An dieser Stelle wäre eine Imitation russischer Graphem-Phonem-Korrespondenzen kaum möglich und es wird stattdessen auf drittletzten Buchstaben des russischen Alphabets ausgewichen, dessen russischer Lautwert [ɛ] für das Rumänische nicht eigens dargestellt werden muss.
  4. Für den Affrikaten [d͡ʒ] haben das Rumänische und das Gagausische einen eigenen Buchstaben erhalten: ‹ӂ›, der sich durch ein Breve von ‹ж› unterscheidet, wobei ‹ж› für die Transliteration von rum. ‹j› ebenfalls benötigt wird. Hier zeigt sich die Präferenz in der Kyrilliza für Diakritika gegenüber Digraphen, obwohl eine Schreibweise wie ‹дж› intuitiv leichter lesbar wäre.
  5. In verschiedenen slavischen Sprachen spielt Jotierung eine wichtige Rolle, d.h. einige Vokale haben einen Approximant-Anlaut [j]. Hierfür gibt es im Russischen eigene Buchstaben (‹ю› – [ju], ‹я› – [ja], ggf. auch ‹ё› – [jo]). Der in beiden Alphabeten identische Buchstabe ‹е› wird im Russischen wie auch im Rumänischen standardmäßig jotiert. Wiederum ein besonderes Merkmal des Russischen ist die graphische Kennzeichnung der intervokalischen Jotierung, die als Epenthese auch im Rumänischen denkbar ist, aber nicht graphisch markiert wird. Wie auch der letzte Buchstabe im Namen des Untersuchungsgegenstands Викимолдия zeigt, setzt die Transliteration auf die graphische Darstellung der Epenthese nach russischem Vorbild.
  6. Dagegen zeigt sich in dem Namen Викимолдия, dass bei ‹л› für die Artikulation des Laterals [l] auf ein Weichheitszeichen verzichtet werden kann, da die Artikulation von velarisiertem (oder hartem) [ɫ] für das Rumänische irrelevant ist.7

Bemerkenswert an den in der Sowjetzeit entwickelten Transliterationsregeln ist, dass regionale Besonderheiten der Artikulation der moldauischen Varietät unberücksichtigt bleiben. Stattdessen gilt voll und ganz der Aussprachestandard des Dakorumänischen (vgl. Gabinskij 2002, 135) und es wurde nicht der Versuch unternommen – wie es bei anderen sowjetischen Regionalsprachen geschehen ist –, eine bis dahin nicht verschriftete Varietät in kyrillischen Buchstaben darzustellen. Die Abgrenzung von Rumänien erfolgte eher im Bereich der Lexik als Ablehnung der sog. limbă păsărească ('Vogelsprache'), womit die gehobene an der rumänischen Norm orientierten Sprache bezeichnet wurde (vgl. Gabinskij 2002, 135).

3. Eckdaten zur Wikimoldia

Die Seite wikimoldia.org wurde im September 2018 online gestellt und war für ein Jahr zugänglich. Vermutlich ist die Beendigung der Onlinepräsenz damit zu erklären, dass der Nutzungsvertrag der Domain nicht verlängert worden ist. Damit ist der direkte Zugang zu der URL nicht mehr möglich. Über das große Web-Archiv Wayback Machine (https://web.archive.org/web/*/http://wikimoldia.org/*) sind noch 520 Seiten erhalten, was allerdings nur einen Bruchteil der mehreren hunderttausend einst verfügbaren Seiten darstellt.

Wikimoldia kann als Phantomseite zur rumänischen Wikipedia betrachtet werden, denn die Inhalte von Wikipedia werden mithilfe eines PHP-Skripts, das im folgenden Abschnitt genauere Betrachtung erfährt, ins Kyrillische transliteriert. Hinzu kommt, dass die Bezeichnung Wikipedia dabei durch Викимолдия ersetzt wird, so dass die Künstlichkeit der Seiten auf den ersten Blick gar nicht unbedingt deutlich wird (Abb. 1 und 2).

Teil-Screenshot der Startseite der Wikimoldia

Teil-Screenshot der Startseite der rumänischen Wikipedia (ro.wikipedia.org)

Oben links fällt auf, dass die Unterschrift des Logos "Wikipedia / Enciclopedia liberă" nicht transliteriert bzw. ersetzt ist, denn hierbei handelt es sich um ein graphisches Element. Das exakte Layout und die Hypertextstruktur in die Wikimoldia übertragen; alle Hyperlinks zu Artikeln funktionieren und führen zu entsprechenden Seiten der Wikimoldia. Das Suchfeld oben rechts ist jedoch nicht funktional (Abb. 3).

Suchfeld "Căutare în Wikipedia" in der Wikimoldia

Hier kann man nur in lateinischer Schrift Wörter eingeben und gelangt darüber auf die rumänische Wikipedia. Es funktioniert also im Sinne von Leca-Tsiomis (2006) die enzyklopädische Ordnung durch die hypertextuelle Verweisstruktur, nicht jedoch die alphabetische Ordnung in Form des direkten Nachschlagens. Einen Artikel gezielt aufzurufen, war in der Wikimoldia nur möglich, indem man manuell in der URL des rumänischen Wikipedia-Artikels "ro.wikipedia" durch "wikimoldia" ersetzte.
Bevor in den folgenden Abschnitten die Funktionalität und das Potenzial der Wikimoldia genauer erörtert werden, sollte die Frage erlaubt sein, ob Wikimoldia tatsächlich so etwas wie ein Vitalisierungsversuch darstellen konnte, d.h. insbesondere, ob die kyrillische Transliteration der rumänischen Wikipedia ernsthaft genutzt wurde. Dazu konnten noch im Juni 2019 über die Nutzungsdatenanalyse von SimilarWeb (similarweb.com) Zahlen für den Zeitraum Mai bis März 2019 abgerufen werden (Abb. 4).

Nutzerzahlen von wikimoldia.org laut SimilarWeb

In den drei Monaten ist die Startseite 46.122 Mal aufgerufen worden, wobei die Anzahl an Nutzern auf unter 5.000 geschätzt wird. Aufgrund des beschriebenen Umwegs über die rumänischen Wikipedia-Artikel könnte man mutmaßen, dass die Zahl der tatsächlichen Nutzer höher liegen könnte, da eben nicht – anders als bei Wikipedia – der Weg zu konkreten Artikeln über die Startseite der Wikimoldia möglich war. Über SimilarWeb konnte weiterhin ermittelt werden, aus welchen Ländern die Nutzerinnen und Nutzer auf die Seite zugegriffen haben (Abb. 5).

Nutzeranteile nach Ländern laut SimilarWeb

Die Republik Moldau steht demnach erst an dritter Stelle nach der Ukraine und Russland. Dies kann zum einen mit den erwähnten rumänisch-moldauischen Minderheiten insbesondere in der Ukraine in Verbindung gebracht werden. Zum anderen scheinen die höheren Nutzerzahlen aus diesen Ländern gerade auch mit der kyrillischen Schrift zu tun zu haben, die hier eine Brücke zum Rumänischen schlägt. So zitiert news.ru im August 2019 die Wikimoldia als Quelle für ein Foto der ehemaligen rumänischen Bildungsministerin Ecaterina Andronescu (https://news.ru/europe/slova-ob-iznasilovannoj-devochke-stoili-rumynskomu-ministru-dolzhnosti/). Es ist wahrscheinlich, dass bei der russischen Berichterstattung und der Suche nach einem Bild von "Екатерина Андронеску" gerade über Wikimoldia ein einschlägiges Ergebnis angezeigt worden ist. Dieses Beispiel wie auch die genannten Nutzerzahlen geben grobe Hinweise auf eine gewisse Nutzungsvitalität für den Zeitraum, in dem Wikimoldia online war.

4. Automatische Transliteration in der Wikimoldia

4.1. Funktionsweise

Für die automatische Transliteration des Rumänischen in kyrillische Buchstaben nach den oben beschriebenen Prinzipien ist im August 2018 bei GitHub das PHP-Skript "slava37md2" veröffentlicht worden (https://github.com/slava37md2/wikimoldia). Es beinhaltet in 361 Absätzen bzw. 9.807 Zeichen sog. Zuweisungsoperatoren für alle Buchstaben des rumänischen Alphabets sowie für ‹k›, ‹q›, ‹w›, ‹x› und ‹y›, jeweils getrennt nach Groß- und Kleinbuchstaben – die Regeln zur Groß- und Kleinschreibung sind für die lateinische und kyrillische Verschriftung des Rumänischen identisch. Eine sehr kurze Readme-Datei enthält eine erklärende Beschreibung auf Englisch und Russisch: "Script translits romanian (latin) to moldavian (cyr) characters Скрипт переводит румынские буквы в кириллицу. Можно переводить интернет- страницы. Например Википедию."8

Einfache Zuweisungen können dort erfolgen, wo ein Graphem des Rumänischen in lateinischer Schrift genau eine kyrillische Entsprechung hat, z.B. ‹J› → ‹Ж› oder ‹d› → ‹д›. Der Zuweisungsoperator besteht entsprechend aus nur einem Befehl (Abb. 6).

Einfacher Zuweisungsoperator

Die Grapheme des Rumänischen, welche je nach Position unterschiedliche lautliche Realisierungen kennen – insbesondere ‹g› und ‹c› –, müssen jeweils unterschiedlichen kyrillischen Buchstaben zugeordnet werden, denn die Graphem-Phonem-Korrespondenzen im kyrillisch verschrifteten Rumänisch bzw. im "Moldauisch" sind nahezu eineindeutig.9 Wie im Italienischen wird rum. ‹c› vor den Vokalen ‹e› und ‹i› als stimmloser palataler Affrikat /t͡ʃ/ artikuliert, was durch den Digraph ‹ch› aufgelöst werden kann, der wie ‹c› in allen anderen Positionen zur velaren Artikulation als /k/ führt. In der automatischen Transliteration erzeugt ein komplexer Zuweisungsoperator je nach Position die Buchstaben ‹ч› und ‹к› (Abb. 7).

Komplexer Zuweisungsoperator

Bei den komplexen Zuweisungen gilt: Jede größere definierte Zeicheneinheit hat Vorrang gegenüber kleineren Zeicheneinheiten bzw. einzelnen Zeichen. So können einfache Zuweisungen durch zusätzliche Bedingungssätze für Sonderfälle ergänzt werden. Grenzwertig gestaltet sich die Zuweisung jedoch bei dem Graphem ‹i› bzw. ‹I›, worauf knapp ein Viertel des gesamten Skripts verwendet wird. Als isolierter Vokal wäre ‹i› als ‹и› wiederzugeben. Insbesondere am Wortende ist ‹i› jedoch meistens nicht vokalisch, sondern zeigt Palatalisierung an (‹ь›, vgl. Tab. 1, Beispiel 2). In steigenden Diphthongen finden u.a. die in Tab. 1, Beispiel 5, angesprochenen jotierten Buchstaben ‹ю› und ‹я› Verwendung. Bei fallenden Diphthongen wie ‹ei› aber auch bei der im Rumänischen häufigen Dopplung ‹ii› kommt ‹й› zum Einsatz, d.h. ‹ей› bzw. ‹ий›.
Anhand eines kurzen Textbeispiels aus der rumänischen Wikipedia (https://ro.wikipedia.org/wiki/Portal:Limbi) und der daraus erfolgten Transliteration sollen einige der komplexen Zuweisungen veranschaulicht werden:

O limbă reprezintă un sistem abstract, complex, de comunicare verbală între oameni. În afară de forma orală (limba vorbită), bazată pe articularea de sunete, limbile actuale au în general și o formă grafică, limba scrisă.

О лимбэ репрезинтэ ун систем абстракт, комплекс, де комуникаре вербалэ ынтре оамень. Ын афарэ де форма оралэ (лимба ворбитэ), базатэ пе артикуларя де сунете, лимбиле актуале ау ын ӂенерал ши о формэ графикэ, лимба скрисэ.

An der automatischen Transliteration des Textes ist nichts auszusetzen. Markiert sind hier komplexe Zuweisungen, an denen die Funktionalität deutlich wird. Das Graphem ‹g› ist entsprechend der Aussprache einmal als ‹г› und einmal als ‹ӂ› transliteriert. In der Transliteration von ‹i› unterscheidet der Zuweisungsoperator die Palatalisierung in "оамень" und die vokalische Realisierung in "ши", wobei man ein finales ‹i› in den meisten Fällen als Palatalisierungszeichen zu lesen hat, nicht jedoch in einsilbigen Wörtern wie și, wo es vokalisch sein muss.10 Schließlich kann noch bei der Transliteration "articularea" festgestellt werden, dass die finalen Vokale nicht einzeln als Hiat, sondern als Diphthong erkannt und mit ‹я› wiedergegeben werden.

4.2. Grenzen der automatischen Transliteration

Das Textbeispiel zeigt insgesamt, dass die Zuweisungsoperatoren funktionieren. Es sei jedoch im Folgenden auch auf Probleme hingewiesen, die mit dem Skript nicht gelöst werden können. Zunächst fehlen etliche Sonderzeichen, d.h. Buchstaben mit Diakritika und andere Buchstaben, die über das lateinische Grundalphabet hinausgehen und nicht im Rumänischen vertreten sind. So wird beispielsweise der Name Frédéric Chopin als Фрéдéрик Кхопин transliteriert, wobei die beiden Vokale ‹é› stehen bleiben und der Digraph ‹Ch›, da er nicht vor ‹e› oder ‹i› steht, als zwei Einzelkonsonanten interpretiert wird. Man würde sich im Normalfall an der russischen Variante Фридерик Шопен orientieren. Es sind also nicht allein Sonderzeichen, die Schwierigkeiten bereiten, sondern auch fremdsprachliche Lautungen insgesamt, die bei der Übertragung in ein anderes Schriftsystem eher phonetisch wiedergegeben würden. Es wäre jedoch denkbar, die automatische Transliteration hierfür lernfähig zu machen, denn sie folgt – wie oben beschrieben – dem Prinzip, dass jede größere Buchstabenfolge vorrangig vor kleineren Kombinationen und einzelnen Buchstaben berücksichtigt wird. Entsprechend können Eigennamen kontinuierlich in das Skript mit aufgenommen werden.11

Ein weiteres Problem stellen Siglen und Abkürzungen dar. So werden etwa Elementsymbole in der Chemie unabhängig vom Schriftsystem einer Sprache mit lateinischen Buchstaben dargestellt. In der Wikimoldia jedoch wird "H2O" zu "Х2О". Allein für römische Zahlen sind eine Reihe von Anweisungen erhalten, die eine unsinnige Transliteration verhindern. Auf eine fehlerhafte Abkürzung wird im Forum zum Skript in GitHub hingewiesen (https://github.com/slava37md2/wikimoldia/issues/2): Aufgrund der positionsgebundenen lautlichen Realisierung des rumänischen Graphems ‹c› (vgl. Abb. 7) kommt es in der Abkürzung von 'Zentimeter' zu einem Fehler (Tab. 2).

Rumänisch korrekt transliteriert automatisch transliteriert
cm ‹чм› ‹км›
km ‹км›
Falsche automatische Transliteration von rum. cm

Einen weiteren Sonderfall des Rumänischen, der in automatischer Transliteration nicht vollends zu lösen ist, sind Fälle von Homographie, also von Wörtern, die gleich geschrieben, aber unterschiedlich ausgesprochen werden. Hierzu zählen v.a. Infinitive mit der vokalischen Endung -i (Tab. 3).

Rumänisch Aussprache
korrekt transliteriert automatisch transliteriert
tu dormi [ˈdormʲ] ‹дормь› ‹дормь›
tu vei dormi [dorˈmi] ‹дорми›
Falsche automatische Transliteration von rum. dormi

Grundsätzlich ist die Palatalisierungsfunktion von ‹i› am Wortende viel häufiger, so dass der Sonderfall des Infinitivs kaum ins Gewicht fällt. Zahlreiche Verben der i-Gruppe weisen in der Konjugation Stammerweiterungen (z.B. a cititu citești) oder Unregelmäßigkeiten (z.B. a venitu vii) auf. In diesen Fällen liegen keine Homographen vor und die Infinitive könnten als Einzellexeme der korrekten Transliteration zugewiesen werden. Bei den verbleibenden Verben mit homographen Formen (a dormi, a fugi, a ieși…) müsste eine vollautomatische Software in der Lage sein, zwischen Infinitiv und konjugierter Verbform zu unterscheiden. Denkbar wäre in Anbetracht der (balkantypischen) restriktiven Verwendung des Infinitivs, die den Gebrauch nur in wenigen Konstruktionen mit Hilfsverben oder der Präposition a zulässt, die Programmierung mit sog. regulären Ausdrücken, welche die syntaktische Einbettung von Infinitiven über Einzellexeme hinaus formal abbilden können.

Die in diesem Abschnitt dargestellten Probleme bei der automatischen Transliteration und deren Lösungsansätze sind rein technischer Natur. Aus soziolinguistischer Perspektive mag man sich aber die Frage stellen, worin das Interesse einer möglichst fehlerfreien Transliteration des Rumänischen in die Kyrilliza liegen soll. Hierum wird es im letzten Teil des Beitrags gehen.

5. Potenziale der Wikimoldia

Die vorigen Betrachtungen der Wikimoldia beruhen auf Einsichten in die Wikimoldia-Website, als sie noch aktiv war, auf der Analyse des PHP-Skripts bei GitHub sowie auf der Analyse von Nutzungsdaten. Die Recherche nach weiteren Hintergründen über die Entstehung und die Motivation der Wikimoldia blieb ergebnislos. So kann über die intendierte Funktion der Online-Präsenz nur spekuliert werden. Auch die mögliche Urheberschaft, die gerade im Hinblick auf eine denkbare politische Motivation von Bedeutung ist, soll in diesem Zusammenhang diskutiert werden.

Wikimoldia kann als Zugang zur rumänischen Wikipedia für ein kyrillisch sozialisiertes Publikum verstanden werden. Dies ist v.a. für die Bevölkerung Transnistriens, aber auch für rumänische Minderheiten in der Ukraine, von Bedeutung. Zwar werden die meisten Rumänischsprecherinnen und -sprecher in der Lage sein, die Sprache in lateinischer Verschriftung zu lesen, im Hinblick auf die Literalität stellt die Möglichkeit der Lektüre in kyrillischer Schrift aber einen Mehrwert dar, sofern man nicht ganz auf die russische oder ukrainische Wikipedia ausweicht. Das oben genannte Beispiel, in dem Wikimoldia auf einer russischen Nachrichtenseite zitiert worden ist, zeigt darüber hinaus, dass die Nachbarländer der Republik Moldau – potenziell auch die kyrillisch schreibenden Nachbarländer Rumäniens (Serbien, Bulgarien, Nordmazedonien) – von der kyrillischen Online-Präsenz als Brücke zur rumänischsprachigen Kultur profitieren.

Betrachtet man die Wikipedia-Versionen verschiedener Minderheitensprachen, so ist vielfach festzustellen, dass nur eine geringe Zahl von Artikeln in spärlichem Umfang vorhanden ist, so dass der Wert zwar in der Wahrnehmung der Sprachen besteht, nicht jedoch darin, eine brauchbare Enzyklopädie anzubieten. Beim Moldauischen in dem Status, der zuvor beschrieben worden ist, also als Varietät, deren Abstand vom Standardrumänischen sich primär über die Schrift definiert, liefert der Weg der automatischen Transliteration die Möglichkeit, ad hoc eine umfassende Enzyklopädie zu generieren. Während es im vorigen Abschnitt darum ging, wie man die Transliterationsleistung maschinell verbessern könnte, ließe sich für eine echte Enzyklopädie der Vorschlag machen, die transliterierte Version einzufrieren, manuell auszubessern und mit individuellen Inhalten auszugestalten – gleichwohl man sehr wohl ethische und rechtliche Bedenken bezüglich der kompletten Überführung der Wikipedia in die Wikimoldia äußern kann. Zwar können Inhalte der Wikipedia als Open Content theoretisch frei verwendet werden und selbst die aufwändig entwickelte Wiki-Struktur steht für die Programmierung von unabhängigen Varianten zur freien Verfügung, dennoch handelt es sich bei der Übernahme der Inhalte ohne Ausweisung der Quelle um ein Plagiat, wobei zudem durch die Ersetzung von Wikipedia durch Викимолдия der Ursprung verfälscht wird. Aber auch hier könnte man in einer Überarbeitung die Genese der Enzyklopädie transparenter gestalten.

Schließlich sei noch die Frage des cui bono und damit der Urheberschaft des Projektes Wikimoldia aufgeworfen. Mangels genauerer Hinweise kann man zwei ganz konträre Hypothesen zur politischen Motiviertheit aufstellen: Als Beitrag zur Vitalisierung der umstrittenen moldauischen Sprache könnte man dahinter einerseits die transnistrische Regierung und ihre postsowjetischen Fortführung der Ideologie des Moldauischen "creat în laboratoarele Moscovei"12 (Cimpoeșu/Musteață 2018, 236) vermuten. Andererseits kann man das genaue Gegenteil darin sehen, nämlich Wikimoldia als ein liberal orientiertes Projekt, das einen Zugang zu rumänisch geprägten Inhalten und damit eine Annäherung an die restliche Republik Moldau, an Rumänien und Europa schafft, die sich durch die direkte Übertragung des Standardrumänischen letztlich sogar sprachlich in der erwähnten limbă păsărească äußert, was auch als Protest gegen den Sozialismus verstanden werden kann (vgl. Gabinskij 2002, 135). Das sind jedoch freie Spekulationen, die neben einer unpolitischen Auslegung der Wikimoldia denkbar wären.

6. Fazit

In diesem Beitrag ist das Kuriosum einer moldauischen Phantomseite der rumänischen Wikipedia in ihrer technischen Funktionsweise und ihrem potenziellen Nutzen vor den soziolinguistischen Hintergründen der moldauischen Sprache und deren kontroverser Auslegung betrachtet worden. Das markanteste Element des Moldauischen und damit der Wikimoldia bildet dabei die Verwendung der kyrillischen Schrift nach der in den 1920er Jahren in der Sowjetunion entstandenen Norm, die für das Rumänische eine zwar weitgehend mit dem Russischen harmonische, aber dennoch phonographisch besonders flache Orthographie vorgibt.

Da Wikimoldia nicht mehr online ist, könnte man die Überlegungen zu einer Verbesserung und Ausarbeitung des Projektes zu einer funktionierenden Enzyklopädie als Müßiggang abtun. Tatsächlich sind die geschaffenen Grundlagen in Form des PHP-Skripts "slava37md2" vorhanden, womit die Seite rekonstruiert werden könnte. Weil aber auch hierfür nicht deutlich geworden ist, ob und welche politische Ideologie sich hinter der Wikimoldia verbirgt, und auch wegen der angesprochenen Bedenken des Daten- und Gedankenraubs wäre von der Fortführung und dem Ausbau der Wikimoldia vielleicht eher Abstand zu nehmen. Davon unabhängig kann die Programmierung der Wikimoldia als Lehrstück für andere multialphabetische Sprachen dienen, etwa für Serbisch und andere serbokroatische bzw. BKMS-Varietäten oder gar für Hindi und Urdu. Innerhalb der Romania ist hier besonders das Judenspanische zu nennen, das in einer eigenen Wikipedia (https://lad.wikipedia.org/) in der Zweischriftigkeit mit lateinischem und hebräischem Alphabet gepflegt wird, wobei dort auf Anhieb die Ungleichheit im Ausbau der Enzyklopädie deutlich wird: Es gibt viel weniger und zumeist nur kürzere auf Hebräisch verschriftete Artikel. Die Option einer automatischen Transliteration könnte auch hier eine hilfreiche Unterstützung darstellen.

 

Bibliographie

  • Cimpoeșu/Musteață 2018 = Cimpoeșu, Dorin / Musteață, Sergiu (2018): Basarabia la un secol de la Marea Unire. O istorie politică a Republicii Moldova. 1991-2018, Târgoviște, Cetatea de Scaun.
  • Coulmas 2018 = Coulmas, Florian (2018): An Introduction to Multilingualism. Language in a Changing World, Oxford, Oxford University Press.
  • Dahmen 2018 = Dahmen, Wolfgang (2018): Les frontières linguistiques extérieures du dacoroumain, vol. Manuel des frontières linguistiques dans la Romania, Berlin/Boston, De Gruyter, 338-357 (Link).
  • Gabinskij 2002 = Gabinskij, Mark A. (2002): Moldawisch, in: Okuka, Miloš (Hrsg.), Enzyklopädie des europäischen Ostens, vol. Lexikon der Sprachen des europäischen Ostens, Klagenfurt, Wieser, 133-143 (Link).
  • Koch 2021 = Koch, Christian (2021): Language Identity Through Cyrillic Script. From Romanian to Moldovan by Automatic Transliteration in the Wikimoldia Project, vol. Grapholinguistics in the 21st century – 2020. Part II, Brest, Fluxus, 1065-1080, ISBN: 978-2-9570549-7-8 (Link).
  • Kramer 1989 = Kramer, Johannes (1989): Rumänisch: Graphetik und Graphemik, vol. Lexikon der Romanistischen Linguistik, 3, Tübingen, Niemeyer, 14-18 (Link).
  • Leca-Tsiomis 2006 = Leca-Tsiomis, Marie (2006): Une tentative de conciliation entre ordre alphabétique et ordre encyclopédique, vol. Recherches sur Diderot et sur l’Encyclopédie, 40/41, 55-66.
  • Olariu 2017 = Olariu, Florin-Teodor (2017): Variație și varietăți în limba română. Studii de dialectologie și sociolingvistică, Iași, Institutul European.
  • Onu 1989 = Onu, Liviu (1989): Rumänisch: Langue et écriture, vol. Lexikon der Romanistischen Linguistik, 3, Tübingen, Niemeyer, 305-324 (Link).
  • Zikmund 1996 = Zikmund, Hans (1996): Transliteration, vol. Schrift und Schriftlichkeit. Ein interdisziplinäres Handbuch, 2, Berlin, De Gruyter Mouton, 1591-1604.
Eine parallel auf Englisch entstandene Fassung des Beitrags ist zuvor erschienen (Koch 2021).
Übersetzung: 'das Dekret der rumänischen Sprache als Staatssprache und die Wiedereinführung des lateinischen Alphabets, ab dem 3. November 1990'.
Übersetzung: 'die Staatssprache der Republik Moldau ist die moldauische Sprache'.
Übersetzung: 'es wurden falsche stalinistische Thesen über die ethnische und sprachliche Zugehörigkeit des rumänischen Volkes gesetzlich festgelegt, indem im Grundgesetz die Ausdrücke 'moldauische Sprache' und 'moldauisches Volk' eingeführt wurden, die den wissenschaftlichen und historischen Fakten widersprechen'.
Übersetzung: die in der Unabhängigkeitserklärung enthaltene Bestimmung über die rumänische Sprache als Staatssprache der Republik Moldau hat Vorrang vor der Bestimmung über die moldauische Sprache in Artikel 13 der Verfassung.
Unter "Transliteration" wird nach Zikmund die "indifferente Transliteration" gegenüber der "zielsprachenspezifische[n] Transkription" (Zikmund 1996, 1592) verstanden. Nach dieser Unterscheidung wäre auch der Terminus Transkription denkbar, da zahlreiche Spezifika des Russischen in der kyrillischen Verschriftung vorhanden sind. Allerdings handelt es sich – anders als etwa bei der Transkription von Eigennamen – nicht um eine Form der Integration von Schriftformen in die Zielsprache Russisch, sondern um die Verschriftung eines ganzen Sprachsystems, weshalb hier der Terminus Transliteration bevorzugt wird.
Das bedeutet jedoch nicht, dass im Russischen an dieser Stelle ein Weichheitszeichen stehen würde. Vielmehr wird – anders als im Rumänischen – Молдавия mit velarisiertem [ɫ] artikuliert.
Übersetzung der russischen Sätze: Das Skript übersetzt rumänische Buchstaben ins Kyrillische. Man kann Webseiten übersetzen. Zum Beispiel Wikipedia.
Die einzige Ausnahmen der graphophonischen und phonographischen Eineindeutigkeit bilden die in der Kyrilliza populären jotierten Buchstaben ‹ю› und ‹я› (vgl. Tab. 1, Beispiel 5, sowie weiter unten die Transliteration von ‹i›).
Für das Skript nicht erkennbar ist das finale ‹i› in vokalischer bei Infinitivendungen (z.B. a veni). Dies wird weiter unten angesprochen.
Dies allein kann jedoch nicht das Problem lösen, dass man bei der Transliteration von Eigennamen die Originalschreibweise als Parenthese hinzusetzen würde. Besonders problematisch ist auch die Retransliteration von zuvor ins lateinische Alphabet transkribierte Eigennamen, die im Original auf Kyrillisch verschriftet sind.
Übersetzung (mit Bezug auf das Moldauische): in Moskauer Laboratorien erschaffen.

Schreibe einen Kommentar