Home > Romani > Lexikon

Lexikon

Das Lexikon des Romani besteht aus mehreren Schichten, die sich in zwei Hauptteile gruppieren lassen, den voreuropäischen und den europäischen Teil des Lexikons. Die sogenannten indischen "Ursprungswörter" und die "frühen bzw. älteren" Entlehnungen aus dem Persischen, Armenischen und Byzantinisch-Griechischen bilden den voreuropäischen Wortschatz. Diese "Erbwörter" (Boretzky 1992) umfassen um die 700 Wurzeln aus dem Indischen, vermutlich nicht mehr als 100 aus dem Persischen und anderen iranischen Sprachen, mindestens 20 aus dem Armenischen und bis zu 250 aus dem Griechischen. Diese mehr als 1000 Lexeme sind jedoch in keiner Varietät vollzählig vorhanden. Die dann hinzugekommenen "späteren bzw. jüngeren" Entlehnungen stammen aus den verschiedensten europäischen Kontaktsprachen, wobei Entlehnungen aus dem Südslawischen die letzte allgemeine Schicht der heute in Europa gesprochenen Romani-Varietäten bilden.

kham < inc. gharma 'Sonne'
veš < ira. veša 'Wald'
khoni < arm. khoni 'Fett'
drom < grc. drómos 'Weg'
praxo < sla. prax 'Staub'
lumja < ron. lume 'Welt'
kolopa < hun. kalap 'Hut'
berga < ger. Berg 'Berg'

Bis zum slawischen praxo kann man in dieser Tabelle – wie erwähnt – von einem gemeinsamen Wortschatz sprechen. Die weiteren Lexeme sind varietätenspezifisch: das aus dem Rumänischen entlehnte lumja gehört u. a. zum lexikalischen Bestand des Kalderaš-Romani, das ungarischstämmige kolopa wird u. a. im Lovara-Romani verwendet, das aus dem Deutschen übernommene berga im Sinti-Romani.

Das Lexikon als Migrationsroute

Aufgrund der voreuropäischen Entlehnstrata des Romani war es möglich die Migrationsroute der Romani-Sprecher zu rekonstruieren. Der erste prägende Kontakt nach der Abwanderung aus dem Nordwesten des indischen Subkontinents erfolgte im damals sassanidischen Persien. Folge davon sind Elemente im Romani Lexikon, die sich auf das mittelpersische Pahlevi zurückführen lassen. Über die Dauer des Kontakts, bei dem es sich entweder um einen längeren Aufenthalt oder auch um einen langsamen "Transit" gehandelt haben könnte, lassen sich keine Angaben machen. Da sich im Romani jedoch keinerlei arabische Entlehnungen finden, liegt der Schluss nahe, dass die Romani-Sprecher den persischen Raum vor der Arabisierung, oder – besser gesagt – vor der Hybridisierung zwischen iranischer und arabischer Kultur verlassen haben. Höchstwahrscheinlich sind sie über Armenien in den byzantinischen Einflussbereich weitergezogen, wo eine längere Aufenthaltsdauer anzusetzen ist. Dafür sprechen einerseits Entlehnungen aus dem Armenischen und eine starke, über bloße lexikalische Entlehnungen weit hinausgehende Prägung durch das Byzantinisch-Griechische. Diesen starken Einfluss auf des Romani zeigen u. a. die im folgenden aufgelisteten Kardinalzahlen, die sich neben Zahlwörtern indischen Ursprungs nur noch aus solchen aus dem Griechischen zusammensetzen:

jekh < inc. ekka- 'eins'
duj < inc. d(u)vā 'zwei'
trin < inc. trīṇi 'drei'
štar < inc. catvāra 'vier'
pandž < inc. pañca- 'fünf'
šov < inc. śaś/śat 'sechs'
efta < grc. éftá 'sieben'
oxto < grc. óxtó 'acht'
enja < grc. énnjá 'neun'
deš < inc. daśa- 'zehn'
biš < inc. viṁśati 'zwanzig'
tr(ij)anda < grc. triánta 'dreißig'
saranda < grc. saránta 'vierzig'
šel < inc. śata 'hundert'

Da sich bei den über den Balkan nach Europa gekommenen Romani-Sprechern keine Entlehnungen aus dem Türkischen finden, liegt es nahe, die Abwanderung aus Kleinasien vor der Turkisierung der Region anzusetzen. Unter Turkisierung ist die Hybridiserung zwischen der arabisch-iranisch-islamischen und der byzantinisch-griechischen Kultur unter der politischen Dominanz der Osmanen zu verstehen, an der die heute in Europa lebenden Roma nicht teilgenommen haben. Die Varietäten der in weiterer Folge am Balkan verbliebenen Roma, die später unter direkten oder indirekten Einfluss der osmanisch-islamischen Kultur geraten sind, weisen natürlich auch Entlehnungen aus dem Osmanisch-Türkischen auf. Diese sind aber ebenso zum europäischen Teil des Lexikons zu rechnen wie sämtliche andere Entlehnungen ab dem Slawischen, die in allen Varietäten des Romani zahlenmäßig bei weitem überwiegen.

Die europäischen Entlehnstrata von Romani-Varietäten geben Aufschluss über den weiteren Weg einzelner Gruppen in Europa. Beispielsweise sind Lexeme aus dem Deutschen in der Romani-Varietät der finnischen Kaale ein Hinweis auf einen früheren Kontakt mit dem Deutschen und höchstwahrscheinlich auch auf einen Aufenthalt im deutschsprachigen Gebiet. Rumänische Elemente im Lexikon vieler heute weltweit verbreiteter Romani-Varietäten wie Kalderaš-, Gurbet- und Čurara-Romani verweisen auf die gemeinsame Vergangenheit dieser Gruppen in der moldawisch-walachischen Leibeigenschaft und Sklaverei. Deshalb fasst man diese Gruppen auch als Vlax-Roma und die von ihnen gesprochenen Romani-Varietäten unter der Bezeichnung Vlach-Romani zusammen. Was die Kalderaš anbelangt, sind Elemente aus dem Russischen in den Varietäten von heute in Schweden, Frankreich, Nord- und Südamerika, etc. lebenden Gruppen Hinweis darauf, dass ihre Migrationsroute über Russland führte.

Die europäischen Entlehnstrata des Romani-Lexikons waren auch Basis der ersten seriösen Klassifikation der Romani-Varietäten von Franz Miklosich (1872-1881). Er unterschied dreizehn Dialekte des Romani nach der jeweils letzten Kontaktsprache, die das Lexikon der einzelnen Varietäten geprägt hat. Darüber hinaus stellte er Verbindungen zwischen den Dialekten aufgrund von gemeinsamen Entlehnungen aus früheren europäischen Kontaktsprachen her und rekonstruierte dadurch auch in etwa die Migrationsrouten der einzelnen Gruppen in Europa.

Basiswortschatz

Das Lexikon der einzelnen Romani-Varietäten besteht in der überwiegenden Mehrzahl aus europäischen Entlehnungen. Zudem ist jedes Wort der aktuellen Kontaktsprache ein potenzielles Romani-Lexem, das bei Bedarf integriert werden kann. Da sich jedoch der Basiswortschatz – d. s. die Bezeichnungen für existentiell wichtige Entitäten, Zustände und Prozesse – jeder einzelnen Romani-Varietät in der überwiegenden Mehrzahl aus Wörtern indischen Ursprungs zusammensetzt, ist das Romani auch lexikalisch gesehen eine neu-indo-arische Sprache.1 So haben beispielsweise von den 207 Elementen der Swadesh-Listen2 178 eine Romani-Entsprechung, die sich auf das Indische zurückführen lassen. Weitere sechzehn Lexeme sind als "frühe" Entlehnungen ebenfalls voreuropäischen Ursprungs und nur dreizehn stammen aus europäischen Sprachen, wovon wiederum fünf Entlehnungen aus dem Slawischen sind. Damit stammen 86% der Bezeichnungen für die Basisbedeutungen der Swadesh-Listen aus dem Indischen und 96% aus dem gemeinsamen Wortschatz. Das bestätigt sowohl die Zugehörigkeit des Romani zu den neu-indo-arischen Sprachen als auch die lexikalische Homogenität des Basiswortschatzes.

Der Basiswortschatz deckt existentiell wichtige Basisdomänen ab; d. s. die dem Menschen nahen Bereiche des Lebens und der Umwelt wie beispielsweise Personenbezeichnungen, die sich im Romani auf das Indische zurückführen lassen:

[+romani] neutral [–romani]
rom manuš murš gadžo 'Mann'
romni manušni džuvli gadži 'Frau'
čhavo [manušoro] [muršoro] raklo 'Bub'
čhaj [manušori] [džuvlori] rakli 'Mädchen'

Auffällig hierbei die Unterscheidung nach ethnischen Kriterien, die in der Tabelle durch das Merkmal [± romani] markiert ist. Bei den ethnisch neutralen Bezeichnungen fokussiert das Paar murš / džuvli den Geschlechtsunterschied, manuš / manušni betont hingegen den menschlichen Aspekt. Die in Klammern angegebenen neutralen Bezeichnungen für 'Bub' / 'Mädchen' sind mehr oder weniger gebräuchliche Diminutivformen der korrespondierenden Bezeichnungen für 'Mann' / 'Frau'.

Personenbezeichnungen fungieren auch als Verwandtschaftsbezeichnungen, die in ihrem Kern ebenfalls indo-arischen Ursprungs sind. Sowohl die Bezeichnungen für direkte Verwandte der selben Generation – rom / romni 'Ehemann' / 'Ehefrau' und phral / phen 'Bruder' / 'Schwester' – als auch für die der folgenden und der direkt vorhergehenden Generationen – čhavo / čhaj 'Sohn' / 'Tochter und dad / daj 'Vater' / 'Mutter' – stammen aus dem Indischen.

Hingegen sind die Bezeichnungen für Verwandte der zweiten vorhergehenden Generation, für die Großeltern, aus dem Griechischen entlehnt – papus / mami 'Großvater' / 'Großmutter'. Die Bezeichnungen für indirekt Verwandte der ersten vorhergehenden Generation, für die Geschwister der Eltern, gehören ebenfalls zu den frühen Entlehnungen und stammen höchstwahrscheinlich aus dem Persischen – kak / bibi 'Onkel' / 'Tante'. Alle anderen Verwandtschaftsbezeichnungen sind entweder varietätenspezifische Entlehnungen aus europäischen Kontaktsprachen oder Umschreibungen. Die folgende Tabelle fasst das System der verwandtschaftlichen Beziehungen und der lexikalischen Schichtzugehörigkeit ihrer Bezeichnungen aus individueller Sicht zusammen:

+2 +1 –1 –2
direkt 'Enkel' čhavo phral dad papu(s)
'Enkelin' čhaj phen daj mami
indirekt 'Neffe' 'Cousin' kak(o)
'Nichte' 'Cousine' bibi

Eine weitere Basisdomäne mit Bezeichnungen, die in der überwiegenden Mehrzahl aus dem Indischen stammen, umfasst den menschlichen Körper: Körperteile, Körperfunktionen, Körperbewegungen, körperliche und mentale Zustände, etc. Weiters sind die Numeralia (siehe oben), Bezeichnungen für die Natur – Landschaft, Wetter, Pflanzen, Tiere, etc. – für Unterkunft, Werkzeuge und Grundnahrungsmittel sowie für Berufe und auch soziale Funktionen Teil des Basisvokabulars. Wie die Beispiele aus der Domäne 'Zeit' zeigen, setzen sich diese Bezeichnungen ebenfalls in der überwiegenden Mehrzahl aus Lexemen indo-arischen Ursprungs zusammen:

ivend < inc. hemanta 'Winter'
nilaj < inc. nidāgha 'Sommer'
dives < inc. divasa 'Tag'
rat < inc. rātrī 'Nacht'
berš < inc. varṣa 'Jahr'
masek < inc. māsa 'Monat'
kurko < grc. kuriaké 'Woche, Sonntag'
ciros < grc. kairós 'Zeit'

Neben Bezeichnungen indischen Ursprungs enthält diese Domäne – wie fast alle anderen Basisdomänen auch – einige voreuropäische Entlehnungen. Da letztere häufig aus dem Byzanthinisch-Griechischen stammen, ist – wie erwähnt – ein relativ langer Aufenthalt der Romani-Sprecher mit intensivem Kontakt in Kleinasien anzunehmen. Die daraus resultierende Prägung des Romani durch das Griechische geht weit über den lexikalischen Bereich hinaus und wird in der Darstellung von Morphologie und Syntax weiter thematisiert.

1. ^ Ähnliches gilt für das Englische. Obwohl nur ungefähr ein Drittel des englischen Vokabulars originär "westgermanisch" ist, wird es als westgermanische Sprache klassifiziert, da das Basisvokabular überwiegend diesem Drittel angehört. Auch die Eigenständigkeit des Japanischen wird keineswegs in Frage gestellt, obwohl um die 50 Prozent des Vokabulars aus dem Chinesischen stammen und viele andere Wörter aus dem Englischen. Das Basisvokabular des Japanischen ist, wie in vielen anderen vergleichbaren Fällen, in der überwiegenden Mehrzahl "originär".

2. ^ Die Swadesh-Listen sind Auflistungen von 100 bzw. 200, zusammen 207 Basisbedeutungen, die in der Lexikostatistik, der quantitativen Analyse von Sprachverwandtschaft verwendet werden.