:: 9/2010

Zur Statistik des deutschen Wortschatzes

Die Darstellung und Analyse statistischer Ergebnisse bedürfen einer sprachlich-textlichen Kommentierung. Auch wenn es zutreffen mag, dass »ein Bild mehr sagt als 1 000 Worte«, kommt man in dem Bestreben, »Zahlen sprechen zu lassen« nicht ohne Worte aus. Der Wortschatz einer Sprache ist keine statische Größe, sondern er unterliegt einem permanenten Wandel. Daher fällt es schwer, den Umfang des Wortschatzes einer Sprache auch statistisch zu ermitteln, zumal eine Statistik des deutschen Wortschatzes nicht zu den Aufgaben der amtlichen Statistik in Deutschland gehört. Derzeit ist gerade der deutsche Wortschatz im Vergleich zu anderen Sprachen in einer starken Umbruchsituation – dies als Folge etwa der Internationalisierung von Kommunikationsinstrumenten oder auch eines wachsenden Bevölkerungsanteils mit Migrationshintergrund.

Was ist ein Wortschatz?

Sprachwissenschaftler weisen dem Begriff Wortschatz zwei unterschiedliche Bedeutungen zu. Zum einem ist darunter die Gesamtheit aller Wörter einer Sprache zu einem bestimmten Zeitpunkt zu verstehen, zum anderen wird damit die Gesamtheit aller Wörter bezeichnet, die eine einzelne Person kennt oder verwendet. In feinerer Untergliederung beim Wortschatz einer Person wird differenziert zwischen dem rezeptiven und dem produktiven Wortschatz. Zum rezeptiven oder passiven Wortschatz einer Person gehören all die Wörter einer Sprache, die sie vom Sinn her richtig versteht. Der aktive oder produktive Wortschatz eines Menschen wird vom ihm auch beim Sprechen oder Schreiben genutzt, indem er damit sinnvolle und verständliche sprachliche Äußerungen formuliert.

Langfristig gesehen zeigen sich sprachgeschichtliche Entwicklungen in der Veränderung des Wortschatzes. Im Laufe eines Jahrhunderts entstehen bei einer lebenden Sprache viele neue Wörter, andere sterben ab und viele werden verändert. Dies ist die Hauptschwierigkeit, den Wortschatz einer Sprache zu einem bestimmten Zeitpunkt buchhalterisch korrekt zu quantifizieren.

Historische Vorläufer

Als in der zweiten Hälfte des 19. Jahrhunderts die Germanistik an deutschen Universitäten fest etabliert war und eine erste Blütezeit erlebte, haben sich auch die Statistiker der Vorgängerinstitutionen der heutigen statistischen Ämter mit der Materie des deutschen Wortschatzes beschäftigt. In der Zeitschrift des Königlich Preußischen Statistischen Bureaus des Jahres 1896 erschien ein umfangreicher Beitrag zur Statistik des deutschen Wortschatzes.1 In diesem historischen Beitrag geht es weniger um die statistische Ermittlung des Wortschatzumfangs, vielmehr wurde hier eine philologische Methode zur Quantifizierung von Worthäufigkeiten praxisorientiert vorgestellt und zur Verwendung empfohlen. Die Autoren sahen den künftigen Nutzen ihrer Arbeit vor allem bei den Stenografen und Druckereien. Die Ergebnisse boten Möglichkeiten zur Verbesserung der bestehenden Stenografiesysteme und zur effizienteren Ausstattung der Setzkästen in Druckereien.

Bereits in der Ausgabe 1884 der württembergischen Jahrbücher für Statistik und Landeskunde des Königlich Statistisch-Topographischen Bureaus erschien ein Artikel von Hermann Fischer »Über den schwäbischen Dialekt und die schwäbische Dialektdichtung«.2

In diesem Artikel wird auf eine sehr komplizierte Materie eingegangen, denn deutsche Dialekte werden im Regelfall nur in der mündlichen Kommunikation und nur selten in gedruckter Form verwendet. Inhaltlich wird schwerpunktmäßig die geografische Ausbreitung der schwäbischen Dialektformen analysiert. Da Dialekte zumeist nur mündlich verbreitet und überliefert werden, ist es für diese Sonderformen der deutschen Sprache sehr viel schwieriger als bei der Hochsprache, Quantitäten des Dialektwortschatzes zu ermitteln. Sowohl die badischen als auch die schwäbischen Dialekte kommen nicht in einer einheitlichen Sprachform vor, sie bestehen vielmehr aus einer Vielzahl von geografisch eng begrenzten und genutzten Sprachvarietäten. So gibt es im Sprachraum der beiden badischen Regierungsbezirke Karlsruhe und Freiburg folgende Dialektgruppen: Südfränkisch, Kurpfälzisch, Hochalemannisch, Niederalemannisch, Schwäbisch und Ostfränkisch. Das Niederalemannische wird oftmals noch unterteilt in das Oberrheinalemannische und das Seealemannische. Im mittleren und südöstlichen Teil von Baden-Württemberg, hauptsächlich in den Regierungsbezirken Stuttgart und Tübingen, wird dagegen Schwäbisch mit seinen vielen Unterformen gesprochen. Das Schwäbische gehört zu den alemannischen Dialekten und somit zu der oberdeutschen Dialektgruppe. Alleine schon diese kleine Aufzählung zeigt, dass es nahezu unmöglich ist, Näherungswerte des Wortschatzumfangs für die in Baden-Württemberg gesprochenen Dialekte zu ermitteln.

Der Wortschatzumfang

Nach führenden Sprachwissenschaftlern der deutschen Sprache umfasst der Wortschatz der deutschen Standardsprache etwa 75 000 Wörter. Je nach Quelle und Zählweise wird die derzeitige Gesamtgröße des deutschen Wortschatzes auf ca. 350 000 bis 500 000 Wörter geschätzt. Das für die deutsche Sprache wohl aufwändigste und anspruchvollste Nachschlagewerk, das Deutsche Wörterbuch, das von den Brüdern Jacob und Wilhelm Grimm begonnen und erst in der zweiten Hälfte des letzten Jahrhunderts von der nachfolgenden Germanistengeneration fertig gestellt wurde, enthält annähernd 350 000 Stichwörter der deutschen Sprache. In der aktuellen Ausgabe des Duden, dem deutschen Universalwörterbuch, wird der Wortschatz der deutschen Alltagssprache auf 500 000 Wörter geschätzt und der zentrale Wortschatz auf rund 70 000 Wörter. Die Ausgabe 2008 des anderen namhaften deutschen Wörterbuchs von Wahrig enthält rund 260 000 Stichwörter. Diese Richtgrößen zeigen, auf welchen Umfang der deutsche Wortschatz mindestens geschätzt werden muss. In all diesen Wörterbüchern gibt es nur geringe Anteile der vielen Fachwortschätze. So gibt es realistische Schätzungen, dass alleine die deutsche Fachsprache der Chemie einen Umfang von 20 Mill. Begriffen beinhaltet. Dies zeigt, dass der Gesamtwortschatz der deutschen Sprache mit der Größe 500 000 + n zu bezeichnen ist, wobei n eine unbestimmte Größe bleibt. Was den individuellen Wortschatz einer Person anbelangt, kann aufgrund seriöser sprachwissenschaftlicher Untersuchungen davon ausgegangen werden, dass mit zunehmendem Bildungsstand auch der Wortschatz eines Menschen zunimmt. Schätzungen gehen hier von einer Breite von 3 000 bis hin zu 200 000 Wörtern je nach Bildungsstand einer Person aus. Bei Goethe, dem wohl berühmtesten deutschen Dichter, konnte auf Grund einer Auszählung in seinem Gesamtwerk ein Wert von gut 90 000 aktiv gebrauchten Wörtern ermittelt werden.

1 Siehe Statistisches Bundesamt: Wirtschaft und Statistik 8/2007, Seiten 797ff.

2 Siehe Fischer, Hermann: Über den schwäbischen Dialekt und die schwäbische Dialektdichtung. In: Württembergische Jahrbücher für Statistik und Landeskunde des Königlich Statistisch-Topographischen Bureaus Jahrgang 1884. Stuttgart 1885, Seiten 56 ff.