Das DDR-Corpus im Aufbau

Das DDR-Corpus wird ein Teil des "Digitalen Wörterbuchs der deutschen Sprache" (DWDS). Das DWDS ist ein Großprojekt der BBAW mit dem Ziel, die deutsche Sprache des 20. Jahrhunderts möglichst umfassend zu dokumentieren und der Öffentlichkeit zur Verfügung zu stellen. Neben dem Kerncorpus umfasst das DWDS mehrere Spezialcorpora, u. a. das DDR-Corpus mit 9 Millionen Textwörtern in 1150 Texten. Diese Texte entstammen den Bereichen Belletristik, Zeitungen, Wissenschaft, Gebrauchstexte sowie gesprochene Sprache und wurden publizierten Quellen entnommen.
Aufbauend auf diese im DWDS gespeicherten Dokumente wird das DDR-Corpus durch halböffentliche und private Texte erweitert. Diese halböffentlichen und privaten Texte sind alle von Personen oder Institutionen produziert worden, die in der DDR zwischen dem 7. Oktober 1949 und 2. Oktober 1990 gelebt oder existiert haben. Diese Texte liegen fast ausschließlich in nicht publizierter Form vor. Sie müssen von Einzelpersonen, aus Museen und Archiven zusammengetragen werden. Zu den halböffentlichen Texten gehören u. a.:

-    Miet-, Arbeits-, Ausbildungs- und Patenschaftsverträge,
-    Haus- und Schulordnungen,
-    Geschäftsbriefe,
-    Brigadetagebücher,
-    Eingaben,
-    die Wiedergabe von Unterrichtsstunden,
-    Arbeitseinweisungen und Arbeitsschutzbelehrungen,
-    Gebrauchsanweisungen,
-    Speisekarten,
-    Kino- und Theaterprogramme.


Die private Kommunikation wird u. a. durch folgende Textsorten erfasst:

-    private Tagebücher,
-    Briefe und Postkarten,
-    persönliche Gespräche,
-    Kontakt- und Todesanzeigen.


Dieses computerverfügbare Corpus folgt den lexikographischen Vorgaben des DWDS. Neben den Wortinformationen können die Texte des DDR-Corpus als Faksimiles und in digitalisierter Form abgerufen werden. Als Muster liegt die Textsorte "Kontakanzeigen" vor. Als Muster liegen die Textsorten "Kontaktanzeigen" und eine Sammlung von
120 "Privatbriefen", die von Ost nach West geschickt wurden, vor. Sie sind unter http://telota.bbaw.de/kontaktanzeigen und http://telotadev.bbaw.de/pvd einsehbar.
Das Corpus gibt Auskunft über die sprachliche Kommunikation vom Anfang bis zum Ende der DDR-Gesellschaft, es widerspiegelt das Entstehen und Vergehen von Textmustern sowie deren Kontinuität und Wandel.
Das Corpus kann außerdem die Basis für eine zukünftige korpusgestützte vergleichende Betrachtung der sprachlichen Verhältnisse in der Bundesrepublik und in der DDR von 1949 bis 1990 bilden – was aber ein ähnliches Corpus von BRD-Texten voraussetzt.
Da diese Texte historische Dokumente sind, können sie auch für historische, soziologische und kulturanalytische Analysen herangezogen werden.

Realisiert wird das Projekt in Zusammenarbeit mit dem Zentrum Sprache der Berlin-Brandenburgischen Akademie der Wissenschaften, finanziell unterstützt durch das Institut für deutsche Sprache und Linguistik der Humboldt-Universität zu Berlin.
Document Actions
last modified 11-04-27 by Guido Kiecker
Personal tools