Sprach- und literaturwissenschaftliche Fakultät - Deutsch in multilingualen Kontexten

Korpus "Deutsch in Namibia"

Straßenzug in Namibia mit mehrsprachigen Schildern: Luisen Apotheke/Pharmacy/Apteek, Otto Mühr & Co.

Foto: Heike Wiese

Mehrsprachiges Apothekenschild in Windhoek.

Das Korpus „Deutsch in Namibia (DNam)“ entstand im Zeitraum 2016-2021, im DFG-Projekt „NamDeutsch: Die Dynamik des Deutschen im mehrsprachigen Kontext Namibias“ (WI 2155/9-1 und SI 750/4-1, Leitung: Heike Wiese und Horst Simon, in Kooperation mit Marianne Zappen-Thomson) an der Universität Potsdam (bis 2019) und an der HU Berlin (seit 2019), an der FU Berlin und an der UNAM Windhoek.

Das Korpus dokumentiert den Sprachgebrauch in formellen und informellen Situationen und die Spracheinstellungen innerhalb der deutschen Minderheit in Namibia. Die Daten liegen als Audiodaten mit alignierten und annotierten Transkriptionen vor, ergänzt durch Metadaten der Sprecher:innen (biographische Daten, Angaben zu Sprachkompetenz und Sprachgebrauch).

Mehr Details zum DNam-Korpus.

Neben dem Hauptkorpus gibt es ein Ergänzungskorpus DNam-Wenker, das „Wenker"”-Daten zum Namibiadeutschen umfasst: Über einen Online-Fragebogen wurden Übertragungen der 40 klassischen „Wenker-Sätze“ ins Namibiadeutsche erhoben, ergänzt durch einen Personenfragebogen zu biographischen, sozialen und soziolinguistischen Daten der Sprecher:innen.

Mehr Details zu DNam-Wenker.

Hauptkorpus: DNam

Förderung

DFG-Projekt „NamDeutsch: Die Dynamik des Deutschen im mehrsprachigen Kontext Namibias“, WI 2155/9-1 und SI 750/4-1.

Zugang zum Korpus

Das Korpus ist über die Datenbank für Gesprochenes Deutsch (DGD) online frei zugänglich.

Hier ist ein kurzes Tutorial zur Verwendung von DGD, mit Dank an Dr. Thomas Schmidt:

Korpusumfang und Teilkorpora

Gesamtumfang: 226 Aufnahmen, 18:39 Stunden, 110 Sprecher:innen

Set-up der Erhebung Tokens Dauer (hh:mm:ss) Sprecher:innen Aufnahmen
Freie Gespräche 115.004 9:15:00 65 21
Sprachsituationen 51.509 4:41:30 103 198
Semi-strukturierte Interviews 57.879 4:42:15 15 7
Gesamt 224.392 18:38:45 110 226

Die Aufnahmen, die für das Korpus transkribiert wurden, sind Teil einer größeren Datensammlung. Auswahlkriterien waren:

  • ausgewogenes Sample von Set-ups (ähnliche Gewichtung der drei Set-ups) und Sprecher:innen (Farmer:innen – Stadtbewohner:innen; Schüler:innen von Privat- und Staatsschulen; Sprecher:innen aus unterschiedlichen Gebieten Namibias); Vorzug für Sprecher:innen, die in Namibia geboren wurden; breites Spektrum in Bezug auf Bildungsniveau, Berufe und Altersgruppen
  • bei freien Gesprächen keine Berücksichtigung von Gesprächen mit langen und häufigen Gesprächspausen, vielen metasprachlichen Kommentaren, wenigen Teilnehmer:innen und/oder reiner Abhandlung der vorgegebenen Themen

Datenerhebung

Aufnahmezeitraum: 2017

Aufnahmeorte: deutschsprachige Schulen, Farmen, Privathäuser, öffentliche Räume in (der Umgebung von) Windhoek, Witvlei, Omaruru, Swakopmund und Otjiwarongo

Wenn Sie auf eine Stadt klicken, werden Ihnen Metadaten zu den Sprecher:innen in der DGD-Veröffentlichung des Korpus' angezeigt.

Created with Raphaël 2.1.0 Windhoek Swakopmund Witvlei Omaruru Otjiwarongo Otavi

Witvlei

 1015202530354045505560657075024681012141618202224Alter (in Jahren)Anzahl Sprecher:innen

Die Datenerhebung erfolgte in drei unterschiedlichen Set-ups:

Generell:
  • 2-5 Personen, in Abwesenheit der Forschenden in informellem Kontext
  • Themen klassischer soziolinguistischer Interviews (z.B. Kinderspiele) und/oder Gespräch über alltagsrelevante Aspekte des Lebens
Bei Aufnahmen von Schüler:innen:
  • ein:e Sprecher:in fungierte als Gesprächsleiter:in
  • zu Beginn als Gesprächsimpuls kurzes Musikvideo (Sundowner von EES, deutsch-namibianischer Popmusiker), weitere Gesprächsimpulse z.B. Musikgeschmack und "Stories" der Eltern, Erfahrung mit Deutschland-Deutschen ("Jerries"), Kinderspiele und -aktivitäten (Jagen, Puppen, "Ketti"/Steinschleudern, Autofahren), Erlebnisse in gefährlichen Situationen, Unterschiede zwischen Internatsbewohner:innen ("Heimern") und Tagesschüler:innen ("Städtern")
  • Korpusdaten erfassen das Gespräch nach der Präsentation des Musikvideos, da sich die Gesprächsteilnehmer:innen zu diesem Zeitpunkt an die Aufnahmesituation gewöhnt hatten
  • bei Aufnahmen von Erwachsenen: keine spezifischen Themenvorschläge, sondern Bitte, miteinander über aktuelle Themen zu sprechen (oft wurden dann Gespräche über anliegende Alltagsthemen auf der Farm geführt)
Stimulus für die Erhebungsmethode LangSit: Bilderserie eines Autounfalls

Foto: Anika Kroll-Tjingaete

Stimulus für die Erhebungsmethode LangSit: Bilderserie eines Autounfalls.

  • elizitierte, naturalistische Daten in formellem und informellem Register
  • Aufnahmen in Kleingruppen
  • Sprecher:innen berichten in einem simulierten Gespräch zwei verschiedenen Gesprächspartner:innen über einen Verkehrsunfall: einer Deutschlehrkraft aus der Schule, gespielt von dem/der Aufnahmeleiter:in (formelles Setting) oder einer anwesenden nahestehenden Person (Freund:in, Familienmitglied)
  • siehe LangSit-Webseite für ausführliche Informationen zur Erhebungsmethode
  • durchgeführt mit 2-3 Sprecher:innen
  • Impulsfragen zu Sprachbiographie, -einstellungen, perzeptionsdialektologischen Aspekten

Sprecher:innen

Aufnahmesituation mit Forschenden

Foto: Yannic Bracke

Aufnahmesituation mit Forschenden (Christian Zimmer, Heike Wiese).

Die Metadaten der Sprecher:innen umfassen

  • biographische Informationen: Geschlecht, Geburtsjahr, Beruf, für Schüler:innen: Schule, Geburtsort (Land, Ort), Angabe, wo aufgewachsen (Land, Region, Ortsname)
  • soziolinguistische Informationen: Sprachen der Mutter und des Vaters, Sprachen der Eltern untereinander
Gruppe Anzahl Anzahl männlich Anzahl weiblich Alter
Kinder (nicht Schüler:innen) 3 3 0 6, 14, 17
Schüler:innen 81 43 38 14-18, Durchschnitt: 16 (7 ohne Altersangabe)
Erwachsene 26 13 13 26-75, Durchschnitt: 48 (1 ohne Altersangabe)
Gesamt 110 59 51 6-75, Durchschnitt: 24

Annotation, Transkription, Anonymisierung/Siglen

Annotationsebenen

Die Daten liegen mit Annotation als Audiodateien und in Form von Transkripten vor. Die Transkripte sind mit sechs Annotationsebenen versehen:

  • Transkriptionsebene (trans): ursprüngliche Transkriptionsebene (literarische Umschrift)
  • Tokenisierte Transkriptionsebene (trans_tok): Aufteilung der Transkription in einzelne Tokens
  • Normalisierte Ebene (norm): Transkription nach standardsprachlicher Orthographie; keine Veränderung nicht-standardsprachlicher Äußerungen (z.B. in Bezug auf Kasus oder Genus)
  • Wortarten/Part-Of-Speech-Tagging (pos): basierend auf STTS 2.0, ergänzt um drei korpusspezifische Tags (ATM: hörbares Atmen, META: Doppelklammer bei Transkription paraverbaler Äußerungen „((lacht))“, SOART: Kontraktion von son und Flexionsformen)
  • Lemmaebene (lemma): Wortlemma
  • Annotation kontaktsprachlicher Tokens (FW): Informationen zu Gebersprache, Umfang der Integration und Existenz eines Lexikoneintrags in der Onlineversion des "Duden"-Wörterbuchs (2020). Diese Annotationsebene ist noch nicht im DGD verfügbar, wird aber in zukünftigen Releases verfügbar gemacht. Die Annotationsrichtlinien für die kontaktsprachlichen Tokens finden Sie hier.

Folgende Abbildung illustriert die Transkriptionsebenen in einem EXMARaLDA-Transkript:

Screenshot eines EXMARaLDA-Transkripts

Screenshot eines Transkripts mit allen Transkriptionsebenen.

Transkription

Einer der Aufnahmeorte: Eine Farm

Foto: Heike Wiese

Einer der Aufnahmeorte: Eine Farm.

Die orthographische Transkription erfolgte mit dem Partitur-Editor von EXMARaLDA (Schmidt, 2016), die Annotationsrichtlinien sind eine leichte Modifizierung der cGAT-Konventionen (Schmidt et al. 2015). Die Annotationsrichtlinien mit den Abweichungen von den cGat-Konventionen finden Sie hier. Die Transkription folgt weitgehend der Standardorthographie, erfasst aber gleichzeitig typische Phänomene der gesprochenen Sprache (z.B. Elisionen, Kontraktionen, Wortabbrüche, Gesprächspausen) sowie paraverbale und nonverbale Informationen. Die ersten Versionen der Transkriptionen wurden jeweils von einem weiteren Teammitglied kontrolliert, Abweichungen wurden mit der/dem ursprünglichen Transkribentin/en besprochen und aufgelöst. Eine finale Kontrolle erfolgt durch eine deutschsprachige Namibianerin.

Anonymisierung und Siglen

  • Anonymisierung von Personennamen, spezifischen Ortsangaben (z.B. Farmen) sowie aller Aussagen, die Rückschlüsse auf die Identität von Personen erlauben
  • Maskierung in den Audiodateien
  • Anonymisierung durch vier Arten von Siglen im Korpus, die teilweise metasprachliche Informationen enthalten
    • Siglen für Sprecher:innen:
      Sprecher:in ID-Nummer Geschlecht Altersgruppe
      NAM 006 W 1
       
      • 001 - 2xx

        eine Zahl pro Sprecher:in

      • M

        männlich

      • W

        weiblich

      • 1

        unter 21

      • 2

        21 - 40

      • 3

        41 - 60

      • 4

        über 60

    • Siglen für die Forscher:innen (z.B. RES1-RES4)
    • Siglen für einzelne Tokens, die anonymisiert wurden: Anfangsbuchstabe des anonymisierten Ausdrucks + dreistellige Zahl, z.B. N001
    • Siglen für anonymisierte Äußerungen, die aus mehreren Tokens bestehen: Phrase „anonymisierte_Äußerung“ + dreistellige Zahl, z.B. anonymisierte_Äußerung001

Projektbeteiligte

Mehrsprachige Werbung für einen Weihnachtsmarkt in Namibia

Foto: Heike Wiese

Mehrsprachige Werbung für einen Weihnachtsmarkt in Namibia.

PIs: Heike Wiese, Horst J. Simon

Kooperationspartner:innen: Marianne Zappen-Thomson, Thomas Schmidt, Hans Boas

Projektmitarbeiter:innen: Christian Zimmer, Janosch Leugner, Yannic Bracke, Britta Stuhl, Laura Perlitz

Studentische Hilfskräfte: Jones Anam, Christian Anders, Alexandra Fosså, Semra Kizilkaya, Carina Schüffler, Claudia Czarniak, Philipp Klaußner, Jula Kostka, Anika Kroll-Tjingaete, Johanna Pott, Britta Stuhl

Zitierweise

Zimmer, Christian; Wiese, Heike; Simon, Horst J.; Zappen-Thomson, Marianne; Leugner, Janosch; Bracke, Yannic; Stuhl, Britta; Perlitz, Laura, & Schmidt, Thomas: DNam-Korpus zum Deutschen in Namibia.

Literatur

Wiese, Heike; Simon, Horst J.; Zimmer, Christian & Schumann, Kathleen (2017). German in Namibia: A vital speech community and its multilingual dynamics. In Péter Maitz & Craig A. Volker (Hg.), Language Contact in the German Colonies. S.221-245.

Zimmer, Christian; Wiese, Heike; Simon, Horst J.; Zappen-Thomson, Marianne; Leugner, Janosch; Bracke, Yannic; Stuhl, Britta, & Schmidt, Thomas (2020). Das Korpus Deutsch in Namibia (DNam): Eine Ressource für die Kontakt- Variations- und Soziolinguistik. Deutsche Sprache 3: 210-232.

Ergänzungskorpus zum DNam: DNam-Wenker

2013/14 wurden “Wenker”-Daten zum Namibiadeutschen über eine Online-Plattform erhoben.

Die Erhebung wandte sich an Deutschnamibier:innen aller Altersgruppen und diente dazu, breite Daten zu bestimmten Bereichen von Lexikon und Grammatik zu gewinnen, die durch dieses klassische Werkzeug der germanistischen Dialektforschung eine weite Vergleichbarkeit mit anderen, auch älteren Studien zu dialektalen Formen im Deutschen gewährleisten. Um möglichst viele Sprecher:innen zu erreichen, entwickelten wir einen Online-Fragebogen mit den 40 ursprünglichen „Wenker-Sätzen“, ergänzt durch einen einleitenden Text zum Namibia-Deutschen, dem Forschungsprojekt und den „Wenker-Sätzen“ sowie einen Personenfragebogen zu biographischen, sozialen und soziolinguistischen Daten am Ende.

Hier finden Sie den genauen Wortlaut der Aufgabenstellung in der online durchgeführten Umfrage und hier die 40 abgefragten Wenker-Sätze.

Durch umfangreiche Medienarbeit und Dissemination in der deutschsprachigen Gemeinschaft über Radio, Zeitung, Kirchengemeinden und Schulen konnten über 200 Teilnehmer:innen gewonnen werden; damit ist ca. ein Prozent der Sprechergemeinschaft erfasst. Für die engagierte Unterstützung bei der Dissemination von Informationen zur „Wenker“-Umfrage danken wir der Delta-Schule und der Deutschen Höheren Privatschule (DHPS) Windhoek, Wilfried Hähner vom „Hitradio Namibia“ und der „Allgemeinen Zeitung Windhoek“ und dem damaligen Bischof der evangelisch-lutherischen Kirche in Namibia, Bischof Hertel.

Die Ergebnisse der Wenker-Namdeutsch-Umfrage stehen als Excel-Tabelle unter der CC BY 3.0-Lizenz frei zur Verfügung.

Creative Commons License
Wenker-Namdeutsch by Heike Wiese is licensed under a Creative Commons Attribution 3.0 Germany License.

Dokumentation

Nicht alle Umfragenteilnehmer:innen haben den Fragebogen vollständig ausgefüllt. In den entsprechenden Datensätzen sind die leeren Felder mit „NA“ markiert. Die Angaben der Proband:innen wurden ohne Änderungen übernommen, bis auf drei Bereiche, die aus Datenschutzgründen verändert wurden:

  1. Angaben zum Beruf wurden entfernt
  2. Das Geburtsjahr wurde als Zeitspanne von zehn Jahren angegeben
  3. Bei der Frage nach dem Wohnort im Umfragezeitraum wurde für alle namibischen Städte das Land „Namibia“ angegeben. Alle Datensätze mit einem Wohnort außerhalb von Namibia wurden aus der Tabelle entfernt. Datensätze ohne Angabe zum Wohnort wurden beibehalten.

Mitarbeit / Unterstützende

Heike Wiese, Hans C. Boas, Horst J. Simon, Marianne Zappen-Thomson, Laura Perlitz, Oliver Bunk

Zitierweise

Wiese, Heike (2014): DNam-Wenker. Ein Korpus mit 'Wenker'-Sätzen zum Namibiadeutschen.