Direkt zum InhaltDirekt zur SucheDirekt zur Navigation
▼ Zielgruppen ▼

Sprach- und literaturwissenschaftliche Fakultät - Korpuslinguistik und Morphologie

Transkriptionsrichtlinien

BeMaTaC – Ein tief annotiertes multimodales Map-Task-Korpus gesprochener Lerner- und Muttersprache

Allgemein


  • Groß-/Kleinschreibung entsprechend der deutschen Rechtschreibung (keine Großschreibung am Satzanfang, da keine Satzdefinition)

    Beispiel: jetzt gehst du weiter zum Rad

  • Keine Interpunktion

    Nicht: Also, wo bist du jetzt? Beim Metzger?
    Sondern: also wo bist du jetzt beim Metzger

  • Keine Abkürzung von vollständig ausgesprochenen Wörtern

    Nicht: o.k. du gehst rechts herum usw.
    Sondern: okay du gehst rechts herum und so weiter

  • Keine Verwendung von Apostrophen

    Nicht: hab's, 'ne, Wies'n, McDonald's
    Sondern (dipl): habs, ne, Wiesn, McDonalds
    Sondern (norm): hab es, eine, Wiesn, McDonalds

  • Vermeidung von Bindestrichen soweit möglich

    Nicht: Chemielabor-Assistentin
    Sondern: Chemielaborassistentin

  • (?) kennzeichnet Unverständliches

    Beispiel: du (?) nach rechts


Diplomatische Transkription (dipl)


  • Vergleichbar mit der umgangssprachlichen Schreibweise in geschriebenen Internetchats oder in Kurznachrichten

    Beispiel: asso dann gehste also gradeaus weiter

  • Keine Verschriftlichung von vorhersagbaren, standard- oder dialektüblichen phonetischen Informationen

    Nicht: Keese, östlicha, Nordn, okeh
    Sondern: Käse, östlicher, Norden, okay

  • Keine Verschriftlichung von Prolongationen

    Nicht: laaaaang
    Sondern: lang

  • Enklitische Zusammenziehungen bilden ein gemeinsames Token

    Beispiele: haste, hamma, habs

  • Gefüllte Pausen (Filler) müssen aus der folgenden Auflistung stammen (wenn sie nicht gänzlich anders realisiert wurden):

    äh, ähm, mhm, mh mh, hmm

  • Wortabbrüche werden mit Schrägstrich gekennzeichnet

    Beispiel: Abbru/

  • Zusammenhängendes Stottern einzelner Laute stellt keinen Abbruch dar und wird als ein Wort transkribiert

    Beispiel: pppasst


Normalisierte Transkription (norm)


  • Folgt den amtlichen Regeln der neuen deutschen Rechtschreibung

  • Jedes Wort bildet ein eigenes Token, d.h. Leerzeichen innerhalb eines Tokens kommen nur ausnahmsweise z.B. bei mehrteiligen Namen vor

    Beispiele: [New York], [Anna Lena]

  • Zusammenziehungen werden in zwei einzelne Token aufgeteilt

    Beispiele (dipl): [haste], [hamma], [habs]
    Beispiele (norm): [hast] [du], [haben] [wir], [habe] [es]

  • Abgebrochene Wörter und gefüllte Pausen (Filler) kommen in der normalisierten Transkription nicht vor

    Beispiel (dipl): bis zum Gem/ Apfelstand kurz vorm Apfelstand gehst du links ähm und dann
    Beispiel (norm): bis zum Apfelstand kurz vorm Apfelstand gehst du links und dann

  • Abbruch und Fortsetzung innerhalb eines Kompositums wird als ein gemeinsames Token normalisiert

    Beispiel (dipl): [Chemieli/] [labor]
    Beispiel (norm): [Chemielabor]

  • Semantisch gefüllte Wörter sind von gefüllten Pausen abzugrenzen und werden daher auch in die normalisierte Transkription übernommen

    Beispiele: mhm (wenn intonatorisch als Zustimmung oder Ablehnung identifizierbar), ah, oh, aha

  • Keine Korrekturen oder Zielhypothesen für falsch verwendete Wortformen (insbesondere bei Lernersprache)

    Nicht korrigiert: ein großer Mensch
    Sondern unkorrigiert: eine großes Mensch

  • Weitere Beispiele für Änderungen bei der Normalisierung:

    Beispiele (dipl): [jap], [naja], [jajaja], [ne(e)]
    Beispiele (norm): [ja], [na] [ja], [ja] [ja] [ja], [nein/nicht/eine]


Transkription extralinguistischer Ereignisse (extra)


  • Alle nonverbalen und deutlich hörbaren Ereignisse

  • Formulierung immer in der 3. Person Singular

    Beispiele: lacht, holt Luft, klopft

  • Zeichen-/Stiftgeräusche werden immer mit zeichnet annotiert

  • Keine Annotation von Sprechart wie z.B. flüstert oder nuschelt

  • Ereignisse, die sowohl für Instructor als auch für Instructee annotiert sind, sind nicht eindeutig zuordenbar oder werden von beiden verursacht

  • (?) kennzeichnet nicht identifizierbare, aber dennoch deutlich hörbare Ereignisse



Letzte Aktualisierung: 21. März 2014