Direkt zum InhaltDirekt zur SucheDirekt zur Navigation
▼ Zielgruppen ▼

Humboldt-Universität zu Berlin - Sprach- und literaturwissenschaftliche Fakultät - Korpuslinguistik und Morphologie

Architektur & Annotation

Architektur und Annotation des Falko-Korpus

Die Subkorpora sind auf verschiedenen Ebenen annotiert. Falko besitzt eine im Unterschied zu den meisten bisherigen Lernerkorpora eine flexible Architektur, welche es ermöglicht, jederzeit Annotationsebenen neu einzufügen und unabhängig von anderen Ebenen zu bearbeiten (multi-layer stand-off annotation). Neben den automatisch annotierten Ebenen für Wortart und Lemma (alle Subkorpora) verwenden wir spezifische Annotationsebenen für die Auszeichnung von Lernerfehlern:

  • Summary L2
    • Zielhypothese: Hier wird jeder Fehlerbereich mit einer Zielhypothese annotiert, die als Grundlage für die Fehlerannotationen dient.
    • Bezogen auf die Zielhypothese sind Lernerfehler annotiert. Neben der automatischen Wortartannotation gibt es eine korrigierte Wortartenannotation. Zusammenfassungskorpus und Longitudinalkorpus sind mit syntaktischen Feldern und Fehlern annotiert. An weiteren Fehlereben arbeiten wir zur Zeit.
  • Essay L1 & L2
    • Das Aufsatzkorpus ist mit einer minimalen und einer maximalen Zielhypothese annotiert. Diese stellen komplette Texte dar, für die wiederum POS und lemma annotiert sind. Zusätzlich wurden automatisch für die Abweichungen zwischen den Zielhypothesen und dem Originaltext sog. "edit tags" vergeben. Die die gezielte Suche nach Fehlern erleichtern.