Architektur, Annotationen und Beispielanfragen
Die Falko-Subkorpora sind auf verschiedenen Ebenen annotiert. Falko besitzt eine im Unterschied zu den meisten bisherigen Lernerkorpora eine flexible Architektur, welche es ermöglicht, jederzeit Annotationsebenen neu einzufügen und unabhängig von anderen Ebenen zu bearbeiten (multi-layer stand-off annotation). Neben den automatisch annotierten Ebenen für Wortart und Lemma (alle Subkorpora) verwenden wir spezifische Annotationsebenen für die Auszeichnung von Lernerfehlern:
Zielhypothesen: Jede Nichtstandardform wird mit einer sog. Zielhypothese annotiert, die als Grundlage für die Fehlerannotationen dient. Die Zielhypothese ist eine Annahme darüber, was in einem Standardtext an der entsprechenden Stelle im Text hätte ausgedrückt werden sollen bzw. können.
- Falko Essay L2 und L1
- Das Aufsatzkorpus ist mit einer minimalen (ZH1) und einer maximalen (ZH2) Zielhypothese annotiert. Dadurch, dass kanonische Wortformen auf den Ebenen ZH1 und ZH2 wiederholt und nicht-kanonische Wortformen "korrigiert" werden, stellen die Zielhypothesenebenen komplette Texte (Paralleltexte zum original Lernertext) dar, für die wiederum mit Wortarten (ZH1pos und ZH2pos) und Lemmata (ZH1lemma und ZH2lemma) annotiert sind. Zusätzlich wurden automatisch für die Abweichungen zwischen den Zielhypothesen und dem Originaltext sog. "edit tags" (CHA für eine abweichende Form, INS für hinzugefügte Formen, DEL für getilgte Formen, CHA für verschobene Formen, SPLIT für ausgespaltene Formen und MERGE für zusammengefügte Formen) vergeben. Diese erleichtern die gezielte Suche nach Fehlern.
- Beispielsuchen in FalkoEssay L2 und L1:
- In FalkoEssayL2v2.4: Suche nach Verwendungen der Grundform (Lemmasuche) "arbeiten"
- In FalkoEssayL2v2.4: Suche nach Vorkommen von Präposition-Artikel-Verschmelzungen (STTS-Tag APPRART) auf der Zielhypothesenebene ZH1 (ZH1pos)
- In FalkoEssayL2v2.4: Suche nach bestimmten oder unbestimmten Artikeln (STTS-Tag ART), die auf der Zielhypothesenebene ZH1 weggelassen wurden
- In FalkoEssayL2v2.4: Suche nach bestimmten oder unbestimmten Artikeln (STTS-Tag ART), die auf der Zielhypothesenebene ZH1 weggelassen wurden
- Beispielsuchen in FalkoEssay L2 und L1:
- Das Aufsatzkorpus ist mit einer minimalen (ZH1) und einer maximalen (ZH2) Zielhypothese annotiert. Dadurch, dass kanonische Wortformen auf den Ebenen ZH1 und ZH2 wiederholt und nicht-kanonische Wortformen "korrigiert" werden, stellen die Zielhypothesenebenen komplette Texte (Paralleltexte zum original Lernertext) dar, für die wiederum mit Wortarten (ZH1pos und ZH2pos) und Lemmata (ZH1lemma und ZH2lemma) annotiert sind. Zusätzlich wurden automatisch für die Abweichungen zwischen den Zielhypothesen und dem Originaltext sog. "edit tags" (CHA für eine abweichende Form, INS für hinzugefügte Formen, DEL für getilgte Formen, CHA für verschobene Formen, SPLIT für ausgespaltene Formen und MERGE für zusammengefügte Formen) vergeben. Diese erleichtern die gezielte Suche nach Fehlern.
- Beachten Sie zur Einführung in die Suche in den Falko-Korpora auch diese einführende Demonstration auf YouTube.