Sprach- und literaturwissenschaftliche Fakultät - Korpuslinguistik und Morphologie

Korpora am IdSL

Korpora im ANNIS-Suchinterface:

  • Hier gelangen Sie direkt zu den Korpora im ANNIS-Suchinterface: https://hu-berlin.de/annis.
  • Informationen zu ANNIS sowie Downloads für die lokale Verwendung von ANNIS erhalten Sie auf der Webseite https://corpus-tools.org/annis/.
  • Unter anderem können die folgenden Korpora mit ANNIS online (ohne Login) durchsucht werden:
    • Falko (ein geschriebenes Lernerkorpus mit fortgeschrittenen DaF-Lernenden),
    • BeMaTaC (ein mündliches Korpus mit Maptask-Dialogen - Deutsch L1 und L2),
    • MERLIN (ein nach Niveaustufen stratifiziertes schriftliches, fehlerannotiertes Lernerkorpus des Deutschen, Italienischen und Tschechischen als Fremdsprache),
    • RUEG (ein mündlich-schriftliches Kontaktsprachenkorpus der Heritage- und Majoritätssprachen Deutsch, Englisch, Türkisch, Russisch, Griechisch),
    • Referenzkorpus Althochdeutsch,
    • RIDGES (ein historisches, diachrones Korpus mit Kräuterkundetexten),
    • Deutsche Diachrone Baumbank (kleine, voll syntaktisch annotierte Korpora des Ahd, Mhd und Fnhd),
    • NoSta-D (kleine, voll syntaktisch annotierte Nichtstandardkorpora).
  • Hier finden Sie ein Überblicksposter zu BeMaTaC, Falko und RIDGES.
  • Eine Einführung in die ANNIS-Anfragesprache mit praktischen Beispielen für das Falko-Korpus finden Sie hier.

Korpora im CQP-Suchinterface:

  • Hier gelangen Sie zur Anmeldungsseite des Interfaces: https://hu-berlin.de/cqp.
    • Anmeldedaten für einen Testzugang:
      Name: CQP_Demo; Passwort: TestSuchen
  • Hier können Sie einen eigenen Account beantragen.
  • Im CQP-Webinterface befinden sich vor allem große, flach annotierte Webkorpora (wie deWaC) und Zeitungs- bzw. Zeitschriftenkorpora.
  • Eine Einführung in die CQP-Anfragesprache mit praktischen Beispielen aus dem HU-Webinterface finden Sie hier.