Direkt zum InhaltDirekt zur SucheDirekt zur Navigation
▼ Zielgruppen ▼

Humboldt-Universität zu Berlin - Sprach- und literaturwissenschaftliche Fakultät - Korpuslinguistik und Morphologie

corpus-tools.org

A collection of tools to process your linguistic data: annotation, conversion, analysis.

corpus-tools.org stellt eine Infrastruktur zur Erstellung und Verarbeitung von Korpusdaten zur Verfügung. Diese Infrastruktur ermöglicht die Erstellung von Korpusdaten mittels eines Annotationstools (Atomic), die Konvertierung/Vereinigung von Korpusdaten aus verschiedenen Quellen und die Generierung von Metadaten mit Pepper sowie das Durchsuchen und Auswerten von annotierten Daten mit ANNIS.

ANNIS

Was ist ANNIS?

ANNIS ist ein Such- und Visualisierungstool für Korpora. Sie können die öffentliche Instanz der Korpuslinguistik nutzen, wenn Sie direkt beginnen möchten. Es stehen dort bereits viele frei nutzbare Korpora zur Verfügung. Einige Korpora sind aber aus rechtlichen Gründen nicht frei verfügbar. Sie können jedoch für Forschungszwecke einen Account beantragen.

Wie ist ANNIS zu bedienen?

Sie haben noch keine oder nur wenig Erfahrung mit ANNIS und möchten den Umgang mit ANNIS lernen? Für diesen Zweck haben wir Videotutorials erstellt, die Ihnen den Einstieg erleichtern sollen.

Kann ich eigene Korpora mit ANNIS durchsuchen?

Sollten Sie über Korpusdaten verfügen und möchten diese durchsuchen, so steht Ihnen hierfür der ANNIS-Kickstarter zur Verfügung. Der Kickstarter ist eine ANNIS-Instanz, die Sie auf Ihrem Computer starten. Sie enthält nur die Korpora, die Sie importieren. Um dies zu tun, müssen Ihre Daten im ANNIS-Format vorliegen. Dies erreichen Sie mit Pepper, einem Konvertierungstool, das bereits viele gängige Korpusformate importieren und u.a. in das ANNIS-Format exportieren kann.

Atomic

Atomic ist ein Werkzeug zur Erstellung von (linguistischen) Annotationen. Derzeit befindet es sich noch in der Entwicklung. Genauere Informationen finden Sie auf der Projekthomepage.

Pepper

Mit Pepper können Sie Korpusdaten verschiedener Formate und unterschiedlichen Ursprungs importieren, wahrweise Vereinigen und in andere Formate exportieren. Außerdem lassen sich mit Pepper auch Metadaten zu Korpora generieren. Weitere Informationen finden Sie auf der Projekthomepage.