Faculty of Language, Literature and Humanities - Corpus Linguistics and Morphology

Martin Klotz

Brief CV

2024– Researcher in CRC1412 / INF
2019–2023 Researcher in RUEG / Pd & Pc
2019 Degree MSc Cognitive Systems (Universität Potsdam)
2015

Degree BA German Linguistics & Computer Science

(Humboldt-Universität zu Berlin)

2011–2019 Student assistant at the Department of German Studies and Linguistics

Research Interests

  • corpus architectures, historical corpora, parallel corpora, (linguistic) language modelling
  • NLP for non-standard varieties
  • (semi-)automatic processing and analysis of linguistic corpora and language data
  • Research Software Engineering
  • Deep Learning, Neural Language Models

Publications

2024

Kateryna Iefremenko, Martin Klotz and Christoph Schroeder (2024). RUEG subcorpus of Kurmanji Kurdish and Turkish data (0.1) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.10810768

2023

Sabine Zerbian, Yulia Zuban and Martin Klotz (2023). Intonational Features of Spontaneous Narrations in Monolingual and Heritage Russian in the U.S.—An Exploration of the RUEG Corpus. Languages, 9(1), 2. https://doi.org/10.3390/languages9010002

Martin Klotz and Thomas Krause (accepted). Eine Ressource durch Abwägung: Wie bestehende generische Softwarelösungen ‚über sich hinauswachsen‘ und ein Parallelkorpus ermöglichen. In: Mittelniederdeutsch an der Schnittstelle zwischen Literaturwissenschaft, Sprachwissenschaft und Digital Humanities. Ed. by M. Coniglio, A. Recker & H. Sahm. Göttinger Universitätsverlag

Thomas Krause and Martin Klotz (2023). Annatto. Version 0.2.0. url: https://github.com/korpling/annatto/.

Lars Erik Zeige, Gohar Schnelle, Martin Klotz, Karin Donhauser, Jost Gippert, Rosemarie Lühr (2023). Deutsch Diachron Digital - Referenzkorpus Altdeutsch (1.2). Humboldt-Universität zu Berlin. Homepage: https://www.deutschdiachrondigital.de/.

2022

Hagen Hirschmann, Anke Lüdeling, Anna Shadrova, Dominique Bobeck, Martin Klotz, Roodabeh Akbari, Sarah Schneider, Sarah and Shujun Wan (2022). FALKO. Eine Familie vielseitig annotierter Lernerkorpora des Deutschen als Fremdsprache. In: KorDaF (Korpora Deutsch als Fremdsprache) (2:2), 139-148.

Conference talk: Martin Klotz, Annika Labrenz, Anke Lüdeling and Heike Wiese: Linguistic diversity across languages and registers: A corpus- linguistic basis for investigating emerging grammars in language-contact situations. In: Methods in Dialectology XVII. Mainz.

2021

43. DGfS-Jahrestagung, Freiburg, Februar 2021 (digitale Konferenz): Workshop Contrastive corpus methodology for language modeling and analysis with Anke Lüdeling and Anna Shadrova.

2019

Conference talk: Anke Lüdeling, Martin Klotz, and Thomas Krause (2019): A structured multi-layer register corpus of heritage languages and majority languages. In: Theme-Session The Dynamics of Heritage Speakers: a Comparative View. International Symposium of Bilingualism: The Next Generation. University of Alberta, Kanada.

Heike Wiese, Artemis Alexiadou, Shanley Allen, Oliver Bunk, Natalia Gagarina, Kateryna Iefremenko, Esther Jahns, Martin Klotz, Thomas Krause, Annika Labrenz, Anke Lüdeling, Maria Martynova, Katrin Neuhaus, Tatiana Pashkova, Vicky Rizou, Tracy Rosemarie, Christoph Schroeder, Luka Szucsich, Wintai Tsehaye, Sabine Zerbian and Yulia Zuban (2019). RUEG Corpus. DOI

2015

Anke Lüdeling, Malte Belz, Hagen Hirschmann, Martin Klotz, Carolin Odebrecht, Laura Perlitz, Marc Reznicek, Simon Sauer, Vivian Voigt, and Amir Zeldes (2015): BeMaTaC, Falko, RIDGES – Linguistische Mehrebenen-Korpora für Nicht-Standard-Varietäten des Deutschen. Digital-Humanities-Tag 2015 – Digitale Ressourcen an der Philosophischen Fakultät II.

Florian Zipser, André Röhrig, Anke Lüdeling, Martin Klotz, Thomas Krause, Stephan Druskat, and Vivian Voigt (2015): SaltNPepper, ANNIS & Atomic: Eine Infrastruktur für Mehrebenenkorpora. Digital-Humanities-Tag 2015 – Digitale Ressourcen an der Philosophischen Fakultät II.

Florian Zipser, Martin Klotz, and André Röhrig (2015): From TEI to linguistic corpora using Pepper. 37. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft.

Contact

Visiting Address
MOR40/41, Room 16.
Postal Address
Institut für deutsche Sprache und Linguistik
Philosophische Fakultät II
Humboldt-Universität zu Berlin
Unter den Linden 6
D-10099 Berlin
Telephone
+49 (0)30 2093-9720
E-Mail
martin.klotz (at) hu-berlin.de