Direkt zum InhaltDirekt zur SucheDirekt zur Navigation
▼ Zielgruppen ▼

Sprach- und literaturwissenschaftliche Fakultät - Korpuslinguistik und Morphologie

Dr. Anna Shadrova

Wiss. Mitarbeiterin (Korpuslinguistik, insb. quantitative Methodologie, L2-Erwerb, Lexikosyntax, Variation)

Kontakt



Dorotheenstraße 24
Raum 3.333
10117 Berlin - Mitte

anna [punkt] shadrova [ät] hu-berlin [punkt] de
Postanschrift:

c/o Institut für deutsche Sprache und Linguistik
Sprach- und Literaturwissenschaftliche Fakultät
Humboldt-Universität zu Berlin
Unter den Linden 6
D-10099 Berlin

Interessen

Korpuslinguistik, insb. Methdologie und epistemologische Einbettung, Datenmodellierung, computerlinguistische und quantitative Methoden in kleinen und mittelgroßen Korpora (SMISC); Formalisierung gebrauchsbasierter Methoden, L2-Erwerb, Schnittstellenphänomene wie Koselektion, Lexikosyntax, linguistische Variation und Interlanguage

Aktuelle Projekte

Contrastive corpus methodology and language modeling and analysis

Workshop bei der 43. DGfS-Jahrestagung in Freiburg, 24.-26. Februar 2021. Mit Martin Klotz und Anke Lüdeling. Call und Information: https://www.linguistik.hu-berlin.de/de/institut/professuren/korpuslinguistik/events/kurz-ag-msc

L.L.Con: Leibniz Linguistic Research into Constitutional Law

Seit Februar 2018 bin ich Wissenschaftliche Mitarbeiterin an der Juristischen Fakultät am Lehrstuhl von Prof. Dr. Christoph Möllers im Leibniz-Projekt zu Eigenschaften und Entwicklungen der Sprache in Urteilen des Bundesverfassungsgerichts seit seinem Entstehen.

Aktuelle Arbeiten befassen sich mit dem epistemologisch navollziehbaren Einsatz von Topic Modeling in geistes- und sozialwissenschaftlichen Fragestellungen; der Kanonisierung der Rechtsprechung des Bundesverfassungsgerichts in einer Analyse von Zitatenetzwerken; sowie der Automatisierbarkeit der Extraktion von komplexen Textstrukturaspekten.

Themenauswahl: Datenmodellierung, quantitative Linguistik, Stilometrie, Netzwerkanalyse, Topic Modeling, Informationsextraktion in formalisierter Sprache, Formalisierung als Aspekt von Sprache, linguistische Modellierung komplexer Konzepte

Dissertation

Meine Dissertation "Measuring coselectional constraint in learner corpora: A graph-based approach" ist erschienen: http://edoc.hu-berlin.de/18452/22356

Darin habe ich die strukturelle Entwicklung von Koselektionsbeschränkungen (~ Kollokation, Idiomatizität, idiom principle) in  Verbargumentstrukturen bei DaF-LernerInnen in verschiedenen Erwerbsstadien untersucht. Grundlage dafür waren Essays chinesischer und belarusischer Deutschlerner*innen aus dem Netzwerk Kobalt-DaF. Es geht um die Frage, ob und wie sich L1-ähnliche Auswahl in Lernertexten auch in kleineren und mittelgroßen Korpora messen und bestimmen lässt und ob es eine strukturelle Entwicklung mit einer Zunahme von Beschränktheit mit zunehmendem Spracherwerb gibt, sowie einen Einbruch in der Beschränktheit auf mittleren Erwerbsstufen, sprich einen U-Kurven-förmigen Erwerbsverlauf. In einer graphbasierten Analyse auf Basis von Louvain-Modularität (Blondel et al. 2008) zeigt sich in der Tat eine Zunahme der Modularität bei beiden Lerner*innengruppen, ein U-Kurven-Verlauf ist allerdings nur bei den belarusischen Lerner*innen sichtbar. Das diskutiere ich aus typologischer, kultureller, und kognitiver Perspektive. Die Arbeit behandelt außerdem die bisher geringe theoretische Einbettung von Koselektion in die gebrauchsbasierte Theorie, stellt die geringe Erklärkraft des sogenannten "phraseologischen Kontinuums" fest, diskutiert die Unadäquatheit lexikalischer Assoziationsmaße für die Bewertung von Koselektionsbeschränkungen in Korpora, und macht Vorschläge für die Einbeziehung von graphbasierten Methoden in lexikalischen und lexikosyntaktischen Fragestellungen.

Betreut von Prof. Dr. Anke Lüdeling and Prof. Dr. Amir Zeldes (Georgetown University, Washington, D.C.). Prädikat summa cum laude. Teilweise finanziert durch ein Stipendium der Hans-Böckler-Stiftung (2014-2018) im Rahmen der Promotionsförderung des Bundesministeriums für Bildung und Forschung (BMBF) und ein Research Track-Stipendium der Humboldt Graduate School (2013).

Themen: Korpuslinguistik, Zweitspracherwerb, exakte Formalisierung gebrauchsbasierter Modelle, methodische Fragen der quantitativen Linguistik bei kleinen und mittelgroßen Korpora (SMISC), insb. graphbasierte Analysemethoden, Validierung

Referenz:
Blondel, Vincent D; Guillaume, Jean-Loup; Lambiotte, Renaud; Lefebvre, Etienne (9 October 2008). "Fast unfolding of communities in large networks". Journal of Statistical Mechanics: Theory and Experiment. 2008 (10): P10008. arXiv:0803.0476.

RUEG - Research Unit Emerging Grammar

Ich bin assoziiert mit der Forscher*innengruppe RUEG, die sich mit der Emergenz grammatischer Strukturen bei innerem und äußerem Sprachkontakt bei Herkunftssprecher*innen beschäftigt. Meine Interessen bewegen sich dort im Bereich der Methodenentwicklung für kleine bis mittelgroße Korpora, insb. Graphmetriken, Bayessche Statistik vs. komplexe frequentistische Modelle (insb. gemischte Modelle), Methoden maschinellen Lernens und ihre Optimierung für kleine Datenmengen sowie Informationsextraktion durch Introspektion von maschinellen Lernmethoden.

DALeKo - Dokumentation und Analyse von Lernersprache

Im Rahmen des Projektes Dokumentation und Analyse von Lernersprache, kurz DALeKo, an der Humboldt-Universität Berlin sammelt der Arbeitskreis Fremdsprachendidaktik (Anglistik, Romanistik, Slawistik) für die Erstellung einer Datenbank fremdsprachliche Lernertexte. Zunächst werden in den Kooperationsschulen erhobene Klausuren aus Abiturjahrgängen in den Sprachen Englisch, Französisch, Russisch und Spanisch in die im Aufbau befindliche Korpusdatenbank eingegeben. Russische Texte aus dem schulischen und universitären Kontext sind bereits über Annis³ durchsuchbar. Da die Daten strengen Datenschutzrichtlinien unterliegen, ist eine vorherige Registrierung bei Prof. Anka Bergmann notwendig.

 

INDUS-Netzwerk: Individualisiertes Sprachlernen: Sprachtechnologische Ansätze und ihre Schnittstellen (assoziiert)

Website hier.
Ausschnitt aus der Projektbeschreibung:

Individualisiertes Sprachenlernen (als Gegenstück zu standardisierten Massenkursen) ist durch neuste Entwicklungen der Sprachtechnologie in greifbare Nähe gerückt (...). Es zeigt sich jedoch, dass die Einbettung der Technologien in reale Lernsituationen viele neue Fragen aufwirft, die nur durch eine viele Disziplinen überspannende Forschungsanstrengung beantwortet werden können.

Das INDUS-Netzwerk bringt dazu Akteure aus den Disziplinen Sprachtechnologie, Linguistik, Bildungsforschung, Lernpsychologie, Pädagogische Psychologie, Spracherwerbsforschung und Didaktik des Sprachenlernens zusammen, die sich im Kontext ihrer spezifischen Expertise bereits mit dem Lernen von Sprachen auseinandergesetzt haben (...).

 

Publikationen, Ressourcen und Vorträge

Publikationen
 

[Peer-reviewed Paper] Lüdeling, Anke; Hagen Hirschmann, Anna Shadrova & Shujun Wan (under review): Tiefe Analyse von Lernerkorpora. IDS-Jahrbuch 2020.

[Peer-reviewed Paper] Shadrova, A. (under review): It may be in the structure, not the combinations: Graph metrics as an alternative to statistical measures in corpus-linguistic research. DhD Graph Proceedings 2019/2020.

[Peer-reviewed Paper] Ighreiz, A., L. Rolfes, A. Shadrova & A. Tischbirek (accepted): Karlsruher Kanones: Selbst- und Fremdkanonisierung der Rechtsprechung des Bundesverfassungsgerichts. Archiv des öffentlichen Rechts.

[Dissertation] Shadrova, Anna (2020): Measuring coselectional constraint in learner corpora: A graph-based approach. Univ.-Dissertation: Humboldt-Universität zu Berlin. http://dx.doi.org/10.18452/21606.

[Peer-reviewed Paper] Lüdeling, Anke; Hirschmann, Hagen & Shadrova, Anna (2017) Linguistic Models, Acquisition Theories, and Learner Corpora: Morphological Productivity in SLA Research Exemplified by Complex Verbs in German. Language Learning Special Issue on Language learning research at the intersection of experimental, corpus-based and computational methods: Evidence and interpretation 67 (S1),  96-129.

[Buchkapitel] Thomas, E. M., Cantone, K. F., Davies, S., & Shadrova, A. (2014). Cross-linguistic influence and patterns of acquisition: The emergence of gender and word order in German-Welsh bilinguals. In: E. M. Thomas and I. Mennen (Eds.): Advances in the Study of Bilingualism, p. 41-62. Clevedon: Multilingual Matters.

[Masterarbeit] Shadrova, A. (2013): Mehr Chunks! – Entwicklungsperspektiven für die Konstruktionsgrammatik unter Einbeziehung von Phraseologie, Psycholinguistik und L2-Erwerbsforschung. Online publiziert auf dem HU-Edocs-Server (hier).

Ressourcen

Kobalt-DaF Ergänzungskorpus, Analyseskripte, extrahierte Graphen, und R-Plots aus der Dissertation: https://doi.org/10.5281/zenodo.3584091

Vorträge & Workshops

[Disputationsvortrag] Shadrova, Anna (2020): Interlanguage-Effekte in L1 und L2: Eine graphbasierte lexikosyntaktische Betrachtung anhand geschriebener Korpusdaten aus Falko und RUEG, HU Berlin, 10.07.2020.

[Vortrag] Shadrova, Anna (2020): No free lunch: Ob und wie Topic Modeling und andere probabilistische Informationsexktraktionsverfahren zum Erkenntnisgewinn genutzt werden können. Korpuslinguistisches Kolloquium, HU Berlin, 08.07.2020.

[Konferenzbeitrag] Shadrova, Anna (2020): Graph metrics as an alternative to statistical
measures in linguistic research. Graph Technologies in the Digital Humanities 2020, Wien, 21.02.2020.

[Vortrag] Shadrova, Anna (2020): Korpuslinguistische Modellierung juristischer
Fragen in einem Korpus von BVerfG-Entscheidungen. Korpuslinguistisches Kolloquium, HU Berlin, 22.01.2020.

[Vortrag] Shadrova, Anna (2019): Individuelle Varianz und Textlängeneffekte:
Wie geht Sampling in Lernerkorpora? Korpuslinguistisches Kolloquium, HU Berlin, 05.06.2019.

[Vortrag] Lüdeling, Anke & Anna Shadrova (2020): Forschungsfragen, Modelle, Auswertung. Möglichkeiten und Grenzen der korpusgestützten Textanalyse. Workshop "Methoden quantitativer Textanalyse", Berlin, 21.11.2019.

[Vortrag] Tischbirek, Alexander & Anna Shadrova (2020): Karlsruher Kanones? Selbst- und Fremdkanonisierung der Rechtsprechung des BVerfG. Workshop "Methoden quantitativer Textanalyse", Berlin, 21.11.2019.

[Konferenzbeitrag] Shadrova, Anna (2019): U-shaped learning of verb argument
coselection in learners of German. Learner Corpus Research 2019, Warschau, 13.09.2019.

[Vortrag] Shadrova, Anna (2018): Lernerkorpora: Mehrebenenannotation und Zielhypothesen als Such- und Analysewerkzeug. Workshop "Von Lernerdaten zu Lernerkorpora", Schloss Rauischholzhausen, 12.07.2018.

[Vortrag] Shadrova, Anna (2017): Korpuslinguistische Kollokationsanalyse als Trendscout-Analyse zum Förderprogramm „Industrielle Gemeinschaftsforschung – IGF“. Vortrag beim IGF-Arbeitstreffen am BWMI, 04.10.17.[Vortrag] Shadrova, Anna (2017): Lexikalische Assoziatiosmaße und Idiomatizität: Eine Problemskizze anhand von Lernerdaten aus dem Kobalt-Korpus. Korpuslinguistisches Kolloquium, HU Berlin, 24.05.2017.
 

[Konferenzbeitrag] Shadrova, A. (2015): Learners know their German: Statistical similarities of surface features in German L1 and L2 essays. International Symposium on Bilingualism 10, 24.05.2015.

[Vortrag] Shadrova, Anna & Anke Lüdeling (2015): Individuelle Differenzen in Lernerdaten. INDUS-Netzwerktreffen, Universität Duisburg-Essen.

[Vortrag] Shadrova, Anna (2014): "Kobalt-E: Erste Ergebnisse". Netwerk Kobalt-DaF. Arbeitstreffen in Tübingen, 04.11.14. Folien

Workshops

[Workshop] Krause, Thomas & Anna Shadrova (2016) Korpus III: Einführung in die Annis-API mit Python. Linguistischer Methodenworkshop 2016, Institut für deutsche Sprache und Linguistik. Humboldt-Universität zu Berlin, 23.02.2016.

[Workshop] Shadrova, Anna & Thomas Krause (2016) Korpus II: Frequenzanalyse, Dependenzen, Metadatensuche mit Annis. Linguistischer Methodenworkshop 2016, Institut für deutsche Sprache und Linguistik. Humboldt-Universität zu Berlin, 23.02.2016.

 

Lehre

WiSe 17/18

Seminar Kiezdeutsch und Lernerdeutsch
B.A. Germanistische Linguistik/Deutsch Kernfach

Seminar Modelle grammatischer Beschreibung
Modul für Programmstudierende

Übung Methoden der Linguistik
Modul für Programmstudierende

SoSe 17

Übung Deutsche Grammatik
B.A. Germanistische Linguistik/Historische Linguistik/Deutsch

SoSe 16

Einführung in die maschinelle Sprachverarbeitung mit Python

B.A. Deutsch/Germanistische Linguistik/Historische Linguistik

M.A. Linguistik

WiSe 15/16

Grundkurs Linguistik

B.A. Germanistische Linguistik/Historische Linguistik/Deutsch

WiSe 14/15

Grammatische und textbezogene Regularitäten der Internetsprache

B.A. Germanistische Linguistik/Deutsch

SoSe 14

Übung Deutsche Grammatik
B.A. Germanistische Linguistik/Historische Linguistik/Deutsch

WiSe 13/14

Übung Deutsche Grammatik
B.A. Germanistische Linguistik/Historische Linguistik/Deutsch