Sprach- und literaturwissenschaftliche Fakultät - Korpuslinguistik und Morphologie

Dr. phil. Anna Shadrova

Wiss. Mitarbeiterin Forschungsgruppe RUEG, PI (Korpuslinguistik, quantitative Methodologie und Analyse kleiner bis mittelgroßer Korpora, graphbasierte Modellierung linguistischer Daten, linguistische Pfadabhängigkeit, gebrauchsbasierte Betrachtung des Lexikons in multilingualen und registerdiversen Settings, intra- und interindividuelle Variabilität, Struktur des mentalen Lexikons, Text als Prozess, L2-Erwerb, Multilingualismus, Herkunftssprachen, Lexikosyntax, Variation)

Forschungsinteressen

Gemeinsam mit anderen Mitarbeiter:innen unserer korpuslinguistischen Gruppe arbeite ich an einer Reihe Projekte, die mit einer gebrauchsbasierten Perspektive auf das Lexikon in aufgabenbasierten, tief annotierten und kleinen bis mittelgroßen Korpora zu tun haben.

Wir sind im Besonderen an Schnittstellenphänomenen interessiert: Produktivität der Wortbildung, Lexikalisierung und komplexe Verben und Nomen des Deutschen im Bereich der Morphologie, Koselektionsbeschränkungen im Bereich der Lexikosyntax, und Diskursstruktur und lexikalische Semantik im Kontext von Multilingualismus (L1, L2, Herkunftssprachen) und Aufgaben- und Registerdiversität.

Das Lexikon im Gebrauch lässt sich nur schwer nachvollziehen, da es von einer starken inter- und intra-individuellen Variation und von einer extremen Kombinatorik geprägt ist. Wir erarbeiten darum Ansätze, die sowohl eine Quantifizierung erlauben, als auch die gesamte linguistische Tiefe der Daten erhalten, z.B. die graphbasierte Modellierung oder eine Zeitreihenmodellierung für eine Betrachtung von Text als Prozess. Zwei zentrale und bislang wenig beforschte Konzepte sind dabei die Pfadabhängigkeit innerhalb linguistischer Daten (wie wird die Sprachproduktion durch das vorher Gesagte beeinflusst) und die Struktur des mentalen Lexikons in L1 und L2 (was kann der Pfad über das System verraten, durch das er führt).

Unser Ziel ist, Sprachdaten aus linguistischer Perspektive so realistisch wie möglich zu modellieren, bevor wir zur Quantifizierung und zum Vergleich übergehen. Damit erkennen wir an, dass linguistische Konzepte häufig unscharfe und überlappende Kategorien bilden sowie starke innere Abhängigkeiten und Verflechtungen aufweisen. Darüber hinaus sind Sprachdaten regelmäßig hochambig und stehen niemals unabhängig von Aufgabe oder kommunikativer Situation. Wir legen darum großen Wert auf epistemologische Einbettung und Samplingmethoden zur internen Validierung unserer Ergebnisse, und außerdem auf Best Practices im Bereich Open Data/Open Science, Reproduzierbarkeit und Replizierbarkeit.


Neuigkeiten

Ich freue mich sehr, als Empfängerin des Promotionspreises der Gesellschaft für Sprachtechnologie und Computerlinguistik ausgewählt worden zu sein. Der Preis wird verliehen für Dissertationen, die das Fach signifikant voranbringen und gilt meiner Arbeit Measuring coselectional constraint in learner corpora: A graph-based approach. Ich danke dem wissenschaftlichen Beirat und Auswahlkomitee der GSCL für die Auswahl meiner Arbeit und für die Ehre, sie bei der KONVENS 2022 in Potsdam vorstellen zu dürfen.

Aktuelle Projekte

RUEG - Research Unit Emerging Grammars: Project Corpus-linguistic methods (DFG 313607803)

In der DFG-geförderten Forscher:innengruppe RUEG - Research Unit Emerging Grammars in Language Contact Situations: A Comparative Approach interessieren wir uns für emergente Muster und Variation in der multilingualen Situation von Herkunftssprecher:innen des Türkischen, Russischen und Griechischen in Deutschland und des Deutschen in den USA, sowie der monolingualen Sprecher:innen derselben Sprachen in Russland, Griechenland, der Türke und den USA. RUEG betrachtet dabei diverse grammatische und lexikalische Aspekte.

Unsere Forschungsgrundlage bieten vielschichtige Korpusdaten, die Daten aus kontrollierten formellen und informellen Settings in geschriebener und gesprochener Modalität enthalten. Diese Daten sind von beiden Sprecher:innengruppen in der Majoritätssprache (z.B. Deutsch in Deutschland) und bei den Herkunftssprecher:innen zusätzlich in ihrer Herkunftssprache erhoben. Zusätzlich können Variablen wie Alter, Geschlecht und Vitalität der Herkunftssprache innerhalb der Mehrheitsgesellschaft der jeweiligen Sprecher:innengruppe zur Analyse herangezogen werden.

Diese Komplexität erfordert eine adäquate technische Repräsentation sowie Methodenforschung und methodologische Einbettung und Unterstützung. Diese Arbeit leisten wir in Pc. Unser Fokus liegt auf der Entwicklung von quantativen Methoden für kleine bis mittelgroße Korpora, wie beispielsweise die Anwendung von Graphmetriken und netwerkanalytischen Methoden für kernlinguistische Fragestellungen, dem Vergleich Bayes'scher Statistik mit komplexen Modellen der frequentistischen Statistik (beispielsweise gemischten Modellen), der Einsatz maschineller Lernmethoden zum Erkenntnisgewinn oder Inforamtionsexktraktion durch Introspekton maschinell gelernter Modelle; und ihrer Optimierung für kleinere Daten.


SFB Register (assoziiert)

Der SFB Register: Sprachwissen über situational-funktionale Variation untersucht Aspekte von Registerwissen bei den Sprecher:innen einer Sprache. Kompetente Sprecher:innen sind in der Lage, ihr Sprachverhalten auf allen Ebenen situativ anzupassen: Sie wissen beisielsweise, dass das deutsche Wort sauer in anderen Situationen angemessen ist, als das Wort verärgert, dass man weniger komplexe Sätze verwendet, wenn man mit Kindern spricht, als in akademischen Funktionen, und dass es manchmal einen Unterschied macht, ob man ungefähr 8 sagt oder 7:49 Uhr, und manchmal nicht. Wir beschäftigen uns daher mit intra-individueller Variation.

C04 (mit dem ich zusammenarbeite) untersucht den Erwerb von Registerkompetenz in einer Fremdsprache anhand von verschiedenen gesprochenen und geschriebenen Lernerkorpora. Wenn Registerwissen hauptsächlich (implizit) aus sprachlicher Erfahrung erworben wird, kann man davon ausgehen, dass selbst fortgeschrittene Lerner*innen einer Fremdsprache weniger Registerwissen haben können. Daraus leitet sich ab, dass sie in bestimmten Registern andere Alternativen wählen als Muttersprachler*innen und dass sie insgesamt weniger Unterschiede machen können (das Spektrum der Alternativen also kleiner ist). C04 untersucht dies am Phänomen Modifikation.

Epistemologie und Forschungsparadigmen der Korpuslinguistik: Lese- und Diskussionskreis

Epistemologische betrachtet ist die Linguistik ein herausforderndes Feld. Sprache ist vielschichtig, stark variabel und kontextabhängig in Interaktion mit diversen Umgebungsvariablen und hochgradig ambig. Als Korpuslinguist:innen begegnet uns diese Vielschichtigkeit häufig durch die Notwendigkeit, jeden Einzelfall für die Annotation zu klassifizieren. Damit stoßen wir regelmäßig an die Grenzen aller Modelle, mit denen wir arbeiten. In unserem Lese- und Diskussionskreis wollen wir einige dieser Grenzen mit epistemologischen Debatten und Perspektiven verschiedener Forschungsparadigmen zusammenbringen. Wer über Termine informiert werden will, kann mich anschreiben um in den E-Mail-Verteiler aufgenommen zu werden. 


Kontakt



Dorotheenstraße 24
Raum 3.333
10117 Berlin - Mitte

anna [punkt] shadrova [ät] hu-berlin [punkt] de
Postanschrift:

c/o Institut für deutsche Sprache und Linguistik
Sprach- und Literaturwissenschaftliche Fakultät
Humboldt-Universität zu Berlin
Unter den Linden 6
D-10099 Berlin



Publikationen, Ressourcen und Vorträge

Lebenslauf runterladen

In Vorbereitung und Begutachtung:

Shadrova, A. (in Begutachtung): No three productions alike: Lexical variability, situated dynamics and lexical path dependence in task-based corpora.

Shadrova, A., A. Lüdeling, M. Klotz, T. Krause & R.G. Hartz (in Begutachtung): ``Step away from the computer!'': Über die linguistische Datenkategorisierung als Erkenntnisprozess und daraus folgende Herausforderungen bei der Nachnutzung von Annotationen und Annotationstools.

Shadrova, A., A. Lüdeling & R.G. Hartz (in Vorbereitung): Heritage language typology and bilingualism status modulate complex verb use in bilingual German L1 speakers.

Artikel in peer-reviewed Journals

Shadrova, A. (erscheint): Ein graphbasierter Ansatz zur Erforschung von usuellen Wortverbindungen in der L2 Deutsch. Zeitschrift Deutsch als Fremdsprache, 3/2024, 131-141.

 

Shadrova, A. (2021): Topic models do not model topics: epistemological remarks and steps towards best practices. Journal of Data Mining and Digital Humanities 2021, https://doi.org/10.46298/jdmdh.7595, Source : oai:HAL:hal-03261599v3

Ighreiz, A., C. Möllers, L. Rolfes, A. Shadrova & A. Tischbirek (2020): Karlsruher Kanones: Selbst- und Fremdkanonisierung der Rechtsprechung des Bundesverfassungsgerichts. Archiv des öffentlichen Rechts Jahrgang 145 (2020) / Heft 4, S. 537-613 (77), https://doi.org/10.1628/aoer-2020-0026

Lüdeling, A.; Hirschmann, H. & Shadrova, A. (2017): Linguistic Models, Acquisition Theories, and Learner Corpora: Morphological Productivity in SLA Research Exemplified by Complex Verbs in German. Language Learning Special Issue on Language learning research at the intersection of experimental, corpus-based and computational methods: Evidence and interpretation 67 (S1),  96-129.


Beiträge auf Einladung und peer-reviewed Proceedings

Shadrova, A. (2022): It may be in the structure, not the combinations: Graph metrics as an alternative to statistical measures in corpus-linguistic research. In: Tara Andrews, Franziska Diehr, Thomas Efer, Andreas Kuczera and Joris van Zundert (eds.): Graph Technologies in the Humanities - Proceedings 2020, published at http://ceur-ws.org/Vol-3110, p. 245-278.

Lüdeling, A., H. Hirschmann, A. Shadrova & S. Wan (2021): Tiefe Analyse von Lernerkorpora. In H. Lobin, A. Witt & A. Wöllstein (Ed.), Deutsch in Europa (pp. 235-284). Berlin, Boston: De Gruyter. https://doi.org/10.1515/9783110731514-013

Thomas, E. M., Cantone, K. F., Davies, S., & Shadrova, A. (2014). Cross-linguistic influence and patterns of acquisition: The emergence of gender and word order in German-Welsh bilinguals. In: E. M. Thomas and I. Mennen (Eds.): Advances in the Study of Bilingualism, p. 41-62. Clevedon: Multilingual Matters.
 

Abschlussarbeiten

Shadrova, A. (2020): Measuring coselectional constraint in learner corpora: A graph-based approach. Univ.-Dissertation: Humboldt-Universität zu Berlin, http://dx.doi.org/10.18452/21606.

Shadrova, A. (2013): Mehr Chunks! – Entwicklungsperspektiven für die Konstruktionsgrammatik unter Einbeziehung von Phraseologie, Psycholinguistik und L2-Erwerbsforschung. Masterarbeit, Humboldt-Universität zu Berlin, http://dx.doi.org/10.18452/14224.
 

Ressourcen

[Korpus und Annotationsrichtlinien] Shadrova, A.. (2021). Kobalt: Extension Corpus and Annotation Guidelines for Verb Classification and Dependency Adjustments (1.0) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.5730224

[Analysedaten] Shadrova, A., Linscheid, P., Lüdeling, A., Lukassek, J., & Schneider, S. (2021). Additional Data to "A Challenge for Contrastive L1/L2 Corpus Studies" [Data set]. Zenodo. https://doi.org/10.5281/zenodo.4752308

[Korpus, Skripte und Analysedaten] Shadrova, A. (2020): Extended Kobalt-DaF corpus, scripts for pre-processing and analysis, extracted lexicosyntactic graphs (JSON), and R-plots from PhD thesis and beyond: https://doi.org/10.5281/zenodo.3584091

[Korpus] Möllers, C., Shadrova A. & Wendel, L. (2021): BVerfGE-Korpus 1.0. Mit freundlicher Unterstützung des Mohr-Siebeck-Verlags. https://doi.org/10.5281/zenodo.4551408

[Analysedaten] Ighreiz, A., C. Möllers, L. Rolfes, A. Shadrova & A. Tischbirek (2021): Karlsruher Kanones? Netzwerke, Tabellen und Analyseplots. https://doi.org/10.5281/zenodo.4464810

Workshops

Klotz, M., A. Lüdeling & A. Shadrova (2021): Contrastive Corpus Methodology for Language Modeling and Analysis. DGfS-Kurz AG, 43. DGfS-Jahrestagung:
Modell und Evidenz / Model and Evidence, Universität Freiburg, 23.-26. Februar 2021

Krause, T. & A. Shadrova (2016) Korpus III: Einführung in die Annis-API mit Python. Linguistischer Methodenworkshop 2016, Institut für deutsche Sprache und Linguistik. Humboldt-Universität zu Berlin, 23.02.2016.

Shadrova, A. & T. Krause (2016) Korpus II: Frequenzanalyse, Dependenzen, Metadatensuche mit Annis. Linguistischer Methodenworkshop 2016, Institut für deutsche Sprache und Linguistik. Humboldt-Universität zu Berlin, 23.02.2016.

Vorträge

[Konferenztvortrag] A. Shadrova (2022): Lexical similarity in L1 and L2 German as evidence for the structure and
dynamics of the lexicon (work in progress). Learner Corpus Research, Padua. 24.09.2022.

[Preisträgervortrag] A. Shadrova (2022): Graph-based analysis of corpus data in lexical and lexicosyntactic research. KONVENS, Potsdam, 14.09.2022.

[Keynote] A. Lüdeling, J. Lukassek, A. Shadrova (2022): Variability in Grammatical Categories and Structures: The Case of Word Formation. Grammar and Corpora, Gent. 02.07.2022.

[Vortrag] Shadrova, A. (2022): Problemkind der Korpuslinguistik: Das Lexikon in Strukur, Gebrauch und Analyse. Korpuslinguistisches Kolloquium, HU Berlin, 25.05.2022. Folien.

[Konferenzvortrag] Julia Lukassek, Anke Lüdeling, Anna Shadrova, Shujun Wan (2022): Complex nouns as markers of academic register in L1-and L2-authored essays. Workshop "Word Formation and Discourse Structure", Leipzig, 06.05.2022.

[Konferenzvortrag] Lüdeling, A., Lukassek, J., & Shadrova, A. (2022): Variation and productivity in German L1 and L2 nominal word-formation. 44th Conference of the German Linguistic Society (DGFS; AG8), 25.02.2022. [online]

[Vortrag] Shadrova, A., M. Klotz & A. Lüdeling (2021): Linguistic Modeling and Analysis. Opening talk for DGfS Kurz-AG Contrastive Corpus Methodology for Language Modeling and Analysis.

[Öffentliche Verteidigung] Shadrova, A. (2020): Interlanguage-Effekte in L1 und L2: Eine graphbasierte lexikosyntaktische Betrachtung anhand geschriebener Korpusdaten aus Falko und RUEG, HU Berlin, 10.07.2020.

[Vortrag] Shadrova, A. (2020): No free lunch: Ob und wie Topic Modeling und andere probabilistische Informationsexktraktionsverfahren zum Erkenntnisgewinn genutzt werden können. Korpuslinguistisches Kolloquium, HU Berlin, 08.07.2020.

[Konferenzvortrag] Shadrova, A. (2020): Graph metrics as an alternative to statistical
measures in linguistic research. Graph Technologies in the Digital Humanities 2020, Wien, 21.02.2020.

[Vortrag] Shadrova, A. (2020): Korpuslinguistische Modellierung juristischer
Fragen in einem Korpus von BVerfG-Entscheidungen. Korpuslinguistisches Kolloquium, HU Berlin, 22.01.2020.

[Vortrag] Shadrova, A. (2019): Individuelle Varianz und Textlängeneffekte:
Wie geht Sampling in Lernerkorpora? Korpuslinguistisches Kolloquium, HU Berlin, 05.06.2019.

[Vortrag] Lüdeling, A. & A. Shadrova (2020): Forschungsfragen, Modelle, Auswertung. Möglichkeiten und Grenzen der korpusgestützten Textanalyse. Workshop "Methoden quantitativer Textanalyse", Berlin, 21.11.2019.

[Vortrag] Tischbirek, A. & A. Shadrova (2020): Karlsruher Kanones? Selbst- und Fremdkanonisierung der Rechtsprechung des BVerfG. Workshop "Methoden quantitativer Textanalyse", Berlin, 21.11.2019.

[Konferenzvortrag] Shadrova, A. (2019): U-shaped learning of verb argument
coselection in learners of German. Learner Corpus Research 2019, Warschau, 13.09.2019.

[Vortrag] Shadrova, A. (2018): Lernerkorpora: Mehrebenenannotation und Zielhypothesen als Such- und Analysewerkzeug. Workshop "Von Lernerdaten zu Lernerkorpora", Schloss Rauischholzhausen, 12.07.2018.

[Vortrag] Shadrova, A. (2017): Korpuslinguistische Kollokationsanalyse als Trendscout-Analyse zum Förderprogramm „Industrielle Gemeinschaftsforschung – IGF“. Vortrag beim IGF-Arbeitstreffen am BWMI, 04.10.17.

[Vortrag] Shadrova, A. (2017): Lexikalische Assoziatiosmaße und Idiomatizität: Eine Problemskizze anhand von Lernerdaten aus dem Kobalt-Korpus. Korpuslinguistisches Kolloquium, HU Berlin, 24.05.2017.

[Konferenzvortrag] Shadrova, A. (2015): Learners know their German: Statistical similarities of surface features in German L1 and L2 essays. International Symposium on Bilingualism 10, 24.05.2015.

[Vortrag] Shadrova, A. & A. Lüdeling (2015): Individuelle Differenzen in Lernerdaten. INDUS-Netzwerktreffen, Universität Duisburg-Essen.

[Vortrag] Shadrova, A. (2014): "Kobalt-E: Erste Ergebnisse". Netwerk Kobalt-DaF. Arbeitstreffen in Tübingen, 04.11.14. Folien


Lehre

Betreute Abschlussarbeiten

Sophie Reule: Lexical Bundles in den Entscheidungen des Bundesverfassungsgerichts (Zweitbetreuung Masterarbeit, mit Anke Lüdeling, 2021)

Thao Tran: Kollokationen in Liebesromanen des 19. Jahrhunderts: Eine graphbasierte Analyse (Zweitbetreuung Masterarbeit, mit Anke Lüdeling, ongoing)

WiSe 17/18

Seminar Kiezdeutsch und Lernerdeutsch
B.A. Germanistische Linguistik/Deutsch Kernfach

Seminar Modelle grammatischer Beschreibung
Modul für Programmstudierende

Übung Methoden der Linguistik
Modul für Programmstudierende

SoSe 17

Übung Deutsche Grammatik
B.A. Germanistische Linguistik/Historische Linguistik/Deutsch

SoSe 16

Einführung in die maschinelle Sprachverarbeitung mit Python

B.A. Deutsch/Germanistische Linguistik/Historische Linguistik

M.A. Linguistik

WiSe 15/16

Grundkurs Linguistik

B.A. Germanistische Linguistik/Historische Linguistik/Deutsch

WiSe 14/15

Grammatische und textbezogene Regularitäten der Internetsprache

B.A. Germanistische Linguistik/Deutsch

SoSe 14

Übung Deutsche Grammatik
B.A. Germanistische Linguistik/Historische Linguistik/Deutsch

WiSe 13/14

Übung Deutsche Grammatik
B.A. Germanistische Linguistik/Historische Linguistik/Deutsch
 

Ehemalige Projekte

Contrastive corpus methodology and language modeling and analysis

Kurz-AG bei der 43. DGfS-Jahrestagung in Freiburg, 24.-26. Februar 2021. Mit Martin Klotz und Anke Lüdeling. Information und Präsentationen: https://www.linguistik.hu-berlin.de/de/institut/professuren/korpuslinguistik/events/kurz-ag-msc

L.L.Con: Leibniz Linguistic Research into Constitutional Law

Von 2018 bis 2021 war ich Wissenschaftliche Mitarbeiterin an der Juristischen Fakultät am Lehrstuhl von Prof. Dr. Christoph Möllers im Leibniz-Projekt zu Eigenschaften und Entwicklungen der Sprache in Urteilen des Bundesverfassungsgerichts seit seinem Entstehen.

Die Arbeiten befassten sich mit dem epistemologisch navollziehbaren Einsatz von Topic Modeling in geistes- und sozialwissenschaftlichen Fragestellungen; der Kanonisierung der Rechtsprechung des Bundesverfassungsgerichts in einer Analyse von Zitatenetzwerken; sowie der Automatisierbarkeit der Extraktion von komplexen Textstrukturaspekten und der Erstellung des eigentlichen Korpus.

Themenauswahl: Datenmodellierung, quantitative Linguistik, Stilometrie, Netzwerkanalyse, Topic Modeling, Informationsextraktion in formalisierter Sprache, Formalisierung als Aspekt von Sprache, linguistische Modellierung komplexer Konzepte

Publikationen:

Wendel, L., A. Shadrova & A. Tischbirek (in press): From modeled topics to areas of law: A comparative analysis of types of proceedings in the German Federal Constitutional Court. German Law Journal.

Shadrova, A. (2021): Topic models do not model topics: epistemological remarks and steps towards best practices. Journal of Data Mining and Digital Humanities 2021, https://doi.org/10.46298/jdmdh.7595, Source : oai:HAL:hal-03261599v3

Ighreiz, A., C. Möllers, L. Rolfes, A. Shadrova & A. Tischbirek (2020): Karlsruher Kanones: Selbst- und Fremdkanonisierung der Rechtsprechung des Bundesverfassungsgerichts. Archiv des öffentlichen Rechts Jahrgang 145 (2020) / Heft 4, S. 537-613 (77), https://doi.org/10.1628/aoer-2020-0026

[Korpus] Möllers, Christoph, Anna Shadrova & Luisa Wendel (2021): BVerfGE-Korpus 1.0. Mit freundlicher Unterstützung des Mohr-Siebeck-Verlags. https://doi.org/10.5281/zenodo.4551408

Dissertation

Meine Dissertation "Measuring coselectional constraint in learner corpora: A graph-based approach" ist erschienen: http://edoc.hu-berlin.de/18452/22356

Darin habe ich die strukturelle Entwicklung von Koselektionsbeschränkungen (~ Kollokation, Idiomatizität, idiom principle) in  Verbargumentstrukturen bei DaF-LernerInnen in verschiedenen Erwerbsstadien untersucht. Grundlage dafür waren Essays chinesischer und belarusischer Deutschlerner*innen aus dem Netzwerk Kobalt-DaF. Es geht um die Frage, ob und wie sich L1-ähnliche Auswahl in Lernertexten auch in kleineren und mittelgroßen Korpora messen und bestimmen lässt und ob es eine strukturelle Entwicklung mit einer Zunahme von Beschränktheit mit zunehmendem Spracherwerb gibt, sowie einen Einbruch in der Beschränktheit auf mittleren Erwerbsstufen, sprich einen U-Kurven-förmigen Erwerbsverlauf. In einer graphbasierten Analyse auf Basis von Louvain-Modularität (Blondel et al. 2008) zeigt sich in der Tat eine Zunahme der Modularität bei beiden Lerner*innengruppen, ein U-Kurven-Verlauf ist allerdings nur bei den belarusischen Lerner*innen sichtbar. Das diskutiere ich aus typologischer, kultureller, und kognitiver Perspektive. Die Arbeit behandelt außerdem die bisher geringe theoretische Einbettung von Koselektion in die gebrauchsbasierte Theorie, stellt die geringe Erklärkraft des sogenannten "phraseologischen Kontinuums" fest, diskutiert die Unadäquatheit lexikalischer Assoziationsmaße für die Bewertung von Koselektionsbeschränkungen in Korpora, und macht Vorschläge für die Einbeziehung von graphbasierten Methoden in lexikalischen und lexikosyntaktischen Fragestellungen.

Betreut von Prof. Dr. Anke Lüdeling and Prof. Dr. Amir Zeldes (Georgetown University, Washington, D.C.). Prädikat summa cum laude. Teilweise finanziert durch ein Stipendium der Hans-Böckler-Stiftung (2014-2018) im Rahmen der Promotionsförderung des Bundesministeriums für Bildung und Forschung (BMBF) und ein Research Track-Stipendium der Humboldt Graduate School (2013).

Themen: Korpuslinguistik, Zweitspracherwerb, exakte Formalisierung gebrauchsbasierter Modelle, methodische Fragen der quantitativen Linguistik bei kleinen und mittelgroßen Korpora (SMISC), insb. graphbasierte Analysemethoden, Validierung

Referenz:
Blondel, Vincent D; Guillaume, Jean-Loup; Lambiotte, Renaud; Lefebvre, Etienne (9 October 2008). "Fast unfolding of communities in large networks". Journal of Statistical Mechanics: Theory and Experiment. 2008 (10): P10008. arXiv:0803.0476.

DALeKo - Dokumentation und Analyse von Lernersprache

Im Rahmen des Projektes Dokumentation und Analyse von Lernersprache, kurz DALeKo, an der Humboldt-Universität Berlin sammelt der Arbeitskreis Fremdsprachendidaktik (Anglistik, Romanistik, Slawistik) für die Erstellung einer Datenbank fremdsprachliche Lernertexte. Zunächst werden in den Kooperationsschulen erhobene Klausuren aus Abiturjahrgängen in den Sprachen Englisch, Französisch, Russisch und Spanisch in die im Aufbau befindliche Korpusdatenbank eingegeben. Russische Texte aus dem schulischen und universitären Kontext sind bereits über Annis³ durchsuchbar. Da die Daten strengen Datenschutzrichtlinien unterliegen, ist eine vorherige Registrierung bei Prof. Anka Bergmann notwendig.


INDUS-Netzwerk: Individualisiertes Sprachlernen: Sprachtechnologische Ansätze und ihre Schnittstellen (assoziiert)

Website hier.
Ausschnitt aus der Projektbeschreibung:

Individualisiertes Sprachenlernen (als Gegenstück zu standardisierten Massenkursen) ist durch neuste Entwicklungen der Sprachtechnologie in greifbare Nähe gerückt (...). Es zeigt sich jedoch, dass die Einbettung der Technologien in reale Lernsituationen viele neue Fragen aufwirft, die nur durch eine viele Disziplinen überspannende Forschungsanstrengung beantwortet werden können.

Das INDUS-Netzwerk bringt dazu Akteure aus den Disziplinen Sprachtechnologie, Linguistik, Bildungsforschung, Lernpsychologie, Pädagogische Psychologie, Spracherwerbsforschung und Didaktik des Sprachenlernens zusammen, die sich im Kontext ihrer spezifischen Expertise bereits mit dem Lernen von Sprachen auseinandergesetzt haben (...).