Sprach- und literaturwissenschaftliche Fakultät - Korpuslinguistik und Morphologie

Dr. Shujun Wan 万姝君

Wissenschaftliche Mitarbeiterin

WechatIMG24.jpeg

Kontakt

                           

Sitz: Dorotheenstraße 24, Raum 3.408, 10117 Berlin

Tel: +49 (0)30 2093 9618

Email: shujun.wan(at)hu-berlin.de

Sprechzeiten: nach Vereinbarung

Postadresse:
Institut für deutsche Sprache und Linguistik
Sprach- und literaturwissenschaftliche Fakultät
Humboldt-Universität zu Berlin
Unter den Linden 6
10099 Berlin

Forschungsinteresse

Lernerkorpus, Diskursanalyse, Natural Language Processing, Spracherwerb, Transfer, Kontrastive Rhetorik, Stance Markers, Interkulturelle Kommunikation. 

 

Akademische Tätigkeiten

Seit 06.2023 Research assistant: Deutsches Forschungszentrum für Künstliche Intelligenz  (DFKI)
Seit 06.2020

Research Fellow: SFB 1412 (C04) Register knowledge in advanced learner language

Seit 12.2020

Assoziierte Mitarbeiterin: Projekt Aufbau eines chinesischen Deutschlernerkorpus und Erforschung der Schriftkompetenzentwicklung der Lernenden. Gefördert durch die Chinese National Social Science Foundation.

Seit 05.2020

Mitglied: DFG-SFB1412-MGK (Integrated Graduate School)

10.2017 - 07.2018

Lehraufträge: Modelle grammatischer Beschreibung und Methode in der Linguistik

 

Laufende Projekte

OpenGPT-X
  • OpenGPT-X builds and trains large-scale AI language models to drive innovative language application services for the European economy. Through the open Gaia-X infrastructure, businesses will be able to use and share data and services free of charge, in multiple languages and according to the highest European data protection standards to develop products and processes with a wide variety of language features (e.g. chatbots, digital assistants and personalised media reports).
  • My work in this project as a visiting scholar at DFKI (German Research Center for Artificial Intelligence) is to investigate the differences in rhetorical constructions between automatically generated texts by OpenGPT-X and human-authored texts. This is a joint work with Julián Moreno Schneider.

 

SFB1412 C04: Register knowledge in advanced learner language
  • Das Projekt untersucht den Erwerb von Registerkompetenz in einer Fremdsprache anhand von verschiedenen gesprochenen und geschriebenen Lernerkorpora. Wenn Registerwissen hauptsächlich (implizit) aus sprachlicher Erfahrung erworben wird, kann man davon ausgehen, dass selbst fortgeschrittene Lernerinnen einer Fremdsprache weniger Registerwissen haben können. Daraus leitet sich ab, dass sie in bestimmten Registern andere Alternativen wählen als Muttersprachlerinnen und dass sie insgesamt weniger Unterschiede machen können (das Spektrum der Alternativen also kleiner ist). C04 untersucht dies am Phänomen Modifikation.
  • Mehr Info: SFB 1412
 
RST-Tace
  • RST-Tace is a tool for automatic comparison and evaluation of RST trees. It can be used regardless of the language or the size of the rhetorical trees. This tool aims to measure the agreement between two annotators. The result is reflected by F-measure and inter-annotator agreement.
  • Currently, RST-Tace can be used via a command-line interface. For up-to-date information and complete documentation, please refer to the GitHub repository.

 

Connective-Lex.info for Chinese
  • Connective-Lex.info is a web-based multilingual lexical resource for connectives. Users can work with it to search for connectives and the discourse relations they may signal. So far, a number of languages (such as English, German, French, etc.) have been included.
  • The task of our project is to expand Connective-Lex.info with Chinese connectives. This ongoing project is conducted jointly with Peter Bourgonje, Manfred Stede, Clara Wan Ching Ho, and Hongling Xiao.

 

Doktorarbeit

- Meine Dissertation ist eine korpusbasierte kontrastive rhetorische Studie und beschäftigt sich hauptsächlich mit Argumentationsstrategien chinesischer Deutschlerner:innen und deutscher Muttersprachler:innen. Argumentationsstrategien beziehen sich hier nicht nur auf die sprachliche Formulierungsebene, sondern auch auf die Diskursebene. Dazu wird das Korpus RST German learner treebank aufgebaut und angewendet.

- Die Promotion wird von Prof. Dr. Anke Lüdeling und Prof. Dr. Manfred Stede betreut.

- Die Promotion ist gefördert durch Chinese Scholarship Council und die Deutsche Forschungsgemeinschaft (DFG) – SFB 1412, 416591334.

 

Veröffentlichungen

  • Wan, Shujun (2023): Argumentationsstrategien chinesischer Deutschlerner/-innen. Berlin, J.B. Metzler. 
  • Wan, Shujun; Bourgonje, Peter; Xiao, Hongling; Wan Ching Ho, Clara; Stede, Manfred (2023): Chinese-DiMLex - A Lexicon of Chinese Discourse Connectives. Poster presented at the 4th Workshop on Computational Approaches to Discourse, held in conjunction with ACL2023. July 9th-14th, Toronto, Canada. LINK
  • Hirschmann, Hagen; Lüdeling, Anke; Shadrova, Anna; Bobeck, Dominique; Klotz, Martin; Akbari, Roodabeh; Schneider, Sarah; Wan, Shujun (2022): FALKO. Eine Familie vielseitig annotierter Lernerkorpora des Deutschen als Fremdsprache. In: KorDaF (Korpora Deutsch als Fremdsprache) 2(2), 139–148. LINK
  • Wan, Shujun (2022): Zur Positionierung der eigenen Meinung und der Verwendung von Appellen in argumentativen Texten: Chinesische DaF-Lerner/-innen, L1-Sprecher/-innen des Deutschen und chinesische EFL-Lerner/-innen im Vergleich. In: Deutsch als Fremdsprache. 165-177.  LINK
  • Wan, Shujun (2021): Kobalt_RST: Die Annotation von rhetorischen Strukturen im Kobalt-DaF-Korpus. Zenodo. LINK
  • Lüdeling, Anke; Hirschmann, Hagen; Shadrova, Anna & Wan, Shujun (2021): Tiefe Analyse von Lernerkorpora. In: Deutsch in Europa. De Gruyter, 235-284. LINK
  • Wan, Shujun; Kutschbach, Tino;  Lüdeling, Anke & Stede, Manfred (2019): RST-Tace a tool for automatic comparison and evaluation. In Proceedings of Discourse Relation Treebanking and Parsing (DISRPT 2019), Minneapolis, MN. LINK
  • Wan, Shujun & Lüdeling, Anke (2019): Discourse structure in German argumentative essays: A comparison of L1 German and Chinese learner German. In: Proceedings of the 5th Learner Corpus Research Conference (LCR 2019), Warschau. 
  • Wan, Shujun (2016): Überlegungen zur Förderung der interkulturellen Kompetenz im chinesischen DaF-Unterricht – Das Modell der global orientierten Persönlichkeitsentwicklung und Handlungskompetenz.(Masterarbeit)
  • Wan, Shujun; Li, Yuan (2014): Das Leben in fremder Kultur – Eine empirische Untersuchung zur Lebenssituation der chinesischen Migranten in Deutschland. Im Sammelband: Theorie und Praxis der Sprachkommunikation. Materialien zur VI. Internationalen wissenschaftliche-didaktischen Konferenz 25-26.Juni 2014. S. 345 –S. 352.
  • Wan, Shujun (2013): Lebenssituation der chinesischen Migranten in Deutschland – Eine empirische Untersuchung in Berlin. (Bachlorarbeit) Preis für beste Bachlorarbeit an der Zhejiang Universität gewonnen.

 

Vorträge

  • ACL2023 and the 4th workshop on computational approaches to discourse. Postervortrag: Chinese-DimLex: A Lexicon of Chinese Discourse Connectives. 10-14. Juli 2023, Toronto, Canada.
  • Gastvortrag an der Zhejiang Universität. Vortrag: Einleitung, Hauptteil und Schluss: wie werden sie in L1- und L2-Texten rhetorisch aufgebaut? - Eine korpusbasierte kontrastive Studie. 05.Jan.2023, Hangzhou China.
  • KO Korpuslinguistik und Phonetik. Vortrag: Schreibstrategien in argumentativen Texten chinesischer Deutschlerner:innen. 14.Dez.2022, HU Berlin.
  • Workshop Word formation and discourse structure. Vortrag: Complex nouns as markers of academic register in L1-and L2-authored essays (zusammen mit Julia Lukassek, Anke Lüdeling, Anna Shadrova). 5-6. Mai 2022, Leipzig.

  • Gastvortrag an der Uni-Potsdam. Vortrag: Kontrastive Rhetorik: Merkmale deutscher und chinesischer argumentativen Texte "Erörterung" und "Yilunwen" im Vergleich. 15.Sep.2021. Potsdam.

  • 16. Dokorandin Tag 2019. Poster: Discourse structure in German argumentative essays. 08.Okt. 2019, HU Berlin. (Best Poster Award).
  • LCR Conference. Poster: Discourse structure in German argumentative essays: a comparison of L1 German and Chinese learners of German. 12-14. Sep. 2019. Warschau, Polen. 
  • NAACL 2019 and the workshop on Discourse Relation Parsing and Treebanking. 03-07. Jun. 2019, Minneapolis, USA. 
  • KO Korpuslinguistik und Phonetik. Vortrag: Eine statistische Methode zur Evaluation der Annotation und dem Vergleich der rhetorischen Strukturen. 07.Dez.2018, HU Berlin.
  • International summer school "Learner Corpus Research: Theory and Applications". Vortrag: Discourse structure in German argumentative essays: a comparison of L1 German and Chinese learner German- Description and evaluation of the annotation process. 27th-31th August 2018, Bremen, Deutschland. 

  • MISC Workshop: Vortrag: Annotation der Diskursrelationen - Herausforderungen. 18.Mai.2018, HU Berlin.  
  • Textlink Final Action Conference. 21th-23th März 2018, Toulouse, Frankreich. 
  • Fifth GF Summer School. Vortrag: Using GF to translate weather reports among English, German, and Chinese. 14th-25th August 2017, Riga, Latvia. (Grammatical Framework (GF) is a grammar formalism and a programming language for multilingual computational grammars. Mehr Info: https://www.grammaticalframework.org/)
  • Internationales Symposium zur Übersetzung, Rezeption und Erforschung der Schweizer Gegenwartsliteratur. Vortrag: Rezeptionsästhetik in der Übersetzungspraxis am Beispiel von „Die melodielosen Jahre“. Mai 2016, Hangzhou, VR China.
  • Der Nationale Forschungswettbewerb für Bachelorstudenten Chinas 2012: Projektleiterin, "Lebenssituationen der chinesischen Migranten und der türkischen Migranten in Deutschland – eine Vergleichforschung". (Preis für ausgezeichnetes Projekt gewonnen)

 

Ausbildung

10.2016 - 03.2023*

Promotion

Korpuslinguistik Humboldt-Universität zu Berlin
10.2014 - 09.2015

Doppelmaster

Deutsch als Fremd- und Fachsprache Technische Universität Berlin
09.2013 - 06.2016

Master

German Studies Zhejiang Universität 
07.2013 - 08.2013

Austausch

Deutsche Sprache und Kultur Christian-Albrechts-Universität zu Kiel
10.2011 - 09.2012

Auslandsemester

Germanistische Linguistik Humboldt-Universität zu Berlin
09.2009 - 06.2013

Bachlor

Germanistische Linguistik und Literatur Zhejiang Universität

* 07.2020 bis 03.2022: Teilzeitstudium aufgrund der Elternzeit.

* Die Disputation fand am 04.12.2023 statt.

 

Lehre

Sommersemester 2018

- SE Modelle grammatischer Beschreibung 

  Do. 12 - 14 Uhr. Sophienstr. 22-22a, Institutsgebäude, R. 0.01

- UE Methode in der Linguistik 

  Do. 14 - 16 Uhr. Sophienstr. 22-22a, Institutsgebäude, R. 0.01

Wintersemester 2017/2018

- SE Modelle grammatischer Beschreibung 

  Mi. 08 - 10 Uhr. Dorotheenstr. 24. Raum: 1, 401

- UE Methode in der Linguistik

  Mi. 12 - 14 Uhr. Dorotheenstr. 24. Raum: 1, 401