Faculty of Language, Literature and Humanities - Corpus Linguistics and Morphology

Frequencies

BeMaTaC – A deeply annotated multimodal map-task corpus of spoken learner and native German

L1 subcorpus


dipl count %
download complete CSV file
du 345 3.74
ja 324 3.51
dann 233 2.52
nach 219 2.37
und 206 2.23
der 180 1.95
äh 175 1.90
so 165 1.79
also 143 1.55
links 139 1.51
norm count %
download complete CSV file
du 410 4.61
ja 344 3.87
und 261 2.93
dann 245 2.75
nach 219 2.46
so 208 2.34
der 185 2.08
also 165 1.85
gehst 146 1.64
jetzt 142 1.60
lemma count %
download complete CSV file
die 659 7.46
du 444 5.03
ja 344 3.89
und 261 2.95
dann 245 2.77
sein 236 2.67
eine 232 2.63
nach 219 2.48
so 208 2.35
gehen 186 2.11

L2 subcorpus


dipl count %
download complete CSV file
ja 640 3.36
du 639 3.36
okay 484 2.54
und 459 2.41
so 410 2.15
dann 394 2.07
nach 358 1.88
ähm 357 1.87
ich 348 1.83
äh 329 1.73
norm count %
download complete CSV file
ja 721 3.98
du 711 3.92
und 573 3.16
okay 518 2.86
so 469 2.59
dann 406 2.24
ich 366 2.02
nach 358 1.98
also 334 1.84
der 333 1.84
lemma count %
download complete CSV file
die 1328 7.43
du 755 4.22
ja 699 3.91
sein 573 3.20
und 567 3.17
eine 476 2.66
so 468 2.62
Okay 440 2.46
dann 406 2.27
ich 386 2.16

Last update: 21 March 2014