2019
Syntactic Patterns of Czech Multiword Expressions
NEVĚŘILOVÁ, ZuzanaZákladní údaje
Originální název
Syntactic Patterns of Czech Multiword Expressions
Autoři
Vydání
Brno, Slavonic Natural Language Processing in the 21st Century, od s. 174-184, 11 s. 2019
Nakladatel
Tribun EU
Další údaje
Typ výsledku
Stať ve sborníku
Utajení
není předmětem státního či obchodního tajemství
ISBN
978-80-263-1545-2
Změněno: 24. 5. 2020 16:55, RNDr. Zuzana Nevěřilová, Ph.D.
Anotace
V originále
We focus on a MWE collection that we created in past works. We analyze the collection using K-means clustering of the MWE tags as they occur in a web corpus. Afterwards, we compare the collection with another Czech MWE collection, the SemLex. The comparison shows how different the data are. Our collection created from web corpus contains less formal language and exemplifies the use of noun phrases with noun modifiers, mainly in English borrowings. On the other hand, the SemLex collection is extracted from dataset containing mostly formal Czech and noun phrase with adjective modifier is the prevalent syntactic pattern.