NEVĚŘILOVÁ, Zuzana. Syntactic Patterns of Czech Multiword Expressions. In Aleš Horák, Klára Osolsobě, Adam Rambousek, Pavel Rychlý. Slavonic Natural Language Processing in the 21st Century. Brno: Tribun EU, 2019, s. 174-184. ISBN 978-80-263-1545-2.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Syntactic Patterns of Czech Multiword Expressions
Autoři NEVĚŘILOVÁ, Zuzana.
Vydání Brno, Slavonic Natural Language Processing in the 21st Century, od s. 174-184, 11 s. 2019.
Nakladatel Tribun EU
Další údaje
Typ výsledku Stať ve sborníku
Utajení není předmětem státního či obchodního tajemství
ISBN 978-80-263-1545-2
Změnil Změnila: RNDr. Zuzana Nevěřilová, Ph.D., učo 3839. Změněno: 24. 5. 2020 16:55.
Anotace
We focus on a MWE collection that we created in past works. We analyze the collection using K-means clustering of the MWE tags as they occur in a web corpus. Afterwards, we compare the collection with another Czech MWE collection, the SemLex. The comparison shows how different the data are. Our collection created from web corpus contains less formal language and exemplifies the use of noun phrases with noun modifiers, mainly in English borrowings. On the other hand, the SemLex collection is extracted from dataset containing mostly formal Czech and noun phrase with adjective modifier is the prevalent syntactic pattern.
VytisknoutZobrazeno: 24. 8. 2024 10:35