D 2019

Syntactic Patterns of Czech Multiword Expressions

NEVĚŘILOVÁ, Zuzana

Základní údaje

Originální název

Syntactic Patterns of Czech Multiword Expressions

Vydání

Brno, Slavonic Natural Language Processing in the 21st Century, od s. 174-184, 11 s. 2019

Nakladatel

Tribun EU

Další údaje

Typ výsledku

Stať ve sborníku

Utajení

není předmětem státního či obchodního tajemství

ISBN

978-80-263-1545-2
Změněno: 24. 5. 2020 16:55, RNDr. Zuzana Nevěřilová, Ph.D.

Anotace

V originále

We focus on a MWE collection that we created in past works. We analyze the collection using K-means clustering of the MWE tags as they occur in a web corpus. Afterwards, we compare the collection with another Czech MWE collection, the SemLex. The comparison shows how different the data are. Our collection created from web corpus contains less formal language and exemplifies the use of noun phrases with noun modifiers, mainly in English borrowings. On the other hand, the SemLex collection is extracted from dataset containing mostly formal Czech and noun phrase with adjective modifier is the prevalent syntactic pattern.