D 2013

Type-based Search of Idiomatic Expression

BUŠTA, Jan

Základní údaje

Originální název

Type-based Search of Idiomatic Expression

Autoři

BUŠTA, Jan (203 Česká republika, garant, domácí)

Vydání

Brno, Seventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2013, od s. 93-96, 4 s. 2013

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/13:00070342

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-0520-0

Klíčová slova anglicky

idioms; idiomatic candidates; syntactic fixedness; lexical fixedness; transitive verbs; thesaurus

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 1. 6. 2021 07:46, Mgr. Jan Bušta

Anotace

V originále

This paper presents evaluation of different approaches to extract verb-noun idiomatic expressions in Czech. These approaches are based on the structure of the idiom and its behavior in language. PMI and syntactic and lexical fixedness modified using VerbaLex and generated thesaurus provide useful tool for choosing best idiomatic candidates for manual annotation and evaluation. Moreover we focused on general adapting the algorithms for Czech.

Návaznosti

LM2010013, projekt VaV
Název: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum