2008
Computing Idioms Frequency in Text Corpora
BUŠTA, JanZákladní údaje
Originální název
Computing Idioms Frequency in Text Corpora
Název česky
Výpočet četnosti idiomů v korpusu
Autoři
Vydání
Brno, Proceedings of Recent Advances in Slavonic Natural Language Processing 2008, od s. 0-0, 4 s. 2008
Nakladatel
Masaryk University
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
60200 6.2 Languages and Literature
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Odkazy
Označené pro přenos do RIV
Ano
Kód RIV
RIV/00216224:14330/08:00034421
Organizační jednotka
Fakulta informatiky
ISBN
978-80-210-4741-9
UT WoS
Klíčová slova anglicky
frequency of idioms; headwords; text corpora; czech language
Změněno: 1. 6. 2021 07:47, Mgr. Jan Bušta
V originále
The idioms are phrases which meaning is not composed from the meanings of each word in the phrase. This is one of the natural examples of violating the principle of compositionality that means that idioms are in area of natural language processing problem of meaning mining. To count the frequency of phrases such idioms in corpora has one big aim: To get to know which phrases we use often and which less. We do it to be able to start with getting the meaning of the whole phrases not just each word. This improves the understanding natural language. The idioms are phrases which meaning is not composed from the meanings of each word in the phrase. This is one of the natural examples of violating the principle of compositionality that means that idioms are in area of natural language processing problem of meaning mining. To count the frequency of phrases such idioms in corpora has one big aim: To get to know which phrases we use often and which less. We do it to be able to start with getting the meaning of the whole phrases not just each word. This improves the understanding natural language.
Česky
Idiomy jsou slovní spojení, jejichž význam se neskládá z významů jednotlivých slov. Idiomy jsou příkladem porušování principu kompozicionality a tím jsou problémem při strojovém zpracování jazyka. Výpočet četnosti idiomů v korpusu přinese informaci, které idiomy se používají častěji, které méně často. Seřazení idiomů dle jejich četnosti ukáže, na které idiomy je třeba se soustředit více, a tak lépe porozumět přirozenému jazyku.
Návaznosti
| LC536, projekt VaV |
| ||
| 2C06009, projekt VaV |
|