RYCHLÝ, Pavel. A Lexicographer-Friendly Association Score. In RASLAN 2008. 2. vyd. Brno, RASLAN 2008. Brno: Masarykova Univerzita. s. 6-9. ISBN 978-80-210-4741-9. 2008.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název A Lexicographer-Friendly Association Score
Autoři RYCHLÝ, Pavel (203 Česká republika, garant, domácí).
Vydání 2. vyd. Brno, RASLAN 2008. Brno, RASLAN 2008, od s. 6-9, 4 s. 2008.
Nakladatel Masarykova Univerzita
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 60200 6.2 Languages and Literature
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL
Kód RIV RIV/00216224:14330/08:00049430
Organizační jednotka Fakulta informatiky
ISBN 978-80-210-4741-9
UT WoS 000302212600003
Klíčová slova anglicky corpus linguistics tools; grammatical relations in the Sketch Engine; the logDice score
Změnil Změnil: doc. Mgr. Pavel Rychlý, Ph.D., učo 3692. Změněno: 7. 6. 2021 17:24.
Anotace
Finding collocation candidates is one of the most important and widely used feature of corpus linguistics tools. There are many statistical association measures used to identify good collocations. Most of these measures define a formula of a association score which indicates amount of statistical association between two words. The score is computed for all possible word pairs and the word pairs with the highest score are presented as collocation candidates. The same scores are used in many other algorithms in corpus linguistics. The score values are usually meaningless and corpus specific, they cannot be used to compare words (or word pairs) of different corpora. But endusers want an interpretation of such scores and want a score’s stability. This paper present a modification of a well known association score which has a reasonable interpretation and other good features.
Návaznosti
LC536, projekt VaVNázev: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET100300419, projekt VaVNázev: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
1ET200610406, projekt VaVNázev: Jazyková poradna na internetu
Investor: Akademie věd ČR, Jazyková poradna na internetu
2C06009, projekt VaVNázev: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce
VytisknoutZobrazeno: 28. 3. 2024 19:12