2008
A Lexicographer-Friendly Association Score
RYCHLÝ, PavelZákladní údaje
Originální název
A Lexicographer-Friendly Association Score
Autoři
Vydání
2. vyd. Brno, RASLAN 2008. Brno, RASLAN 2008, od s. 6-9, 4 s. 2008
Nakladatel
Masarykova Univerzita
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
60200 6.2 Languages and Literature
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Odkazy
Označené pro přenos do RIV
Ano
Kód RIV
RIV/00216224:14330/08:00049430
Organizační jednotka
Fakulta informatiky
ISBN
978-80-210-4741-9
UT WoS
Klíčová slova anglicky
corpus linguistics tools; grammatical relations in the Sketch Engine; the logDice score
Změněno: 7. 6. 2021 17:24, doc. Mgr. Pavel Rychlý, Ph.D.
Anotace
V originále
Finding collocation candidates is one of the most important and widely used feature of corpus linguistics tools. There are many statistical association measures used to identify good collocations. Most of these measures define a formula of a association score which indicates amount of statistical association between two words. The score is computed for all possible word pairs and the word pairs with the highest score are presented as collocation candidates. The same scores are used in many other algorithms in corpus linguistics. The score values are usually meaningless and corpus specific, they cannot be used to compare words (or word pairs) of different corpora. But endusers want an interpretation of such scores and want a score’s stability. This paper present a modification of a well known association score which has a reasonable interpretation and other good features.
Návaznosti
| LC536, projekt VaV |
| ||
| 1ET100300419, projekt VaV |
| ||
| 1ET200610406, projekt VaV |
| ||
| 2C06009, projekt VaV |
|