D 2008

A Lexicographer-Friendly Association Score

RYCHLÝ, Pavel

Základní údaje

Originální název

A Lexicographer-Friendly Association Score

Autoři

Vydání

2. vyd. Brno, RASLAN 2008. Brno, RASLAN 2008, od s. 6-9, 4 s. 2008

Nakladatel

Masarykova Univerzita

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

60200 6.2 Languages and Literature

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/08:00049430

Organizační jednotka

Fakulta informatiky

ISBN

978-80-210-4741-9

Klíčová slova anglicky

corpus linguistics tools; grammatical relations in the Sketch Engine; the logDice score
Změněno: 7. 6. 2021 17:24, doc. Mgr. Pavel Rychlý, Ph.D.

Anotace

V originále

Finding collocation candidates is one of the most important and widely used feature of corpus linguistics tools. There are many statistical association measures used to identify good collocations. Most of these measures define a formula of a association score which indicates amount of statistical association between two words. The score is computed for all possible word pairs and the word pairs with the highest score are presented as collocation candidates. The same scores are used in many other algorithms in corpus linguistics. The score values are usually meaningless and corpus specific, they cannot be used to compare words (or word pairs) of different corpora. But endusers want an interpretation of such scores and want a score’s stability. This paper present a modification of a well known association score which has a reasonable interpretation and other good features.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
1ET200610406, projekt VaV
Název: Jazyková poradna na internetu
Investor: Akademie věd ČR, Jazyková poradna na internetu
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce