C 2017

Lexicography and Natural Language Processing

HORÁK, Aleš a Adam RAMBOUSEK

Základní údaje

Originální název

Lexicography and Natural Language Processing

Název česky

Lexikografie a zpracování přirozeného jazyka

Autoři

HORÁK, Aleš (203 Česká republika, domácí) a Adam RAMBOUSEK (203 Česká republika, domácí)

Vydání

New York, The Routledge Handbook of Lexicography, od s. 179-196, 18 s. Routledge Handbooks in Linguistics, 2017

Nakladatel

Routledge

Další údaje

Jazyk

angličtina

Typ výsledku

Kapitola resp. kapitoly v odborné knize

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Spojené státy

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/17:00097986

Organizační jednotka

Fakulta informatiky

ISBN

978-1-138-94160-1

UT WoS

000486503600013

Klíčová slova česky

zpracování přirozeného jazyka;lexikografie;rozpoznání významu;korpus;slovník;

Klíčová slova anglicky

natural language processing; lexicography; sense disambiguation; similarity metrics; dictionaries; corpora

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 13. 5. 2020 19:38, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

The chapter introduces links between lexicography and natural language processing in both directions - first, how the lexicographic work benefits from techniques of natural language processing such as word sense disambiguation, semantic similarity measures, named entity recognition, relation extraction, or corpora good example search, and second, intensive exploitation of lexicographic data in language engineering technologies, in the form of general dictionaries or encyclopaedias as well as specialized lexicons, ontologies, or lexicographic databases.

Česky

Kapitola představuje návaznosti mezi lexikografií a zpracováním přirozeného jazyka v obou směrech. V první části popisuje, jak lexikografická práce využívá techniky NLP, např. desambiguace významu, sémantické podobnostní metriky, rozpoznání jmenných entit, extrakce relací nebo hledání příkladů v korpusu. V druhé části intenzivní využívání lexikografických dat v technologiích jazykového inženýrství, v podobě obecných slovníků nebo encyklopedií a také specializovaných lexikonů, ontologií a lexikografických databází.

Návaznosti

LM2015071, projekt VaV
Název: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
MUNI/A/0897/2016, interní kód MU
Název: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VI.
Investor: Masarykova univerzita, Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VI., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty