C 2017

Lexicography and Natural Language Processing

HORÁK, Aleš and Adam RAMBOUSEK

Basic information

Original name

Lexicography and Natural Language Processing

Name in Czech

Lexikografie a zpracování přirozeného jazyka

Authors

HORÁK, Aleš (203 Czech Republic, belonging to the institution) and Adam RAMBOUSEK (203 Czech Republic, belonging to the institution)

Edition

New York, The Routledge Handbook of Lexicography, p. 179-196, 18 pp. Routledge Handbooks in Linguistics, 2017

Publisher

Routledge

Other information

Language

English

Type of outcome

Kapitola resp. kapitoly v odborné knize

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

United States of America

Confidentiality degree

není předmětem státního či obchodního tajemství

Publication form

printed version "print"

References:

RIV identification code

RIV/00216224:14330/17:00097986

Organization unit

Faculty of Informatics

ISBN

978-1-138-94160-1

UT WoS

000486503600013

Keywords (in Czech)

zpracování přirozeného jazyka;lexikografie;rozpoznání významu;korpus;slovník;

Keywords in English

natural language processing; lexicography; sense disambiguation; similarity metrics; dictionaries; corpora

Tags

International impact, Reviewed
Změněno: 13/5/2020 19:38, RNDr. Pavel Šmerk, Ph.D.

Abstract

V originále

The chapter introduces links between lexicography and natural language processing in both directions - first, how the lexicographic work benefits from techniques of natural language processing such as word sense disambiguation, semantic similarity measures, named entity recognition, relation extraction, or corpora good example search, and second, intensive exploitation of lexicographic data in language engineering technologies, in the form of general dictionaries or encyclopaedias as well as specialized lexicons, ontologies, or lexicographic databases.

In Czech

Kapitola představuje návaznosti mezi lexikografií a zpracováním přirozeného jazyka v obou směrech. V první části popisuje, jak lexikografická práce využívá techniky NLP, např. desambiguace významu, sémantické podobnostní metriky, rozpoznání jmenných entit, extrakce relací nebo hledání příkladů v korpusu. V druhé části intenzivní využívání lexikografických dat v technologiích jazykového inženýrství, v podobě obecných slovníků nebo encyklopedií a také specializovaných lexikonů, ontologií a lexikografických databází.

Links

LM2015071, research and development project
Name: Jazyková výzkumná infrastruktura v České republice (Acronym: LINDAT-Clarin)
Investor: Ministry of Education, Youth and Sports of the CR
MUNI/A/0897/2016, interní kód MU
Name: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VI.
Investor: Masaryk University, Category A