2016
DSL Shared task 2016: Perfect Is The Enemy of Good Language Discrimination Through Expectation-Maximization and Chunk-based Language Model
HERMAN, Ondřej, Vít SUCHOMEL, Vít BAISA a Pavel RYCHLÝZákladní údaje
Originální název
DSL Shared task 2016: Perfect Is The Enemy of Good Language Discrimination Through Expectation-Maximization and Chunk-based Language Model
Autoři
HERMAN, Ondřej (203 Česká republika, garant, domácí), Vít SUCHOMEL (203 Česká republika, domácí), Vít BAISA (203 Česká republika, domácí) a Pavel RYCHLÝ (203 Česká republika, domácí)
Vydání
Osaka, Proceedings of the Third Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial3), od s. 114-118, 5 s. 2016
Nakladatel
Association for Natural Language Processing (ANLP), Osaka, Japan
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
elektronická verze "online"
Odkazy
Kód RIV
RIV/00216224:14330/16:00092557
Organizační jednotka
Fakulta informatiky
ISBN
978-4-87974-716-7
Klíčová slova anglicky
language discrimination;expectation maximization;language model
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 1. 11. 2017 12:13, RNDr. Vít Suchomel, Ph.D.
Anotace
V originále
In this paper we investigate two approaches to discrimination of similar languages: Expectation--maximization algorithm for estimating conditional probability P(word|language) and byte level language models similar to compression-based language modelling methods. The accuracy of these methods reached respectively 86.6 % and 88.3 % on set A of the DSL Shared task 2016 competition.
Návaznosti
MUNI/A/0945/2015, interní kód MU |
| ||
7F14047, projekt VaV |
|