R 2008

czaccent - Adding Diacritics in Czech

RYCHLÝ, Pavel

Základní údaje

Originální název

czaccent - Adding Diacritics in Czech

Název česky

czaccent - doplňování diakritiky v čestině

Autoři

RYCHLÝ, Pavel (203 Česká republika, garant)

Vydání

2008

Další údaje

Jazyk

angličtina

Typ výsledku

Software

Obor

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/08:00027990

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

doplňování diakritiky; čeština

Klíčová slova anglicky

adding diacritics; czech;

Technické parametry

command line tool and web service for adding diacritics in czech texts, core library written in C++

Příznaky

Mezinárodní význam
Změněno: 15. 6. 2009 12:45, doc. Mgr. Pavel Rychlý, Ph.D.

Anotace

V originále

The czaccent system adds diacritics into czech text without diacritics, it uses statictical evaluation of all possible variants, the working data was trained on a very large Czech corpus. The system can be used as a command line tool, or a web-service.

Česky

Systém czaccent přidává diakritiku do českých textů bez diakritiky. Používá statistické vyhodnocování všech možných variant, pracovní data byla vytvořena na zálkladě velmi velkého českého korpusu. Systém může být použit z příkazové řádky nebo jako webová služba.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce