R
2008
czaccent - Adding Diacritics in Czech
RYCHLÝ, Pavel
Basic information
Original name
czaccent - Adding Diacritics in Czech
Name in Czech
czaccent - doplňování diakritiky v čestině
Other information
Field of Study
20200 2.2 Electrical engineering, Electronic engineering, Information engineering
Country of publisher
Czech Republic
Confidentiality degree
není předmětem státního či obchodního tajemství
RIV identification code
RIV/00216224:14330/08:00027990
Organization unit
Faculty of Informatics
Keywords (in Czech)
doplňování diakritiky; čeština
Keywords in English
adding diacritics; czech;
Technical parameters
command line tool and web service for adding diacritics in czech texts, core library written in C++
Tags
International impact
V originále
The czaccent system adds diacritics into czech text without diacritics, it uses statictical evaluation of all possible variants, the working data was trained on a very large Czech corpus. The system can be used as a command line tool, or a web-service.
In Czech
Systém czaccent přidává diakritiku do českých textů bez diakritiky. Používá statistické vyhodnocování všech možných variant, pracovní data byla vytvořena na zálkladě velmi velkého českého korpusu. Systém může být použit z příkazové řádky nebo jako webová služba.
Links
LC536, research and development project | Name: Centrum komputační lingvistiky | Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky |
|
2C06009, research and development project | Name: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing) | Investor: Ministry of Education, Youth and Sports of the CR |
|
Displayed: 10/11/2024 16:12