SOJKA, Petr a Ondřej SOJKA. Towards Universal Hyphenation Patterns. In Aleš Horák, Pavel Rychlý, Adam Rambousek. Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2019. Brno: Tribun EU, 2019, s. 63-68. ISBN 978-80-263-1517-9.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Towards Universal Hyphenation Patterns
Autoři SOJKA, Petr (203 Česká republika, garant, domácí) a Ondřej SOJKA (203 Česká republika, domácí).
Vydání Brno, Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2019, od s. 63-68, 6 s. 2019.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW full paper workshop homepage conference slides
Kód RIV RIV/00216224:14330/19:00111503
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-1517-9
ISSN 2336-4289
UT WoS 000604899800008
Klíčová slova česky dělení slov; vzory dělení; patgen; dělení na slabiky; Unicode; TeX; slabičné dělení; čeština; slovenština
Klíčová slova anglicky hyphenation; hyphenation patterns; patgen; syllabification; Unicode; TeX; syllabic hyphenation; Czech; Slovak
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 15. 5. 2024 01:38.
Anotace
Hyphenation is at the core of every document preparation system, being that typesetting system such as TeX or modern web browser. For every language, there have to be algorithms, rules, or patterns hyphenating according to that. We are proposing the development of generic hyphenation patterns for a set of languages sharing the same principles, e.g., for all syllable-based languages. We have tested this idea by the development of Czechoslovak hyphenation patterns. At the minimal price of a tiny increase in the size of hyphenation patterns, we have shown that further development of universal syllabic hyphenation patterns is feasible.
Návaznosti
MUNI/A/1145/2018, interní kód MUNázev: Aplikovaný výzkum na FI: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, techniky pro zpracování a vizualizaci velkých dat a rozšířená realita.
Investor: Masarykova univerzita, Aplikovaný výzkum na FI: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, techniky pro zpracování a vizualizaci velkých dat a rozšířená realita., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
VytisknoutZobrazeno: 25. 9. 2024 18:51