D 2019

Towards Universal Hyphenation Patterns

SOJKA, Petr a Ondřej SOJKA

Základní údaje

Originální název

Towards Universal Hyphenation Patterns

Vydání

Brno, Proceedings of the Thirteenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2019, od s. 63-68, 6 s. 2019

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/19:00111503

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1517-9

ISSN

EID Scopus

Klíčová slova česky

dělení slov; vzory dělení; patgen; dělení na slabiky; Unicode; TeX; slabičné dělení; čeština; slovenština

Klíčová slova anglicky

hyphenation; hyphenation patterns; patgen; syllabification; Unicode; TeX; syllabic hyphenation; Czech; Slovak

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 15. 5. 2024 01:38, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Hyphenation is at the core of every document preparation system, being that typesetting system such as TeX or modern web browser. For every language, there have to be algorithms, rules, or patterns hyphenating according to that. We are proposing the development of generic hyphenation patterns for a set of languages sharing the same principles, e.g., for all syllable-based languages. We have tested this idea by the development of Czechoslovak hyphenation patterns. At the minimal price of a tiny increase in the size of hyphenation patterns, we have shown that further development of universal syllabic hyphenation patterns is feasible.

Návaznosti

MUNI/A/1145/2018, interní kód MU
Název: Aplikovaný výzkum na FI: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, techniky pro zpracování a vizualizaci velkých dat a rozšířená realita.
Investor: Masarykova univerzita, Aplikovaný výzkum na FI: softwarové architektury kritických infrastruktur, bezpečnost počítačových systémů, techniky pro zpracování a vizualizaci velkých dat a rozšířená realita., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty