Towards New Czechoslovak Hyphenation Patterns

J 2020

Towards New Czechoslovak Hyphenation Patterns

SOJKA, Petr a Ondřej SOJKA

Základní údaje

Originální název

Towards New Czechoslovak Hyphenation Patterns

Autoři

SOJKA, Petr a Ondřej SOJKA

Vydání

Zpravodaj CSTUG, Brno, CSTUG, 2020, 1211-6661

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

20206 Computer hardware and architecture

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

journal landing page, DOI

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/20:00132299

Organizační jednotka

Fakulta informatiky

DOI

https://doi.org/10.5300/2020-3-4/118

Klíčová slova česky

dělení slov; generování vzorů dělení; československé vozry dělení; slovní databáze; patgen; vícejazyčná sazba; dělení na slabiky; Unicode; TeX; slabičné dělení; čeština; slovenština; komprese

Klíčová slova anglicky

hyphenation; patttern generation; Czechoslovak hyphenation patterns; word list database; patgen; multilingual typesetting; Unicode; TeX; syllable segmentation; syllabification; Czech; Slovak; compression

Příznaky

Mezinárodní význam, Recenzováno

Změněno: 4. 2. 2025 18:15, doc. RNDr. Petr Sojka, Ph.D.

Anotace

V originále

Space- and time-effective segmentation and hyphenation of natural languages stay at the core of every document preparation system, web browser, or mobile rendering system. Recently, the unreasonable effectiveness of pattern generation has been shown – it is possible to use hyphenation patterns to solve the dictionary problem for a single language without compromise. In this article, we will show how we applied the marvelous effectiveness of patgen for the generation of the new Czechoslovak hyphenation patterns that cover two languages. We show that the development of more universal hyphenation patterns is feasible, allows for significant quality improvements and space savings. We evaluate the new approach and the new Czechoslovak hyphenation patterns.

Citovat

SOJKA, Petr a Ondřej SOJKA. Towards New Czechoslovak Hyphenation Patterns. Zpravodaj CSTUG. Brno: CSTUG, 2020, roč. 30, 3-4, s. 118-126. ISSN 1211-6661. Dostupné z: https://doi.org/10.5300/2020-3-4/118.

@article{2340198,
   author = {Sojka, Petr and Sojka, Ondřej},
   article_location = {Brno},
   article_number = {3-4},
   doi = {https://doi.org/10.5300/2020-3-4/118},
   keywords = {hyphenation; patttern generation; Czechoslovak hyphenation patterns; word list database; patgen; multilingual typesetting; Unicode; TeX; syllable segmentation; syllabification; Czech; Slovak; compression},
   language = {eng},
   issn = {1211-6661},
   journal = {Zpravodaj CSTUG},
   title = {Towards New Czechoslovak Hyphenation Patterns},
   url = {https://doi.org/10.5300/2020-3-4/118},
   volume = {30},
   year = {2020}
}

TY  - JOUR
ID  - 2340198
AU  - Sojka, Petr - Sojka, Ondřej
PY  - 2020
TI  - Towards New Czechoslovak Hyphenation Patterns
JF  - Zpravodaj CSTUG
VL  - 30
IS  - 3-4
SP  - 118-126
EP  - 118-126
PB  - CSTUG
SN  - 12116661
KW  - hyphenation
KW  - patttern generation
KW  - Czechoslovak hyphenation patterns
KW  - word list database
KW  - patgen
KW  - multilingual typesetting
KW  - Unicode
KW  - TeX
KW  - syllable segmentation
KW  - syllabification
KW  - Czech
KW  - Slovak
KW  - compression
UR  - https://doi.org/10.5300/2020-3-4/118
N2  - Space- and time-effective segmentation and hyphenation of natural languages stay at the core of every document preparation system, web browser, or mobile rendering system. Recently, the unreasonable effectiveness of pattern generation has been shown – it is possible to use hyphenation patterns to solve the dictionary problem for a single language without compromise. In this article, we will show how we applied the marvelous effectiveness of patgen for the generation of the new Czechoslovak hyphenation patterns that cover two languages. We show that the development of more universal hyphenation patterns is feasible, allows for significant quality improvements and space savings. We evaluate the new approach and the new Czechoslovak hyphenation patterns.
ER  -

SOJKA, Petr a Ondřej SOJKA. Towards New Czechoslovak Hyphenation Patterns. \textit{Zpravodaj CSTUG}. Brno: CSTUG, 2020, roč.~30, 3-4, s.~118-126. ISSN~1211-6661. Dostupné z: https://doi.org/10.5300/2020-3-4/118.

Přehled o publikaci