Další formáty:
BibTeX
LaTeX
RIS
@article{564632, author = {Sojka, Petr}, article_location = {Brno}, article_number = {3-4}, doi = {http://dx.doi.org/10.5300/2004-3-4/183}, keywords = {hyphenation; hyphenation patterns; patgen; syllabification; Unicode; TeX; syllabic hyphenation; Czech; Slovak}, language = {cze}, issn = {1211-6661}, journal = {Zpravodaj CSTUG}, title = {Slovenské vzory dělení: čas pro změnu?}, url = {https://cstug.cz/bulletin/pdf/bul_0434.pdf#page=69}, volume = {14}, year = {2004} }
TY - JOUR ID - 564632 AU - Sojka, Petr PY - 2004 TI - Slovenské vzory dělení: čas pro změnu? JF - Zpravodaj CSTUG VL - 14 IS - 3-4 SP - 183-189 EP - 183-189 PB - CSTUG SN - 12116661 KW - hyphenation KW - hyphenation patterns KW - patgen KW - syllabification KW - Unicode KW - TeX KW - syllabic hyphenation KW - Czech KW - Slovak UR - https://cstug.cz/bulletin/pdf/bul_0434.pdf#page=69 L2 - https://doi.org/10.5300/2004-3-4/183 N2 - Dělení slov neboli algoritmická segmentace velké množiny řetězců nějakého jazyka je problém častější než by se na první pohled zdálo. Pro volně šiřitelné slovenské dělení slov zatím existuje pouze řešení vycházející z~definice slabiky ve slovenštině, bez rozsáhlého pokrytí výjimek. Z~více než miliónu shromážděných a rozdělených slov se podařilo vygenerovat programem PatGen nové volně šiřitelné vzory, které se s~nepravidelnostmi jazyka vyrovnávají lépe než dosud dostupné řešení. Výsledek je použitelný nejen v~distribucích TeXu, ale i v~dalších systémech jako například OpenOffice.org. Použité a diskutované techniky bootstrappingu, stratifikace a generování vzorů jsou použitelné při řešení širokého spektra dalších segmentačních aplikací. ER -
SOJKA, Petr. Slovenské vzory dělení: čas pro změnu? \textit{Zpravodaj CSTUG}. Brno: CSTUG, 2004, roč.~14, 3-4, s.~183-189. ISSN~1211-6661. Dostupné z: https://dx.doi.org/10.5300/2004-3-4/183.
|