Další formáty:
BibTeX
LaTeX
RIS
@inproceedings{347632, author = {Antoš, David and Sojka, Petr}, address = {Brno}, booktitle = {Sborník druhého semináře o Linuxu a TeXu, SLT 2001}, keywords = {patterns;UNICODE;finite automata;natural language processing;language engineering}, language = {cze}, location = {Brno}, isbn = {80-7302-009-2}, pages = {23-32}, publisher = {Konvoj}, title = {Generování vzorů dělení slov v UNICODE}, url = {http://www.cstug.cz/slt/01/sltproc.html}, year = {2001} }
TY - JOUR ID - 347632 AU - Antoš, David - Sojka, Petr PY - 2001 TI - Generování vzorů dělení slov v UNICODE PB - Konvoj CY - Brno SN - 8073020092 KW - patterns;UNICODE;finite automata;natural language processing;language engineering UR - http://www.cstug.cz/slt/01/sltproc.html N2 - Článek popisuje techniku vzorů jako prostředek pro získávání informace z~rozsáhlých dat a zpětné rozpoznávání. Typickou aplikací této techniky je dělení slov. Dosud chybí generátor vzorů dělení pro systém $\Omega$ (pro UNICODE) a rozšíření programu PATGEN, omezeného osmibitovým ASCII, není únosné. Proto vyvíjíme knihovnu PATLIB pro obecnou manipulaci se vzory a na ní postavíme generátor vzorů dělení slov v~UNICODE. Popíšeme architekturu připravovaného systému a dále méně známou datovou strukturu dynamic packed trie, kterou lze výhodně použít pro efektivní ukládání konečných jazyků s výstupy. Vzory lze použít i pro rozpoznávání hranic složených slov, proto zmíníme návrhy na rozšíření následníků TeXu o klasifikované dělení s~více typy dělících bodů a o automatické potlačování ligatur na švech složených~slov. ER -
ANTOŠ, David a Petr SOJKA. Generování vzorů dělení slov v UNICODE. In \textit{Sborník druhého semináře o Linuxu a TeXu, SLT 2001}. Brno: Konvoj, 2001. s.~23-32. ISBN~80-7302-009-2.
|