Další formáty:
BibTeX
LaTeX
RIS
@inproceedings{797303, author = {Osolsobě, Klára}, address = {Praha}, booktitle = {Grammar & Corpora / Gramatika a korpus 2007}, edition = {1.}, keywords = {Corpus; tagging; synthetic future; gradation; undefinite numeral}, language = {cze}, location = {Praha}, isbn = {978-80-200-1634-8}, pages = {407-416}, publisher = {Academia}, title = {Značkování a status některých gramatických kategorií v ČNK (syntetické futurum, stupňování adjektiv, neurčité číslovky a příslovce míry)}, year = {2008} }
TY - JOUR ID - 797303 AU - Osolsobě, Klára PY - 2008 TI - Značkování a status některých gramatických kategorií v ČNK (syntetické futurum, stupňování adjektiv, neurčité číslovky a příslovce míry) PB - Academia CY - Praha SN - 9788020016348 KW - Corpus KW - tagging KW - synthetic future KW - gradation KW - undefinite numeral N2 - Cílem našeho příspěvku je ukázat, jak mohou korpusová data přispět k doplnění popisů gramatických jevů zachycených ve slovnících a gramatikách na straně jedné a v lingvistických bázích automatických morfologických analyzátorů na straně druhé. Ke značkování řádově stamilionových korpusů se běžně používají automatické nástroje. V prostředí českých korpusů jsou to především dva analyzátory (taggery) pro morfologické značkování. Morfologický analyzátor Jana Hajiče, dále HA (Hajič, 1995, 2004, http://ucnk.ff.cuni.cz/bonito/index.html) a morfologický analyzátor Radka Sedláčka Ajka (Sedláček, 2005, http://nlp.fi.muni.cz/projekty/wwwajka). Lingvistickou bázi těchto analyzátorů byly mluvnice a slovníky, o něž se opíraly algoritmické popisy flexe (Hajič 1995, Osolsobě, 1996). Při aplikaci na jazykový materiál korpusů se ukázalo, že celá řada interpretací, které byly přiřazeny jednotkám na úrovni strojových slovníků, se plně nekryje s bohatstvím přirozeného jazyka, jak je prezentuje korpus. Vyšlo najevo, že s ohledem na zkušenosti z konkrétní praxe, je třeba některé interpretace zpětně verifikovat. V našem příspěvku si všimneme tří jevů: 1) syntetické futurum, 2) stupňování adjektiv a adverbií a 3) slovnědruhové přechody vybraných slov. ER -
OSOLSOBĚ, Klára. Značkování a status některých gramatických kategorií v ČNK (syntetické futurum, stupňování adjektiv, neurčité číslovky a příslovce míry). In \textit{Grammar \&{} Corpora / Gramatika a korpus 2007}. 1. vyd. Praha: Academia, 2008, s.~407-416. ISBN~978-80-200-1634-8.
|