Other formats:
BibTeX
LaTeX
RIS
@inproceedings{750624, author = {Osolsobě, Klára}, address = {Praha}, booktitle = {Grammar & Corpora, 2nd International Conference, Abstracts}, edition = {1.}, keywords = {corpus; automatical morphological analysis; verb form; word class; gradation}, language = {cze}, location = {Praha}, isbn = {80-86496-35-X}, pages = {59-61}, publisher = {Ústav pro jazyk český AV ČR, V. v. i.}, title = {Korpus jako zdroj dat pro opravy chyb automatické morfologické analýzy}, year = {2007} }
TY - JOUR ID - 750624 AU - Osolsobě, Klára PY - 2007 TI - Korpus jako zdroj dat pro opravy chyb automatické morfologické analýzy PB - Ústav pro jazyk český AV ČR, V. v. i. CY - Praha SN - 808649635X KW - corpus KW - automatical morphological analysis KW - verb form KW - word class KW - gradation N2 - Cílem našeho příspěvku je ukázat, jak mohou korpusová data přispět k doplnění popisů gramatických jevů zachycených ve slovnících a gramatikách na straně jedné a v lingvistických bázích automatických morfologických analyzátorů na straně druhé. Ke značkování řádově stamilionových korpusů se běžně používají automatické nástroje. V prostředí českých korpusů jsou to především dva analyzátory (taggery) pro morfologické značkování. Morfologický analyzátor Jana Hajiče dále HA (Hajič, 1995, 2004, http://ucnk.ff.cuni.cz/bonito/index.html) a morfologický analyzátor Radka Sedláčka Ajka (Sedláček, 2005, http://nlp.fi.muni.cz/projekty/wwwajka). Lingvistickou bázi těchto analyzátorů byly mluvnice a slovníky, o něž se opíraly algoritmické popisy flexe (Hajič 1995, Osolsobě, 1996). Při aplikaci na jazykový materiál korpusů se ukázalo, že celá řada interpretací, které byly přiřazeny jednotkám na úrovni strojových slovníků, se plně nekryje s bohatstvím přirozeného jazyka, jak je prezentuje korpus. Vyšlo najevo, že s ohledem na zkušenosti z konkrétní praxe, je třeba některé interpretace zpětně verifikovat. V našem příspěvku si všimneme tří jevů: 1) syntetické futurum, 2) stupňování adjektiv a adverbií a 3) slovnědruhové přechody vybraných slov. ER -
OSOLSOBĚ, Klára. Korpus jako zdroj dat pro opravy chyb automatické morfologické analýzy (Corpus as Source of Amendements for Automatic Morphological Analysis). In \textit{Grammar \&{} Corpora, 2nd International Conference, Abstracts}. 1st ed. Praha: Ústav pro jazyk český AV ČR, V. v. i., 2007, p.~59-61. ISBN~80-86496-35-X.
|