Další formáty:
BibTeX
LaTeX
RIS
@inproceedings{707401, author = {Hlaváčková, Dana and Sedláček, Radek}, address = {Bratislava}, booktitle = {Varia XIV.}, edition = {1}, language = {cze}, location = {Bratislava}, isbn = {80-89037-04-6}, pages = {371-379}, publisher = {Slovenská jazykovedná spoločnosť pri SAV}, title = {Morfologické značkování korpusu soukromé korespondence}, year = {2006} }
TY - JOUR ID - 707401 AU - Hlaváčková, Dana - Sedláček, Radek PY - 2006 TI - Morfologické značkování korpusu soukromé korespondence PB - Slovenská jazykovedná spoločnosť pri SAV CY - Bratislava SN - 8089037046 N2 - Na FF MU v Brně byl, v rámci grantového projektu, vytvořen jazykový korpus, který obsahuje 2000 klasických dopisů a 1000 e-mailů od 3000 různých pisatelů. Do konce roku 2005 by měl být korpus přístupný jednak na CD, jednak jako součást ČNK. V příspěvku se věnujeme automatickému morfologickému značkování korpusu a především úpravám stávajícího analyzátoru ajka (Sedláček – Smrž, 2001), který byl vytvořen na FI MU v Brně a je primárně určen pro analýzu spisovné češtiny. Morfologické značkování je prováděno prozatím pouze na části obsahující klasické dopisy, tj. na Korpusu soukromé korespondence (KSK) o velikosti přes 900 000 slovních výskytů. Zpracovávaný korpus kromě spisovných tvarů slov obsahuje také množství výrazů z oblasti obecné češtiny a různých dialektů s převahou středomoravského interdialektu. Analyzátor ajka je doplňován o variantní tvary především z důvodu snížení podílu ručního značkování. ER -
HLAVÁČKOVÁ, Dana a Radek SEDLÁČEK. Morfologické značkování korpusu soukromé korespondence. In \textit{Varia XIV.}. 1. vyd. Bratislava: Slovenská jazykovedná spoločnosť pri SAV, 2006, s.~371-379, 453 s. ISBN~80-89037-04-6.
|