Další formáty:
BibTeX
LaTeX
RIS
@inproceedings{1300200, author = {Osolsobě, Klára}, address = {Praha}, booktitle = {Proměna jazyka a jeho výzkumu v době nových médií a technologií}, edition = {1.}, editor = {Děngeová, Zuzana; Vališová, Pavlína}, keywords = {corpus; corpus based; corpus driven; overgeneration; undegeneration; lemma; tag; word formation}, howpublished = {elektronická verze "online"}, language = {cze}, location = {Praha}, isbn = {978-80-86496-87-0}, pages = {3-12}, publisher = {Ústav pro jazyk český AV ČR}, title = {Využití corpus driven metod při corpus based výzkumu}, url = {http://www.phil.muni.cz/wucj/home/News/2015/sbornik-promena-jazyka-a-jeho-vyzkumu-v-dobe-novych-medii-a-technologii}, year = {2015} }
TY - JOUR ID - 1300200 AU - Osolsobě, Klára PY - 2015 TI - Využití corpus driven metod při corpus based výzkumu PB - Ústav pro jazyk český AV ČR CY - Praha SN - 9788086496870 KW - corpus KW - corpus based KW - corpus driven KW - overgeneration KW - undegeneration KW - lemma KW - tag KW - word formation UR - http://www.phil.muni.cz/wucj/home/News/2015/sbornik-promena-jazyka-a-jeho-vyzkumu-v-dobe-novych-medii-a-technologii N2 - Jedním z podstatných rysů aplikací automatické analýzy přirozeného jazyka je tzv. přegerovávání. Formální definici odpovídají jednotky, které tvoří homogenní skupinu (tu, kterou se prostřednictvím formálního zadání snažíme definovat), ale i jednotky, které jsou vůči této skupině heterogenní. Tento jev spadá na vrub obecné vlastnosti přirozeného jazyka, jíž je nejednoznačnost (homonymie) na všech úrovních. Rubem téže mince je tzv. podgenerovávání, tedy případ, kdy formální zadání je vymezeno příliš úzce, takže nejsou zachyceny jednotky, které se jeho prostřednictvím snažíme definovat. Na konkrétním příkladu ukážeme postup optimalizace vyhledávání dat pro korpusově založený (corpus based) výzkum slovotvorby, který vychází z korpusově řízené (corpus driven) metody zpřesňování formálního zadání na základě pozorování přegenerovaných dat. ER -
OSOLSOBĚ, Klára. Využití corpus driven metod při corpus based výzkumu. Online. In Děngeová, Zuzana; Vališová, Pavlína. \textit{Proměna jazyka a jeho výzkumu v době nových médií a technologií}. 1. vyd. Praha: Ústav pro jazyk český AV ČR, 2015, s.~3-12. ISBN~978-80-86496-87-0.
|