Další formáty:
BibTeX
LaTeX
RIS
@misc{1341678, author = {Blahuš, Marek}, booktitle = {Klíč k češtině jako cizímu jazyku}, keywords = {mluvtecesky.net; Czech language; computer linguistics; corpus; morphology; lemmatization; dictionary; inflectional paradigms}, language = {cze}, title = {Aplikace počítačové lingvistiky při tvorbě on-line kurzu češtiny mluvtecesky.net}, year = {2015} }
TY - SLIDE ID - 1341678 AU - Blahuš, Marek PY - 2015 TI - Aplikace počítačové lingvistiky při tvorbě on-line kurzu češtiny mluvtecesky.net KW - mluvtecesky.net KW - Czech language KW - computer linguistics KW - corpus KW - morphology KW - lemmatization KW - dictionary KW - inflectional paradigms N2 - Příspěvek na příkladu webových stránek mluvtecesky.net ukazuje možnosti využití počítačové lingvistiky při tvorbě kurzů češtiny pro cizince. Počítačovělingvistickou podporu projektu poskytlo Centrum jazykového vzdělávání MU ve spolupráci s Fakultou informatiky MU. Lemmatizací korpusu vytvořených učebních textů s využitím morfologického analyzátoru byl nejprve odvozen frekvenční slovník pro kurz i jednotlivé jeho části – ten lze využít ke stanovení rozsahu kurzu (počet vyučovaných lexikálních jednotek), určení pokryté slovní zásoby (obecné i odborné), poloautomatické přípravě studijních pomůcek (seznamy slov k jednotlivým lekcím) a do jisté míry i k odstranění překlepů a prosazení jednotné terminologie. Seznam lemmat se stal podkladem pro tvorbu překladového slovníku, který umožňuje studentům kliknutím na slovo v českém textu získat jeho orientační překlad do zvoleného jazyka. Především však byl vzniklý slovník provázán s databází tvarů českých slov použitého morfologického analyzátoru tak, že ke každému slovu dovede aplikace nejen určit jeho gramatické kategorie, ale také zobrazit kompletní deklinační/konjugační tabulku příslušného lemmatu. Konečně v oblasti výuky českého tvarosloví byl zaujat inovativní přístup usilující o nalezení kompromisu mezi zjednodušenými a často neúplnými systémy slovních vzorů, používanými učiteli češtiny jako cizího jazyka, se strojově odvozeným systémem paradigmat interně používaných v počítačové lingvistice, který je sice bezvýjimkový a přitom všeobjímající, nicméně ve své neupravené podobě je pro svou komplexnost v praxi nepoužitelný. Výstupem je středně rozsáhlá sada vzorových slov, k nimž byla na základě morfologické podobnosti rozřazena všechna slova ze slovníku souběžně s vyznačením odchylek od očekávatelných pravidelně utvořených tvarů. Motivací byla vidina, že po podrobném seznámení se s jednotlivými vzory již studentům ke zvládnutí tvarosloví nových slov postačí jen všímat si jejich náležitosti ke vzoru a vyznačených výjimek. ER -
BLAHUŠ, Marek. Aplikace počítačové lingvistiky při tvorbě on-line kurzu češtiny mluvtecesky.net. In \textit{Klíč k češtině jako cizímu jazyku}. 2015.
|