CJDSL001 Korpusová lingvistika (4) Klára Osolsobě osolsobe@phil.muni.cz Experimentální a počítačová lingvistika DO1 1 O čem budeme mluvit •Krátký historický exkurz •Definice korpusu v moderním slova smyslu •Dva metodologické přístupy k vytěžování korpusu •Dva pohledy na korpus (lingvista a informatik) •Filologie a korpusy •Výuka jazyků a korpusy DO1 2 Korpusy a jejich využití ve výuce •Metoda DDL (Tim Johnes) •Žákovské korpusy (Learner Corpora) •Učebnicové korpusy DO1 3 DDL / Data Driven Learning •Termín DDL byl zaveden britským korpusovým lingvistou Timem Johnsem, jenž jako první využíval korpusy ve výuce angličtiny. Tato metoda je založena na poznatcích studenta, který objevuje cizí jazyk na základě korpusových dat. Učitel je zde pouze koordinátorem studentovy práce, který zajišťuje vhodné prostředí, v němž bude student schopen dospívat k lingvistickým závěrům. Jedná se o rozvinutí studentových schopností učit se jak se učit (learn how to learn). Student je také vědcem, jenž je veden korpusovými daty k tomu, aby vyvodil závěry a dospěl k obecným gramatickým pravidlům. •Na rozdíl od ve výuce běžného deduktivního přístupu je DDL přístupem induktivním, který se soustředí v první řádě na pozorování korpusových dat, na základě kterých student klasifikuje jazykové jevy a následně generalizuje gramatická pravidla. Učitel přesně neví, k jakým závěrům dospěje student, proto koordinuje studentovu práci a jeho pozice je spíše partnerská než autoritativní. DO1 4 HARD/SOFT •DDL hard − (též hands-on) kdy studenti pracují přímo s korpusovým výhledávačem •DDL soft − (též hands-off) kdy studenti řeší úkoly připravené na základě korpusových dat, např. ve formě vytištěných konkordancí. •Výhody/nevýhody obou postupů DO1 5 Některé nástroje dostupné v českém prostředí •Slovo v kostce (WaG) poskytuje rychlý a základní přehledu o tom, jak se používá zadané slovo. Informace z korpusů ČNK pomocí dostupných nástrojů podávají přehledný profil slova z různých perspektiv. (https://www.korpus.cz/slovo-v-kostce/) •Portál UČNK pro školy (https://korpus.cz/proskoly) •VŠ učebnice DO1 6 WaG •Co vás napadne, když se řekne reprodukce? •Jak vypadá profil uvedeného slova nabízený nástrojem WaG a jak vypadá profil téhož slova nabízený nástroji Sketch Engine? •Který z nástrojů byste preferovali ve výuce? DO1 7 Typy a výhody korpusových cvičení •vycházejí z autentických psaných i mluvených textů •jsou vhodná pro žáky ZŠ i studenty SŠ ve výuce češtiny i cizích jazyků •jsou ideálním domácím úkolem, který bude studenty bavit •pracovní listy lze snadno stáhnout i vytisknout jako zadání •více informací najdete v manuálu •Jak citovat: Lukešová, L. (ed.) (2017). Pro školy - repozitář korpusových cvičení. FF UK, Praha. Dostupný z WWW: . DO1 8 Možnost pracovat s připravenými cvičeními/ inspirace pro rozvoj vlastních nápadů DO1 9 Žákovské korpusy / Learner Corpora •Žákovské korpusy (learner corpora) obsahují texty většinou nerodilých mluvčích, kteří se jazyk teprve učí. Povětšinou se jedná o psané (školní) práce, zřídka nacházíme mluvené žákovské korpusy. •Význam žákovských korpusů vzrůstá nejen s jejich rozsahem ale také s jejich anotací. Pokud je součástí jejich metadat také tzv. chybová anotace, je možné klasifikovat jednotlivé odchylky od běžného úzu, zjišťovat jejich četnost, příp. i motivaci. Součástí metadat bývá také rozšířená informace o pisateli, která je často obohacena o relevantní údaje vztahující se k jeho věku, mateřskému jazyku, úrovni jeho znalostí cílového jazyka apod. •Žákovské korpusy zachycují jazyk mluvčích/pisatelů, kteří dosud nezvládají cílový jazyk dokonale; v tomto smyslu je možné je chápat jako specifický případ korpusů akvizičních. V rámci ČNK jsou k dispozici žákovské korpusy CzeSL-plain a CzeSL-SGT. DO1 10 Učebnicové korpusy •Specializované korpusy vytvořené z učebnic •Obsahuje soubor všech slov a frází, se kterými student přišel do styku při práci s učebnicí (může se k nim vracet) a nahrazuje a automatizuje klasickou analýzu učebnic •Využití: a) výzkum slovní zásoby a komparace s autentickým územ v národních korpusech; b) studium osvojování jazyka (je možné vyhledat všechny kontexty, ve kterých se slovo či fráze vyskytují v učebnicích různých úrovní); c) výběr slovní zásoby pro jednotlivé úrovně a porovnání stavu v učebicích a v SERR; d) porovnání inputu v podobě textů, poslechů i cvičení; e) porovnáním kolokací slov ve cvičeních v různých učebnicích; f) výzkum metajazyka /terminologie užívaného v učebnicích; g) zastoupení různých jazykových variant v učebnicích; h) zkoumání různých gramatických jevů (máme-li k dispozici tagovaný korpus) DO1 11 UčKo – příklad učebnicového korpusu DO1 12 Korpus UčebKo •Korpus učebnic češtiny pro cizince •Součást projektu SLAN (Slovotvorný analyzátor pro výuku češtiny pro cizince) na PedF MU •Zpracování české a ruské slovotvorby pro potřeby výuky češtiny jako druhého/cizího jazyka. •Budování nástroje CZed DO1 13 Úkol Pravidla českého slovosledu, zejména postavení auxiliáru a významového slovesa v českém minulém čase, jsou dosti obtížná a cizinci, kteří se učí česky, v této oblasti chybují. Pokuste se v žákovském korpusu najít příklady chybného slovosledu uvedeného typu. 14 https://www.korpus.cz/kontext/view?maincorp=czesl-plain&viewmode=k wic&pagesize=40&attrs=word&attr_vmode=visible-kwic&base_viewattr= word&structs=doc&refs=doc%2C%3Ddoc.name%2C%3Ddoc.group&q=~Ro yWCuW8GwiY 15 Nástroj SKELL (https://www.sketchengine.eu/skell/) Jste zvyklí užívat SKELL? Máte zkušenosti s případy, kdy je třeba vysvětlit, jak funguje a co vlastně zprostředkuje? Podívejte se do nástroje SKELL na slova jako svízel, modrák, hořčák, bledule, … 16 Příklady užití 17 WS 18 Podobná slova 19 Závěr •Využití korpusů ve výuce •Využití korpusů pro zlepšení výuky •Tvorba specializovaných nástrojů spojených s výukovými potřebami •Tvorba specializovaných korpusů spojených s výukovými potřebami DO1 20 Vytvořte skupiny po třech a pokuste se •navrhnout jednoduchý výukový materiál, v němž byste využili korpusové nástroje, o nichž jsme mluvili v průběhu kurzu •najít žákovské korpusy jazyka, který byste mohli (máte aprobaci) vyučovat •najít učebnicové korpusy jazyka, který byste mohli (máte aprobaci) vyučovat DO1 21 Seminární práce Jak souvisí korpusová lingvistika s tématem disertačního projektu. Jaké korpusy užívám/buduji a jaké problémy řeším. DO1 22 Děkuji vám za pozornost DO1 23