DIACHRONIE A KORPUSY Úvod do korpusové lingvistiky 7 Diachronní diakorp v6 —Korpus Diakorp reprezentuje diachronní složku ČNK. —7 století —(v6 -3,4 mil. slov. ) —dia 2019 – připraven k publikaci konec 13. stol. - 1989 —Do r. 1989 odborné texty a publicistika —do r. 1944 beletrie —původně zapsané či vytištěné různými pravopisnými systémy (tzv. jednoduchým, spřežkovým a diakritickým pravopisem) a jejich kombinacemi —transkripce nikoli transliterace (popř. další úpravy) —https://wiki.korpus.cz/doku.php/kurz:hledani_v_diachronnim_korpusu Texty: Klasifikace textů v korpusu Diakorp verze 6 Kompletní seznam zdrojových textů https://wiki.korpus.cz/doku.php/seznamy:zdrojove_texty_korpusu Kontext Není lemmatizován, lze užít regulární výrazy [word=".*uov?"] Další zdroje pro diachronní výzkum - VW internetová aplikace, která od listopadu 2006 postupně zpřístupňuje textové, obrazové a zvukové zdroje k poznání historické češtiny. Staročeské slovníky —el. verze slovníků staré češtiny skvúcí/stkvúcí — Textová banka dostupná přes KonText — Je lemmatizován (být) nikoli desambiguován Lze využít funkce rozhraní KonText Starší české mluvnice —http://vokabular.ujc.cas.cz/moduly/mluvnice — — více —http://vokabular.ujc.cas.cz/informace.aspx?t=kontakty&o=kontakty — http://kott.ujc.cas.cz/index.php — Příklad otázek v testu —Která pracoviště zpřístupňují diachronní data? —Lze zkoumat česká diachronní data pomocí stejných nástrojů (manařeru kontext) jako data synchronní? —Existují lemmatizovaná diachronní data? —