CJBB84 Morfologie a korpus 7.30-9.00 G13 II. Triviální a netriviální vyhledávání substantiv podle vzoru •Morfologické značkování neobsahuje informace o skloňovacím typu •Je možné vyhledat v korpusech lemmata skloňovaná podle určitého vzoru? Formální vlastnosti substantiv a vzor •Zakončení a slovní druh (kos, sál, pila, žeň, chudě) •Slovníkové informace: lemma, rod, tvar genitivu •Rod a forma - zakončení (kroj x zbroj, kůň x tůň) •1. a 3. pozice (pražský systém) •Atributy k a g (brněnský systém) Substantiva (N/k1) •Rod (tag: pozice 3/g) •Zakončení lemmatu • Slovní formulace •Najděte substantiva skloňovaná podle vzoru žena. •1. substantiva •2. feminina •3. lemma končí na a Cql dotaz •[tag="NNF.*" & lemma=".*a"] • Počet lemmat (podle frekvence) skloňovaných podle vzoru žena v korpusu SYN2015 Lemmata rozpoznaná automatickou morfologickou analýzou •Nerozpoznaná lemmata •[tag="X.*" & lemma=".*([ayěeubdfghklmnprstvz]|ou|ách|ám|ami)"] • Výsledky Frekvenční analýza Zjednodušení dotazu •[tag="X.*" & lemma=".*([ayěeu]|ou|ách|ám|ami)"] • Příliš mnoho dat Ještě zjednodušíme •[tag="X.*" & lemma="(ách|ám|ami)"] • Alespoň něco Vzory zjistitelné analogicky •U kterých vzorů kombinací formy lemmatu a morfologické informace o rodu získáme jednoznačný výsledek? •U kterých je postup složitější? vzory s komplikovanějším postupem •pán a muž •hrad a stroj •píseň a kost •moře a kuře POZOR na dvě grafické varianty [eě] • Úkol na 25. 10. 2017 •Popiš postup vyhledávání substantiv skloňovaných podle vzorů pán/muž. •Všímej si, jak se chovají obojetné souhlásky [bfmpvlsz]. •Lze mezi obojetnými souhláskami najít nějakou skupinu, která by byla typickým zakončením pouze tvrdých vzorů? • Existují nějaké postupy, jak formálně odlišit maskulina zakončená na obojetné souhlásky, které se mohou vyskytovat v zakončení maskulin obou vzorů?