Přegenerovávání a podgenerovávání – dva problémy automatické analýzy přirozeného jazyka, konkrétně slovotvorby ÒFormální definici (algoritmu) odpovídají jednotky, které tvoří homogenní skupinu (tu, kterou se prostřednictvím formálního zadání snažíme definovat), ale i jednotky, které jsou vůči této skupině heterogenní. Tento jev spadá na vrub obecné vlastnosti přirozeného jazyka, jíž je víceznačnost (homonymie) na všech úrovních. ÒRubem téže mince je tzv. podgenerovávání, tedy případ, kdy formální zadání je vymezeno příliš úzce, takže nejsou zachyceny jednotky, které se jeho prostřednictvím snažíme definovat. ÒNáboženství, nádeničení, … ÒKlíč, míč, … ÒMaskulina životná s koncovým řetězcem tel Òseznam Òt$/k5.*mF>tel/k1gMnSc1 Òseznam ÒSeznam ÒPřít/přítel Ò ÒPříliš široké formální vymezení ÒNemožnost užšího formálního vymezení ÒKde jsou slova jako ředitel, uchvatitel, šiřitel, majitel, pisatel, … ? ÒZahrnutí alternací do vyhledávání jakožto prostředek zúžení definice hledaných jednotek. Ò Òat$/k5.*mF>áč/k1gMnSc1 Ò Ò ÒSlovník Òslovník ÒPolyfunkčnost prostředku (-á-č x –áč) ÒZávisí na mimojazykových znalostech ÒObtížně se formálně definuje ÒNedostatky ve formální definici ÒNepravidelnosti (vozač, trubač) ÒJednotky nejsou zachyceny ve slovníku ÒJednotkám nezachyceným ve slovníku chybí interpretace na úrovni lemmatu a morfologické značky Òkout/kouč, klít/klíč, sálat/salač ÒPropria: máchat/Machač, tykat/Tykač, dědit/Dědič, pískat/Piskač, kopat/Kopač, klapat/Klapač, kovat/Kovač, pleskat/Pleskač, bílit/Bilič Òhláskové alternace kořenového vokálu u derivátů od sloves III. třídy podle kmene prézentního (vzor krýt) Òhláskové alternace kořenového vokálu u ostatních tříd a vzorů Òhláskové alternace kmenotvorného vokálu u ostatních tříd a vzorů Òhrát/hráč Òchcát/chcáč Ò? pít/píč Ò? pět/pěč Ò? sít/síč Òpít (čaj)/ čajpíč Òžít/žíč Ò! šít/šič Ò Ò Ò Òbít/bič Òrýt/rýč Ò Òvyprávět/vypravěč |vyprávěč Òvyjednávat/vyjednavač |vyjednávač Ò Òhttp://prirucka.ujc.cas.cz/?id=730#nadpis14 Ò2 Střídání krátkých a dlouhých samohlásek při tvoření slov ÒPříklady nikoli pravidla (?seznamy výjimek) ÒOSOLSOBĚ, Klára. Morfologie českého slovesa a tvoření deverbativ jako problém strojové analýzy češtiny. 1. vyd. Brno: Masarykova univerzita, 2011. 220 s. Spisy FF MU v Brně č. 401. ISBN 978-80-210-5565-0. ÒCVRČEK, Václav: Co je nového v ČNK II. KORPUS – GRAMATIKA – AXIOLOGIE 7/ 2013, 95-97. ÒPomocí nástrojů Deriv a morfio vyhledejte kandidáty na trojice sloveso-činitelské jméno na –č – ženský protějšek na –čka (sloveso – {jméno prostředku na –č} – jméno prostředku na -čka). ÒPopište případy přegenerování popř. podgenerování