SLOVOTVORNÁ ANALÝZA Segmentace slova • slovotvorný základ (kmen, kořen) • prefix – před základem slova (při-jít) • sufix – za základem slova (uči-tel) • koncovka – součástí sufixu, sama sufixem (zdrav-í) • postfix – za koncovkou, při flexi se nemění (jaký-si, jakého-si) Slovotvorné postupy • derivace – odvozování, kombinace na úrovni morfémů • prefixace – připojení prefixu (dělat – při-dělat) • sufixace – připojení sufixu (tábor-ník) • resufixace – náhrada jednoho sufixu druhým (vlas-atý – vlas-áč) • postup prefixačně-sufixační (při-hloup-lý) • diskrétní formant se, si Slovotvorné postupy • hláskové alternace – konsonanty, vokály • plech – plíšek, brát – branec • kompozice – skládání na úrovni slovních základů • konekt – život-o-pis, knih-tisk Změna významu nebo slovního druhu • mutace – významová změna a změna slovního druhu (bílit – bělidlo) • transpozice – pouze změna slovního druhu (bílit – bílení) • modifikace – změna významového příznaku (bílit – obílit) Počítačové zpracování • slovo = řetězec znaků • derivace – připojení/odpojení, záměna části řetězce (prefix, sufix) • při automatickém zpracování nezáleží na směru převodu (slovo základové – odvozené) • možnost pracovat s hláskovými alternacemi • slovotvorná Ajka – (CZPJ) zachyceny jednoduché případy derivace (učit – učitel, boj - bojiště) Deriv • webové rozhraní – Deriv deb.fi.muni.cz/deriv • autor Pavel Šmerk • generování seznamů slov (prefix, sufix) • generování dvojic slov (až n-tic) na základě přidání, odebrání, záměny prefixu/sufixu • omezení pomocí morfologické značky (atributivní systém) • hláskové alternace – regulární výrazy • propojení s DEBDictem, KonTextem a SketchEnginem (SYN2000, czTenTen12) • Derivanče (derivační analyzátor češtiny) • https://nlp.fi.muni.cz/projekty/derivance/ DeriNet • http://ufal.mff.cuni.cz/derinet/search • vizualizace slovotvorných vztahů a slovotvorného hnízda • Zdeněk Žabokrtský, Magda Ševčíková, Jonáš Vidra • vyhledává v 970 tis. slovních jednotkách • není zahrnuto skládání slov • podporováno korpusovými daty • zapojen morfologický analyzátor, derivační a gramatická pravidla • největší hnízdo – 31 lexémů (hrát, řezat) • největší hloubka – 7 úrovní (vědět) Morfio • ÚČNK • autoři – Václav Cvrček, Pavel Vondřička • vyhledávání přímo v korpusu SYN2010/SYN2005 • společná báze, specifické formanty • omezení pomocí morfologické značky (poziční systém) • možnost hledání alternací (uživatelské rozhraní)