VIKMA05 Organizace znalostí 5. 4. 2019: Formální struktura dokumentu, reprezentace dokumentu (P7+K3) FF MU, jaro 2019 Mgr. Josef Schwarz 126172@mail.muni.cz Osnova ¢Praktická část ¢Přehled (minulých a budoucích) témat ¢Teoretická část lSGML lprávní texty – struktura ¢Zadání 7. dílčího kroku DA Praktická část DA krok č. 6 • PŘEHLED TÉMAT ¢ Přehled (minulých) témat ¢Témata ¢Úvod ¢Přístupy ke KO, doménová analýza ¢Ontologie, epistemologie, teleologie (pojem, metafora) ¢Kategorie, kategorizace, klasifikace (tradiční vs kognitivistický přístup: prototypy, bázové kategorie) ¢Termíny a terminologie ¢Notace a notační systém ¢ ¢Úkoly ¢Volba domény ¢Zdroje ¢ ¢Metafory ¢ ¢Prototypy a bázové kategorie ¢ ¢ ¢Reprezentace pojmu ¢Návrh notačního systému ¢ ¢ Přehled (budoucích) témat ¢Formální struktura dokumentu, reprezentace dokumentu ¢Procesy organizace znalostí ¢Ontologie ¢Univerzální klasifikační systémy ¢Systémy založené na přirozeném jazyce ¢Reprezentace a vizualizace znalostí ¢Závěrečná hodina - test STRUKTURA DOKUMENTU ¢ Formální struktura dokumentu ¢Tradiční lObsah, rejstřík, marginálie, živé záhlaví aj. ¢Elektronická lSGML (ISO 8879:1986) •Obecná struktura dokumentu a další atributy •Odvozené jazyky: např. HTML, XML •Pro základní informace o SGML a jeho struktuře viz web W3.org SGML – příklad 1 ¢PhDr. Rostislav Kaprál ¢Dělnická 356/5 ¢280 02 Kolín II SGML – příklad 1, varianta A ¢ lPhDr. RostislavKaprálDělnická <číslo_popisné>356/<číslo_orientační>5280 02 Kolín II l ¢ SGML – příklad 1, varianta B ¢ lPhDr. RostislavKaprálDělnická <číslo_popisné>356/<číslo_orientační>5280 02 Kolín II l ¢ SGML – příklad 2 ¢Nejvýznamnější a největší jeskyní Tišnovského krasu je jeskyně Králova. Byla objevena v květnu roku 1972 náhodně v souvislosti s jezevčí norou. Dostala jméno po Aloisi Královi, objeviteli Demänovských jeskyní na Slovensku, který byl již v době objevu čestným občanem města Tišnova. Nejstarší objevené části Královy jeskyně mají délku 350 m a bohatou krápníkovou výzdobu. V letech 1974 a 1984 byly objeveny další části, pozoruhodný je Dobšiarův dóm s brčky dlouhými až 160 cm. ¢ SGML – příklad 2 ¢ Nejvýznamnější a největší jeskyní Tišnovského krasu je jeskyně Králova. Byla objevena v <čas typ=„datum“ podtyp=„měsíc-rok“>květnu roku 1972 náhodně v souvislosti s jezevčí norou . Dostala jméno po Aloisi Královi, objeviteli Demänovských jeskyní na Slovensku, který byl již v době objevu čestným občanem města Tišnova. Nejstarší objevené části Královy jeskyně mají délku 350 m a bohatou krápníkovou výzdobu . <čas typ=„datum“ podtyp=„rok“> V letech 1974 a 1984 byly objeveny další části, pozoruhodný je Dobšiarův dóm s brčky dlouhými až 160 cm . ¢ Analýza právních textů Kořenský – Cvrček – Novák: Juristická a lingvistická analýza právních textů. Praha: Academia, 1999 ¢A. Typologie dokumentů l1. podle druhu •právní předpisy •soudní rozhodnutí •individuální rozhodnutí a normativní instrukce státní správy •důvodové zprávy •návrhy a projekty zákonů a dalších předpisů •záznamy parlamentních debat •výsledky připomínkových řízení •komentáře •učebnice, skripta a odborné monografie •odborné články •expertizy •přehledy platných právních předpis ¢ Analýza právních textů ¢A. Typologie dokumentů l2. Podle formy publikace •oficiální sbírky •neoficiální sbírky •knihy •odborné časopisy •jednotlivé dokumenty uložené v archivech institucí l3. Podle vztahu k původnímu znění •původní •upravené •obohacené •metadokumenty nebo adresy ¢ Analýza právních textů ¢B. Struktura položek v základním slovníku (LEMMA) l1. Základní slovní tvar l2. Typ •Speciální znaky •Číslice, římské číslice •Zkratky s tečkou (Sb.), zkratky bez tečky (ČR) •Pomocné znaky (§) •Slovenská slova •Cizí slova (ne chemické vzorce, ne názvy nemocí apod.) l3. Slovní druh l4. Rod l5. Životnost l6. Příslušnost ke kmenové sémantické skupině (daně, zdanění, danit) l7. Typy právních významů l8. Četnost l9. Číslo základního slovního tvaru l ¢ Analýza právních textů ¢C. Sémantika morfologicko-syntagmatických typů lPříklad – škoda •A – S: případná / věcná / hrozící •S – S: velkého rozsahu / značného rozsahu •S – praep S: na zdraví / na majetku / na pozemku •S – VF: vznikla / přesahuje / hrozí •VF – S: zavinil / způsobil / zabránil (škodu/škodě) •VF – praep S: dochází (ke škodám) / odpovídá (za škodu) •S – (praep) S: zjišťování / náhrada / úhrada (škody) / odpovědnost (za škodu) •INF – S: zabránit (škodě) / nahradit (škodu) •INF – praep S: odpovídat (za škodu) l lSémantické hodnocení vazeb: •Ad A - S •Věcná povaha škody •Vyjádření původu a příčiny škody •Kvantitativní hodnocení škody •Společenské hodnocení škody lModel morfologicko-syntagmatické struktury ¢ Analýza právních textů ¢D. Výrazová segmentace textu ¢E. Vztah mezi formální větou a textovou strukturací ¢F. Výskyt vyhledávaných syntagmat v segmentech textu ¢G. Distinktivní vlastnosti spojovacích prostředků (spojky a obdobné výrazy) ¢H. Morfologie, gramatika, sémantika právních textů ¢I. Struktura právních textů a jejich formální vztahy ¢J. Využití: l1. Tvorba právních předpisů •Formulace koncepčního záměru •Koncepce konkrétní legislativní úpravy •Zjišťování kontextových souvislostí •Právnělingvistická podpora legislativní činnosti •Vytváření úplných znění právních předpisů •Zpracování důvodových zpráv •Příprava legislativních výzkumů l2. Tvorba právní terminologie l3. Tvorba oborových klasifikací a tezaurů l4. Vyhledávání v oborových databázích l l ¢ ¢ ¢