VIKMA05
Organizace znalostí
5. 4. 2019: Formální struktura dokumentu, reprezentace dokumentu (P7+K3)
FF MU, jaro 2019
Mgr. Josef Schwarz
126172@mail.muni.cz
Osnova
¢Praktická část
¢Přehled (minulých a budoucích) témat
¢Teoretická část
lSGML
lprávní texty – struktura
¢Zadání 7. dílčího kroku DA
Praktická část
DA krok č. 6
•
PŘEHLED TÉMAT
¢
Přehled (minulých) témat
¢Témata
¢Úvod
¢Přístupy ke KO, doménová analýza ¢Ontologie, epistemologie, teleologie (pojem, metafora)
¢Kategorie, kategorizace, klasifikace (tradiční vs kognitivistický přístup: prototypy, bázové
kategorie)
¢Termíny a terminologie
¢Notace a notační systém
¢
¢Úkoly
¢Volba domény
¢Zdroje
¢
¢Metafory
¢
¢Prototypy a bázové kategorie
¢
¢
¢Reprezentace pojmu
¢Návrh notačního systému
¢
¢
Přehled (budoucích) témat
¢Formální struktura dokumentu, reprezentace dokumentu
¢Procesy organizace znalostí
¢Ontologie
¢Univerzální klasifikační systémy
¢Systémy založené na přirozeném jazyce
¢Reprezentace a vizualizace znalostí
¢Závěrečná hodina - test
STRUKTURA DOKUMENTU
¢
Formální struktura dokumentu
¢Tradiční
lObsah, rejstřík, marginálie, živé záhlaví aj.
¢Elektronická
lSGML (ISO 8879:1986)
•Obecná struktura dokumentu a další atributy
•Odvozené jazyky: např. HTML, XML
•Pro základní informace o SGML a jeho struktuře viz web W3.org
SGML – příklad 1
¢PhDr. Rostislav Kaprál
¢Dělnická 356/5
¢280 02 Kolín II
SGML – příklad 1, varianta A
¢
l
•
•PhDr. RostislavKaprál
•
•Dělnická <číslo_popisné>356číslo_popisné>/<číslo_orientační>5číslo_orientační>
•280 02 Kolín II
l
¢
SGML – příklad 1, varianta B
¢
l
•
•PhDr. RostislavKaprál
•
•Dělnická
<číslo_popisné>356číslo_popisné>/<číslo_orientační>5číslo_orientační>
•280 02 Kolín II
l
¢
SGML – příklad 2
¢Nejvýznamnější a největší jeskyní Tišnovského krasu je jeskyně Králova. Byla objevena v květnu
roku 1972 náhodně v souvislosti s jezevčí norou. Dostala jméno po Aloisi Královi, objeviteli
Demänovských jeskyní na Slovensku, který byl již v době objevu čestným občanem města Tišnova.
Nejstarší objevené části Královy jeskyně mají délku 350 m a bohatou krápníkovou výzdobu. V letech
1974 a 1984 byly objeveny další části, pozoruhodný je Dobšiarův dóm s brčky dlouhými až 160 cm.
¢
SGML – příklad 2
¢ Nejvýznamnější a
největší jeskyní Tišnovského krasu je jeskyně
Králova. Byla objevena v <čas typ=„datum“ podtyp=„měsíc-rok“>květnu roku 1972
čas> náhodně v souvislosti s jezevčí norou . Dostala jméno po
Aloisi Královi, objeviteli Demänovských jeskyní na
Slovensku, který byl již v době objevu čestným občanem města Tišnova. Nejstarší objevené části Královy jeskyně mají délku 350 m a bohatou krápníkovou výzdobu . <čas typ=„datum“
podtyp=„rok“> V letech 1974 a 1984 čas> byly objeveny další části, pozoruhodný je Dobšiarův dóm s brčky dlouhými až 160 cm
.
¢
Analýza právních textů
Kořenský – Cvrček – Novák: Juristická a lingvistická analýza právních textů. Praha: Academia, 1999
¢A. Typologie dokumentů
l1. podle druhu
•právní předpisy
•soudní rozhodnutí
•individuální rozhodnutí a normativní instrukce státní správy
•důvodové zprávy
•návrhy a projekty zákonů a dalších předpisů
•záznamy parlamentních debat
•výsledky připomínkových řízení
•komentáře
•učebnice, skripta a odborné monografie
•odborné články
•expertizy
•přehledy platných právních předpis
¢
Analýza právních textů
¢A. Typologie dokumentů
l2. Podle formy publikace
•oficiální sbírky
•neoficiální sbírky
•knihy
•odborné časopisy
•jednotlivé dokumenty uložené v archivech institucí
l3. Podle vztahu k původnímu znění
•původní
•upravené
•obohacené
•metadokumenty nebo adresy
¢
Analýza právních textů
¢B. Struktura položek v základním slovníku (LEMMA)
l1. Základní slovní tvar
l2. Typ
•Speciální znaky
•Číslice, římské číslice
•Zkratky s tečkou (Sb.), zkratky bez tečky (ČR)
•Pomocné znaky (§)
•Slovenská slova
•Cizí slova (ne chemické vzorce, ne názvy nemocí apod.)
l3. Slovní druh
l4. Rod
l5. Životnost
l6. Příslušnost ke kmenové sémantické skupině (daně, zdanění, danit)
l7. Typy právních významů
l8. Četnost
l9. Číslo základního slovního tvaru
l
¢
Analýza právních textů
¢C. Sémantika morfologicko-syntagmatických typů
lPříklad – škoda
•A – S: případná / věcná / hrozící
•S – S: velkého rozsahu / značného rozsahu
•S – praep S: na zdraví / na majetku / na pozemku
•S – VF: vznikla / přesahuje / hrozí
•VF – S: zavinil / způsobil / zabránil (škodu/škodě)
•VF – praep S: dochází (ke škodám) / odpovídá (za škodu)
•S – (praep) S: zjišťování / náhrada / úhrada (škody) / odpovědnost (za škodu)
•INF – S: zabránit (škodě) / nahradit (škodu)
•INF – praep S: odpovídat (za škodu)
l
lSémantické hodnocení vazeb:
•Ad A - S
•Věcná povaha škody
•Vyjádření původu a příčiny škody
•Kvantitativní hodnocení škody
•Společenské hodnocení škody
lModel morfologicko-syntagmatické struktury
¢
Analýza právních textů
¢D. Výrazová segmentace textu
¢E. Vztah mezi formální větou a textovou strukturací
¢F. Výskyt vyhledávaných syntagmat v segmentech textu
¢G. Distinktivní vlastnosti spojovacích prostředků (spojky a obdobné výrazy)
¢H. Morfologie, gramatika, sémantika právních textů
¢I. Struktura právních textů a jejich formální vztahy
¢J. Využití:
l1. Tvorba právních předpisů
•Formulace koncepčního záměru
•Koncepce konkrétní legislativní úpravy
•Zjišťování kontextových souvislostí
•Právnělingvistická podpora legislativní činnosti
•Vytváření úplných znění právních předpisů
•Zpracování důvodových zpráv
•Příprava legislativních výzkumů
l2. Tvorba právní terminologie
l3. Tvorba oborových klasifikací a tezaurů
l4. Vyhledávání v oborových databázích
l
l
¢
¢
¢