D 2009

Semantic Network Integrity Maintenance via Heuristic Semi-Automatic Tests

ČAPEK, Tomáš

Základní údaje

Originální název

Semantic Network Integrity Maintenance via Heuristic Semi-Automatic Tests

Autoři

Vydání

první. Brno, Proceedings of the RASLAN Workshop 2009, od s. 63-67, 5 s. 2009

Nakladatel

Masaryk University

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/09:00029834

Organizační jednotka

Fakulta informatiky

ISBN

978-80-210-5048-8

Klíčová slova anglicky

semantic network;heuristic test;data integrity;corpus
Změněno: 7. 6. 2021 22:08, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

In this article we discuss issues connected with maintaining content integrity of general-purpose semantic network that is in development. Construction of a semantic network from scratch is a long process that usually requires both linguistic work done by hand and semi-automatic methods to add or translate the data which must be subsequently reviewed. In this process many systemic and/or language- specific errors may appear in the data over time. We will introduce a method to cope with this issue systematically.

Česky

V tomto článku se zabýváme problematikou údržby lingvistických dat v sémantických sítích, které jsou ve vývoji. Tvorba úplně nové sémantické sítě je pracný proces vyžadující jak ruční lingvistickou práci, tak i poloautomatické metody na přidávání nebo překládání dat, které je potřeba kontrolovat. Přitom obvykle vzniká značné množství systémových nebo jazykově specifických chyb. Představíme metodu, jak s takovými chybami systematicky nakládat.

Návaznosti

GA407/07/0679, projekt VaV
Název: Právní e-slovník - PES
Investor: Grantová agentura ČR, Právní e-slovník - PES
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce