D 2018

Wordnet Consistency Checking via Crowdsourcing

RAMBOUSEK, Adam a Aleš HORÁK

Základní údaje

Originální název

Wordnet Consistency Checking via Crowdsourcing

Název česky

Ověření konzistence wordnetu pomocí crowdsourcingu

Autoři

RAMBOUSEK, Adam (203 Česká republika, garant, domácí) a Aleš HORÁK (203 Česká republika, domácí)

Vydání

Ljubljana, Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts, od s. 1023-1029, 7 s. 2018

Nakladatel

Ljubljana University Press

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Slovinsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Odkazy

Kód RIV

RIV/00216224:14330/18:00101175

Organizační jednotka

Fakulta informatiky

ISBN

978-961-06-0097-8

ISSN

Klíčová slova česky

WordNet; semantic network; ontology; consistency checking

Klíčová slova anglicky

WordNet;sémantická síť;ontologie;kontrola konzistence

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 8. 7. 2022 13:33, RNDr. Adam Rambousek, Ph.D.

Anotace

V originále

Large ontologies and semantic networks represent complex multilevel structures, which are incredibly resist-ant to standard proof checking procedures. Automatic consistency checks can discover system errors such as missing intralingual links, but to find a missing word sense is a difficult task. Standard solutions rely on succes-sive consultations of multiple information sources in a multi-level review process. In this paper, we present a new approach of supplementing such multi-level reviews with engaging the dictionary users in WordNet error corrections and enhancement proposals via systematic crowdsourcing. This approach defines an early release phase with the full dataset published to the target audience followed by a continuous workflow consisting of structured adjustment suggestions obtained from the public users and of the complete editing process by expert reviewers. The review team members are handling prestructured review tasks organized in aggregated forms with correction proposals, the revision management and the appropriate editing of proposed changes. Both the users and reviewers have access to the complete revision history, which allows them to handle repeated proposals responsibly.

Česky

Velké ontologie a sémantické sítě představují komplexní víceúrovňové struktury, které nelze snadno ověřit běžnými metodami kontroly. Automatické kontroly konzistence mohou odhalit systémové chyby, např. chybějící odkazy, ale nalézt chybějící význam slova je obtížné. Běžná řešení spoléhají na postupné konzultace mnoha informačních zdrojů při postupném recenzním řízení. V článku je popsán nový přístup pro ověření a rozšiřování dat wordnetu pomocí zapojení uživatelů. Tento přístup zajišťuje brzké vydání plné datové sady pro použití cílovou skupinou s pozdějšími neustálými úpravami podle návrhů veřejných uživatelů a kontrolou těchto návrhů experty. Tým expertů má k dispozici návrhy oprav v přehledné agregované podobě, a také podporou revizí a editace.

Návaznosti

GA18-23891S, projekt VaV
Název: Hyperintensionální usuzování nad texty přirozeného jazyka
Investor: Grantová agentura ČR, Hyperintensionální usuzování nad texty přirozeného jazyka
LM2015071, projekt VaV
Název: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum