D 2018

Wordnet Consistency Checking via Crowdsourcing

RAMBOUSEK, Adam and Aleš HORÁK

Basic information

Original name

Wordnet Consistency Checking via Crowdsourcing

Name in Czech

Ověření konzistence wordnetu pomocí crowdsourcingu

Authors

RAMBOUSEK, Adam (203 Czech Republic, guarantor, belonging to the institution) and Aleš HORÁK (203 Czech Republic, belonging to the institution)

Edition

Ljubljana, Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts, p. 1023-1029, 7 pp. 2018

Publisher

Ljubljana University Press

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Slovenia

Confidentiality degree

není předmětem státního či obchodního tajemství

Publication form

electronic version available online

References:

RIV identification code

RIV/00216224:14330/18:00101175

Organization unit

Faculty of Informatics

ISBN

978-961-06-0097-8

ISSN

Keywords (in Czech)

WordNet; semantic network; ontology; consistency checking

Keywords in English

WordNet;sémantická síť;ontologie;kontrola konzistence

Tags

International impact, Reviewed
Změněno: 8/7/2022 13:33, RNDr. Adam Rambousek, Ph.D.

Abstract

V originále

Large ontologies and semantic networks represent complex multilevel structures, which are incredibly resist-ant to standard proof checking procedures. Automatic consistency checks can discover system errors such as missing intralingual links, but to find a missing word sense is a difficult task. Standard solutions rely on succes-sive consultations of multiple information sources in a multi-level review process. In this paper, we present a new approach of supplementing such multi-level reviews with engaging the dictionary users in WordNet error corrections and enhancement proposals via systematic crowdsourcing. This approach defines an early release phase with the full dataset published to the target audience followed by a continuous workflow consisting of structured adjustment suggestions obtained from the public users and of the complete editing process by expert reviewers. The review team members are handling prestructured review tasks organized in aggregated forms with correction proposals, the revision management and the appropriate editing of proposed changes. Both the users and reviewers have access to the complete revision history, which allows them to handle repeated proposals responsibly.

In Czech

Velké ontologie a sémantické sítě představují komplexní víceúrovňové struktury, které nelze snadno ověřit běžnými metodami kontroly. Automatické kontroly konzistence mohou odhalit systémové chyby, např. chybějící odkazy, ale nalézt chybějící význam slova je obtížné. Běžná řešení spoléhají na postupné konzultace mnoha informačních zdrojů při postupném recenzním řízení. V článku je popsán nový přístup pro ověření a rozšiřování dat wordnetu pomocí zapojení uživatelů. Tento přístup zajišťuje brzké vydání plné datové sady pro použití cílovou skupinou s pozdějšími neustálými úpravami podle návrhů veřejných uživatelů a kontrolou těchto návrhů experty. Tým expertů má k dispozici návrhy oprav v přehledné agregované podobě, a také podporou revizí a editace.

Links

GA18-23891S, research and development project
Name: Hyperintensionální usuzování nad texty přirozeného jazyka
Investor: Czech Science Foundation
LM2015071, research and development project
Name: Jazyková výzkumná infrastruktura v České republice (Acronym: LINDAT-Clarin)
Investor: Ministry of Education, Youth and Sports of the CR