RAMBOUSEK, Adam, Karel PALA a Aleš HORÁK. Sustainable long-term WordNet development and maintenance: Case study of the Czech WordNet. Cognitive Studies | Études cognitives. Warsaw: University of Silesia in Katowice & The Slavic Foundation, 2018, roč. 2018, č. 18, s. 1-10. ISSN 2080-7147. Dostupné z: https://dx.doi.org/10.11649/cs.1715.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Sustainable long-term WordNet development and maintenance: Case study of the Czech WordNet
Název česky Dlouhodobě udržitelný vývoj a údržba WordNetu: případová studie češtiny
Autoři RAMBOUSEK, Adam (203 Česká republika, garant, domácí), Karel PALA (203 Česká republika, domácí) a Aleš HORÁK (203 Česká republika, domácí).
Vydání Cognitive Studies | Études cognitives, Warsaw, University of Silesia in Katowice & The Slavic Foundation, 2018, 2080-7147.
Další údaje
Originální jazyk angličtina
Typ výsledku Článek v odborném periodiku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Polsko
Utajení není předmětem státního či obchodního tajemství
WWW URL Open Access Journal
Kód RIV RIV/00216224:14330/18:00101639
Organizační jednotka Fakulta informatiky
Doi http://dx.doi.org/10.11649/cs.1715
UT WoS 000457906200001
Klíčová slova česky EuroWordNet; BalkaNet; wordnet; Czech WordNet; DEBVisDic
Klíčová slova anglicky EuroWordNet; BalkaNet; wordnet; Czech WordNet; DEBVisDic
Štítky DEB, DEB development platform, DEB platform, DEBVisDic, WordNet, wordnet browser
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Adam Rambousek, Ph.D., učo 60380. Změněno: 8. 7. 2022 13:33.
Anotace
Czech WordNet represents one of the first national wordnets created during the EuroWordNet and BalkaNet projects. However, the data contains various issues that affect the use of Czech WordNet in NLP applications. Since the publication of the first CzWN version, the semantic network was augmented in several phases, however, complex final editing and publishing process has not been finished. In 2017, we have started a project to evaluate and update the Czech WordNet, followed by a connection to the Collaborative Interlingual Index. In this paper, we provide an overview of Czech WordNet data updates and extensions, and present the roadmap to publish a revised version of the Czech WordNet under open license. Moreover, we introduce a developed concept for long-term updates and maintenance of the data based on crowdsourcing activities.
Anotace česky
Český Wordnet představuje jeden z prvních národních wordnetů, které byly vytvořeny během projektů EuroWordNet a BalkaNet. Bohužel data obsahují různé problémy, které mohou ovlivnit využití českého WordNetu v NLP aplikacích. Od zveřejněné první verze CzWN byly sémantická síť v několika fázích rozšířena, ale komplexní finální úpravy a proces zveřejněný zatím nejsou dokončené. V roce 2017 jsme spustili projekt k vyhodnocení a aktualizaci českého WordNetu a také propojení s Collaborative Interlingual Index. V tomto článku poskytujeme přehled verzí a rozšíření českého Wordnetu a také plán pro publikaci aktualizované verze s otevřenou licencí. Dále představujeme koncept dlouhodobých aktualizací a údržby dat založený na crowdsourcingu.
Návaznosti
GA18-23891S, projekt VaVNázev: Hyperintensionální usuzování nad texty přirozeného jazyka
Investor: Grantová agentura ČR, Hyperintensionální usuzování nad texty přirozeného jazyka
LM2015071, projekt VaVNázev: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
MUNI/A/0854/2017, interní kód MUNázev: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VII.
Investor: Masarykova univerzita, Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VII., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
VytisknoutZobrazeno: 26. 4. 2024 08:37