D 2012

Improving Automatic Ontology Developement

GRÁC, Marek a Adam RAMBOUSEK

Základní údaje

Originální název

Improving Automatic Ontology Developement

Název česky

Vylepšení automatické tvorby ontologií

Vydání

Brno, 6th Workshop on Recent Advances in Slavonic Natural Language Processing, od s. 105-110, 6 s. 2012

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/12:00062222

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-0313-8

Klíčová slova česky

sémantické sítě; ontologie; tvorba ontologií

Klíčová slova anglicky

semantic network; ontology; ontology development

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 8. 7. 2022 13:39, RNDr. Adam Rambousek, Ph.D.

Anotace

V originále

This article describes the approach to build a new semantic network, which contains not only positive semantic labeling, but also the negative information. In order to obtain high quality data for the following use in machine learning and machine translation, we have created method based on automatically pre-generated data from the large corpora, followed by manual annotation. In this way, the core of semantic network was produced, which can be expanded to improve corpora coverage.

Česky

Článek popisuje přístup k tvorbě nové sémantické sítě, která obsahuje nejen pozitivní sémantické značky, ale také negativní značení. Abychom získali kvalitní data pro následné použití při strojovém učení a strojovém překladu, vyvinuli jsme metody založené na automaticky předgenerovaných datech z velkého korpusu, následované ruční anotací. Tímto způsobem bylo vytvořeno jádro sémantické sítě, které lze rozšířit pro zlepšení pokrytí korpusu.

Návaznosti

LM2010013, projekt VaV
Název: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum