D 2008

Evaluating a German Sketch Grammar: A Case Study on Noun Phrase Case

IVANOVA, Kremena, Ulrich HEID, Sabine SCHULTE IM WALDE, Adam KILGARRIFF, Jan POMIKÁLEK et. al.

Základní údaje

Originální název

Evaluating a German Sketch Grammar: A Case Study on Noun Phrase Case

Název česky

Vyhodnocení "sketch grammar" pro Němčinu: Připadová studie jmenných frází

Autoři

IVANOVA, Kremena (276 Německo), Ulrich HEID (276 Německo), Sabine SCHULTE IM WALDE (276 Německo), Adam KILGARRIFF (826 Velká Británie a Severní Irsko) a Jan POMIKÁLEK (203 Česká republika, garant)

Vydání

Marrakech, Morocco, Proceedings of the Sixth International Language Resources and Evaluation (LREC'08), od s. ?, 7 s. 2008

Nakladatel

European Language Resources Association (ELRA)

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Maroko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/08:00024199

Organizační jednotka

Fakulta informatiky

ISBN

2-9517408-4-0

UT WoS

000324028902029

Klíčová slova anglicky

sketch grammar; German

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 3. 11. 2008 13:54, RNDr. Jan Pomikálek, Ph.D.

Anotace

V originále

Word sketches are part of the Sketch Engine corpus query system. They represent automatic, corpus-derived summaries of the words' grammatical and collocational behaviour. Besides the corpus itself, word sketches require a sketch grammar, a regular expression-based shallow grammar over the part-of-speech tags, to extract evidence for the properties of the targeted words from the corpus. The paper presents a sketch grammar for German, a language which is not strictly configurational and which shows a considerable amount of case syncretism, and evaluates its accuracy, which has not been done for other sketch grammars. The evaluation focuses on NP case as a crucial part of the German grammar. We present various versions of NP definitions, so demonstrating the influence of grammar detail on precision and recall.

Česky

Word sketches jsou součástí korpusového manažeru Sketch Engine. Reprezentují shrnutí gramatického a kolokačního chování slov, automaticky odvozené z korpusu. Pro vytvoření word sketches je kromě korpusu zapotřebí rovněž tzv. sketch grammar, mělká gramatika založená na regulárních výrazech nad morfologickými značkami. Tento článek představuje sketch grammar pro Němčinu, jazyk s poměrně volným slovosledem, který vykazuje značné známky sykretismu, a vyhodnocuje její úspěšnost, což dosud nebylo provedeno pro žádnou jinou sketch grammar. Vyhodnocení se zaměřuje na jmenné fráze jakožto zásadní část německé gramatiky. Představujeme různé verze definic jmenných frází a jejich vliv na přesnost a úplnost výsledků.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce