D 2008

Evaluating a German Sketch Grammar: A Case Study on Noun Phrase Case

IVANOVA, Kremena, Ulrich HEID, Sabine SCHULTE IM WALDE, Adam KILGARRIFF, Jan POMIKÁLEK et. al.

Basic information

Original name

Evaluating a German Sketch Grammar: A Case Study on Noun Phrase Case

Name in Czech

Vyhodnocení "sketch grammar" pro Němčinu: Připadová studie jmenných frází

Authors

IVANOVA, Kremena (276 Germany), Ulrich HEID (276 Germany), Sabine SCHULTE IM WALDE (276 Germany), Adam KILGARRIFF (826 United Kingdom of Great Britain and Northern Ireland) and Jan POMIKÁLEK (203 Czech Republic, guarantor)

Edition

Marrakech, Morocco, Proceedings of the Sixth International Language Resources and Evaluation (LREC'08), p. ?, 7 pp. 2008

Publisher

European Language Resources Association (ELRA)

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Morocco

Confidentiality degree

není předmětem státního či obchodního tajemství

References:

RIV identification code

RIV/00216224:14330/08:00024199

Organization unit

Faculty of Informatics

ISBN

2-9517408-4-0

UT WoS

000324028902029

Keywords in English

sketch grammar; German

Tags

International impact, Reviewed
Změněno: 3/11/2008 13:54, RNDr. Jan Pomikálek, Ph.D.

Abstract

V originále

Word sketches are part of the Sketch Engine corpus query system. They represent automatic, corpus-derived summaries of the words' grammatical and collocational behaviour. Besides the corpus itself, word sketches require a sketch grammar, a regular expression-based shallow grammar over the part-of-speech tags, to extract evidence for the properties of the targeted words from the corpus. The paper presents a sketch grammar for German, a language which is not strictly configurational and which shows a considerable amount of case syncretism, and evaluates its accuracy, which has not been done for other sketch grammars. The evaluation focuses on NP case as a crucial part of the German grammar. We present various versions of NP definitions, so demonstrating the influence of grammar detail on precision and recall.

In Czech

Word sketches jsou součástí korpusového manažeru Sketch Engine. Reprezentují shrnutí gramatického a kolokačního chování slov, automaticky odvozené z korpusu. Pro vytvoření word sketches je kromě korpusu zapotřebí rovněž tzv. sketch grammar, mělká gramatika založená na regulárních výrazech nad morfologickými značkami. Tento článek představuje sketch grammar pro Němčinu, jazyk s poměrně volným slovosledem, který vykazuje značné známky sykretismu, a vyhodnocuje její úspěšnost, což dosud nebylo provedeno pro žádnou jinou sketch grammar. Vyhodnocení se zaměřuje na jmenné fráze jakožto zásadní část německé gramatiky. Představujeme různé verze definic jmenných frází a jejich vliv na přesnost a úplnost výsledků.

Links

LC536, research and development project
Name: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
1ET100300419, research and development project
Name: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Academy of Sciences of the Czech Republic, Intelligent Models, Algorithms, Methods and Tools for the Semantic Web (realization)
2C06009, research and development project
Name: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR