MATERNA, Jiří. LDA-Frames: An Unsupervised Approach to Generating Semantic Frames. In Alexander Gelbukh. Computational Linguistics and Intelligent Text Processing, 13th International Conference, CICLing 2012, Part I. Berlin: Springer-Verlag, 2012, s. 376-387. ISBN 978-3-642-28603-2. Dostupné z: https://dx.doi.org/10.1007/978-3-642-28604-9_31.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název LDA-Frames: An Unsupervised Approach to Generating Semantic Frames
Autoři MATERNA, Jiří (203 Česká republika, garant, domácí).
Vydání Berlin, Computational Linguistics and Intelligent Text Processing, 13th International Conference, CICLing 2012, Part I, od s. 376-387, 12 s. 2012.
Nakladatel Springer-Verlag
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Indie
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
Impakt faktor Impact factor: 0.402 v roce 2005
Kód RIV RIV/00216224:14330/12:00059516
Organizační jednotka Fakulta informatiky
ISBN 978-3-642-28603-2
ISSN 0302-9743
Doi http://dx.doi.org/10.1007/978-3-642-28604-9_31
Klíčová slova anglicky LDA-frames; semantic frame; Latent Dirichlet Allocation
Štítky best1
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 23. 4. 2013 07:26.
Anotace
In this paper we introduce a novel approach to identifying semantic frames from semantically unlabelled text corpora. There are many frame formalisms but most of them suffer from the problem that all frames must be created manually and the set of semantic roles must be predefined. The LDA-Frames approach, based on the Latent Dirichlet Allocation, avoids both these problems by employing statistics on a syntactically tagged corpus. The only information that must be given is a number of semantic frames and a number of semantic roles to be identified. The power of LDA-Frames is first shown on a small sample corpus and then on the British National Corpus.
Návaznosti
LC536, projekt VaVNázev: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
VytisknoutZobrazeno: 13. 9. 2024 17:07