RYGL, Jan. Enhancing Similarity-Based Authorship Verification using Corpus. 2017.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Enhancing Similarity-Based Authorship Verification using Corpus
Autoři RYGL, Jan.
Vydání 2017.
Další údaje
Originální jazyk angličtina
Typ výsledku Prezentace na konferencích
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Maďarsko
Utajení není předmětem státního či obchodního tajemství
Organizační jednotka Fakulta informatiky
Klíčová slova anglicky authorship attribution; machine learning; corpus ranking
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Jan Rygl, učo 208072. Změněno: 8. 4. 2017 10:53.
Anotace
Authorship verification problem can be defined as a task to determine whether two given texts were or were not written by an identical author. A similar task of the authorship attribution consists of choosing one author out of a predefined set of candidate authors as the most probable composer of a given document. The second task is usually transformed to a classification problem where the authors represent category names. In this respect the authorship verification corresponds to an open-class variant of authorship attribution. As the authorship attribution task (in the closed-class variant) can be solved with significantly higher accuracy, we suggest to transform the problem of authorship verification to be more similar to authorship attribution using two novel techniques: Ranking Distance and Corpus Ranking. The results indicate that the problem transformation and application of our optimizations increases the accuracy of authorship verification algorithms. All experiments were performed on Czech books, Slovak Internet news and English SMS messages, however proposed algorithms are document-type and language independent.
Návaznosti
LM2015071, projekt VaVNázev: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
VytisknoutZobrazeno: 3. 10. 2024 10:48