RYGL, Jan. Automatic Adaptation of Author's Stylometric Features to Document Types. In Petr Sojka; Aleš Horák; Ivan Kopeček; Karel Pala. Text, Speech, and Dialogue - 17th International Conference. 8655. vyd. Switzerland: Springer International Publishing, 2014, s. 53-61. ISBN 978-3-319-10815-5. Dostupné z: https://dx.doi.org/10.1007/978-3-319-10816-2_7.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Automatic Adaptation of Author's Stylometric Features to Document Types
Název česky Automatická adaptace stylometrických rysů autora podle typu dokumentů
Autoři RYGL, Jan (203 Česká republika, garant, domácí).
Vydání 8655. vyd. Switzerland, Text, Speech, and Dialogue - 17th International Conference, od s. 53-61, 9 s. 2014.
Nakladatel Springer International Publishing
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Švýcarsko
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL
Impakt faktor Impact factor: 0.402 v roce 2005
Kód RIV RIV/00216224:14330/14:00073237
Organizační jednotka Fakulta informatiky
ISBN 978-3-319-10815-5
ISSN 0302-9743
Doi http://dx.doi.org/10.1007/978-3-319-10816-2_7
Klíčová slova česky verifikace autorství; výběr atributů; strojové učení; stylom; stylometrické rysy
Klíčová slova anglicky authorship verification; feature selection; machine learning; stylome; stylometric features
Štítky firank_B
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 1. 4. 2015 10:35.
Anotace
Many Internet users face the problem of anonymous documents and texts with a counterfeit authorship. The number of questionable documents exceeds the capacity of human experts, therefore a universal automated authorship identification system supporting all types of documents is needed. In this paper, five predominant document types are analysed in the context of the authorship verification: books, blogs, discussions, comments and tweets. A method of an automatic selection of authors’ stylometric features using a double-layer machine learning is proposed and evaluated. Experiments are conducted on ten disjunct train and test sets and a method of an efficient training of large number of machine learning models is introduced (163,700 models were trained).
Návaznosti
VF20102014003, projekt VaVNázev: Analýza přirozeného jazyka v prostředí internetu (Akronym: APJI)
Investor: Ministerstvo vnitra ČR, Analýza přirozeného jazyka v prostředí internetu
VytisknoutZobrazeno: 24. 8. 2024 14:26