Další formáty:
BibTeX
LaTeX
RIS
@misc{985958, author = {Rygl, Jan}, address = {Brno}, keywords = {anonymous document; author's writeprint; authorship attribution; clustering; machine learning}, language = {cze}, location = {Brno}, publisher = {Fakulta informatiky Masarykovy univerzity}, title = {Určování autorství anonymních textů na základě automaticky nalezených charakteristických znaků}, url = {https://is.muni.cz/th/208072/fi_m/}, year = {2011} }
TY - GEN ID - 985958 AU - Rygl, Jan PY - 2011 TI - Určování autorství anonymních textů na základě automaticky nalezených charakteristických znaků PB - Fakulta informatiky Masarykovy univerzity CY - Brno KW - anonymous document KW - author's writeprint KW - authorship attribution KW - clustering KW - machine learning UR - https://is.muni.cz/th/208072/fi_m/ N2 - Magisterská diplomová práce. V práci vycházíme z řady osvědčených postupů pro určování autorství anonymních dokumentů a vytváříme nové. Již existující a používané techniky kombinujeme, optimalizujeme a inovujeme pro tři hlavní úlohy: Automatické přiřazení autora podle dané množiny autorských dokumentů, Verifikace autorství daného dokumentu vybraným autorem, Shlukování dokumentů podle autorství. Námi implementované algoritmy jsou testovány na češtině, systém je však navržen modulárně a pokud vypustíme či nahradíme několik jazykově závislých komponent, lze v tuto chvíli pracovat s dokumenty napsanými v libovolném jazyce. Vše je naprogramováno ve skriptovacím jazyce Python. Součástí systému jsou i nástroje pro předzpracování vstupních dat pro češtinu a jejich správu v databázi PostgreSQL. Dalším přínosem práce kromě vývoje systému pro řešení tří zmíněných úloh jsou empiricky podložená pozorování, jak se chovají nejpoužívanější algoritmy na určování autorství dokumentů na dokumentech v češtině. Dosud se většina měření prováděla na anglicky psaných textech (knihy, novinové články, zřídka e-maily) a chyběla možnost srovnání při vývoji aplikací pro češtinu a jí podobné jazyky. ER -
RYGL, Jan. \textit{Určování autorství anonymních textů na základě automaticky nalezených charakteristických znaků}. Brno: Fakulta informatiky Masarykovy univerzity, 2011, 67 s.
|