KASPRZAK, Jan a Michal BRANDEJS. Improving the Reliability of the Plagiarism Detection System. In Notebook Papers of CLEF 2010 LABs and Workshops. Padova: University of Padova. s. 1-10. ISBN 978-88-904810-0-0. 2010.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Improving the Reliability of the Plagiarism Detection System
Autoři KASPRZAK, Jan (203 Česká republika, garant, domácí) a Michal BRANDEJS (203 Česká republika, domácí).
Vydání Padova, Notebook Papers of CLEF 2010 LABs and Workshops, od s. 1-10, 10 s. 2010.
Nakladatel University of Padova
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Itálie
Utajení není předmětem státního či obchodního tajemství
Forma vydání elektronická verze "online"
WWW URL
Kód RIV RIV/00216224:14330/10:00045065
Organizační jednotka Fakulta informatiky
ISBN 978-88-904810-0-0
ISSN 2038-4963
Klíčová slova anglicky plagiarism; document similarity; external plagiarism; intrinsic plagiarism
Štítky best, IS, Plagiarism
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Jan Kasprzak, Ph.D., učo 1885. Změněno: 11. 5. 2015 22:27.
Anotace
In this paper we describe our approach at the PAN 2010 plagiarism detection competition. We refer to the system we have used in PAN'09. We then present the improvements we have tried since the PAN'09 competition, and their impact on the results on the development corpus. We describe our experiments with intrinsic plagiarism detection and evaluate them. We then discuss the computational cost of each step of our implementation, including the performance data from two different computers.
Anotace česky
V tomto článku popisujeme náš přístup v soutěži PAN 2010 v detekci plagiátorství. Odkazujeme na systém, který jsme použili během PAN'09. Dále předkládáme vylepšení, která jsme vyzkoušeli, a jejich vliv na vývojový korpus. Popisujeme naše experimenty v oblasti detekce vnitřního plagiátorství a vyhodnocujeme je. Dále diskutujeme výpočetní náročnost každého kroku naší implementace, včetně výkonnostních dat na dvou různých počítačích.
Návaznosti
LA09016, projekt VaVNázev: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Akronym: ERCIM)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Účast ČR v European Research Consortium for Informatics and Mathematics
VytisknoutZobrazeno: 28. 3. 2024 15:32