2010
Improving the Reliability of the Plagiarism Detection System
KASPRZAK, Jan a Michal BRANDEJSZákladní údaje
Originální název
Improving the Reliability of the Plagiarism Detection System
Autoři
KASPRZAK, Jan (203 Česká republika, garant, domácí) a Michal BRANDEJS (203 Česká republika, domácí)
Vydání
Padova, Notebook Papers of CLEF 2010 LABs and Workshops, od s. 1-10, 10 s. 2010
Nakladatel
University of Padova
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Itálie
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
elektronická verze "online"
Odkazy
Kód RIV
RIV/00216224:14330/10:00045065
Organizační jednotka
Fakulta informatiky
ISBN
978-88-904810-0-0
ISSN
Klíčová slova anglicky
plagiarism; document similarity; external plagiarism; intrinsic plagiarism
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 11. 5. 2015 22:27, RNDr. Jan Kasprzak, Ph.D.
V originále
In this paper we describe our approach at the PAN 2010 plagiarism detection competition. We refer to the system we have used in PAN'09. We then present the improvements we have tried since the PAN'09 competition, and their impact on the results on the development corpus. We describe our experiments with intrinsic plagiarism detection and evaluate them. We then discuss the computational cost of each step of our implementation, including the performance data from two different computers.
Česky
V tomto článku popisujeme náš přístup v soutěži PAN 2010 v detekci plagiátorství. Odkazujeme na systém, který jsme použili během PAN'09. Dále předkládáme vylepšení, která jsme vyzkoušeli, a jejich vliv na vývojový korpus. Popisujeme naše experimenty v oblasti detekce vnitřního plagiátorství a vyhodnocujeme je. Dále diskutujeme výpočetní náročnost každého kroku naší implementace, včetně výkonnostních dat na dvou různých počítačích.
Návaznosti
LA09016, projekt VaV |
|