D 2010

Improving the Reliability of the Plagiarism Detection System

KASPRZAK, Jan a Michal BRANDEJS

Základní údaje

Originální název

Improving the Reliability of the Plagiarism Detection System

Autoři

KASPRZAK, Jan (203 Česká republika, garant, domácí) a Michal BRANDEJS (203 Česká republika, domácí)

Vydání

Padova, Notebook Papers of CLEF 2010 LABs and Workshops, od s. 1-10, 10 s. 2010

Nakladatel

University of Padova

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Itálie

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Odkazy

Kód RIV

RIV/00216224:14330/10:00045065

Organizační jednotka

Fakulta informatiky

ISBN

978-88-904810-0-0

ISSN

Klíčová slova anglicky

plagiarism; document similarity; external plagiarism; intrinsic plagiarism

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 11. 5. 2015 22:27, RNDr. Jan Kasprzak, Ph.D.

Anotace

V originále

In this paper we describe our approach at the PAN 2010 plagiarism detection competition. We refer to the system we have used in PAN'09. We then present the improvements we have tried since the PAN'09 competition, and their impact on the results on the development corpus. We describe our experiments with intrinsic plagiarism detection and evaluate them. We then discuss the computational cost of each step of our implementation, including the performance data from two different computers.

Česky

V tomto článku popisujeme náš přístup v soutěži PAN 2010 v detekci plagiátorství. Odkazujeme na systém, který jsme použili během PAN'09. Dále předkládáme vylepšení, která jsme vyzkoušeli, a jejich vliv na vývojový korpus. Popisujeme naše experimenty v oblasti detekce vnitřního plagiátorství a vyhodnocujeme je. Dále diskutujeme výpočetní náročnost každého kroku naší implementace, včetně výkonnostních dat na dvou různých počítačích.

Návaznosti

LA09016, projekt VaV
Název: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Akronym: ERCIM)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Účast ČR v European Research Consortium for Informatics and Mathematics