KASPRZAK, Jan, Michal BRANDEJS and Miroslav KŘIPAČ. Finding Plagiarism by Evaluating Document Similarities. In Proceedings of the SEPLN'09 Workshop on Uncovering Plagiarism, Authorship and Social Software Misuse. Vol. 502. San Sebastian, Španělsko: CEUR Workshop Proceedings. p. 24-28. ISSN 1613-0073. 2009.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Finding Plagiarism by Evaluating Document Similarities
Name in Czech Hledání plagiátů pomocí vyhodnocení podobností dokumentů
Authors KASPRZAK, Jan (203 Czech Republic, guarantor), Michal BRANDEJS (203 Czech Republic) and Miroslav KŘIPAČ (203 Czech Republic).
Edition Vol. 502. San Sebastian, Španělsko, Proceedings of the SEPLN'09 Workshop on Uncovering Plagiarism, Authorship and Social Software Misuse, p. 24-28, 5 pp. 2009.
Publisher CEUR Workshop Proceedings
Other information
Original language English
Type of outcome Proceedings paper
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher Spain
Confidentiality degree is not subject to a state or trade secret
WWW Stránky soutěže a workshopu Sborník v PDF
RIV identification code RIV/00216224:14330/09:00036624
Organization unit Faculty of Informatics
ISSN 1613-0073
Keywords (in Czech) Plagiátorství Podobné dokumenty Překryv dokumentů Distribuované výpočty Paralelismus
Keywords in English Plagiarism Similar Documents Document Overlap Distributed Computing Parallelism
Tags best, IS, Plagiarism
Tags International impact, Reviewed
Changed by Changed by: RNDr. Jan Kasprzak, Ph.D., učo 1885. Changed: 26/3/2010 11:52.
Abstract
In this paper we discuss the approach we have used for finding plagiarized passages of text during the PAN'09 plagiarism detection competition. We describe the existing anti-plagiarism system we use in the Czech National Archive of Graduate Theses. We then discuss the modifications to this system which have been necessary in order to fit the results to the competition rules. We also present a performance data of the described system, and the possible improvement for our production systems, which result from the code written for the PAN'09 competition.
Abstract (in Czech)
V tomto článku diskutujeme postup, který jsme použili pro nalezení opsaných pasáží textu během soutěže PAN'09 v detekci plagiátů. Popisujeme existující software pro odhalování plagiátů, použitý v Českém národním archívu závěrečných prací (theses.cz). Dále diskutujeme úpravy tohoto systému, které byly nezbytné pro výpočet výsledků podle pravidel soutěže. Diskutujeme také výkon popsaného systému a možná rozšíření našich produkčních systému, která vyplynula z kódu napsaného pro soutěž PAN'09.
Links
LA09016, research and development projectName: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Acronym: ERCIM)
Investor: Ministry of Education, Youth and Sports of the CR, Czech Republic membership in the European Research Consortium for Informatics and Mathematics
PrintDisplayed: 28/3/2024 09:30