KASPRZAK, Jan, Michal BRANDEJS a Jitka BRANDEJSOVÁ. Distributed Aspects of the System for Discovering Similar Documents. In Proceedings of the Third International Conference on Internet Technologies and Applications. Wrexham, UK: Glyndwr University, 2009, s. 557-564. ISBN 978-0-946881-65-9.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Distributed Aspects of the System for Discovering Similar Documents
Název česky Distribuované aspekty systému na objevování podobných dokumentů
Autoři KASPRZAK, Jan (203 Česká republika, garant), Michal BRANDEJS (203 Česká republika) a Jitka BRANDEJSOVÁ (203 Česká republika).
Vydání Wrexham, UK, Proceedings of the Third International Conference on Internet Technologies and Applications, od s. 557-564, 8 s. 2009.
Nakladatel Glyndwr University
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Velká Británie a Severní Irsko
Utajení není předmětem státního či obchodního tajemství
WWW URL
Kód RIV RIV/00216224:14330/09:00036620
Organizační jednotka Fakulta informatiky
ISBN 978-0-946881-65-9
Klíčová slova česky Theses Archív Plagiátorství Podobné dokumenty Distribuované výpočty
Klíčová slova anglicky Theses Archive Plagiarism Similar documents Distributed computing
Štítky IS, Plagiarism
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Jan Kasprzak, Ph.D., učo 1885. Změněno: 26. 3. 2010 11:47.
Anotace
With wide deployment of e-learning methods such as computer-mediated communication between the students and teachers, including papers and essays submission and evaluation, it has become much easier for students to base those works on electronic resources, including the plagiarization of the work of other people. In this paper we will briefly present a system for discovering similarities in a large base of documents, which has been in production use inside the Czech National Archive of Graduate Theses since January 2008. We will then focus on the distributed aspects of such a system, especially on the task of creating and maintaining the index for discovering the similarities on a cluster of commodity computers.
Anotace česky
S rozšířením e-learningových metod jako je počítačem zprostředkovaná komunikace mezi studentem a vyučujícím, včetně odevzdávání esejí a článků, a včetně hodnocení výsledků, se stalo mnohem jednodušším pro studenty svoji práci založit na elektronických zdrojích, včetně plagiátorství cizí práce. V tomto článku stručně představujeme systém pro objevování podobných dokumentů ve velké databázi dokumentů, který je v produkčním nasazení v rámci Českého národního archívu závěrečných prací (theses.cz) od ledna 2008. Poté se zaměříme na distribuované aspekty takového systému, zejména na úkol vytváření a údržby indexu pro objevování podobností na clusteru běžných počítačů.
Návaznosti
LA09016, projekt VaVNázev: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Akronym: ERCIM)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Účast ČR v European Research Consortium for Informatics and Mathematics
VytisknoutZobrazeno: 27. 4. 2024 05:18