Systém na odhalování plagiátů Masarykovy univerzity již může využívat 17 škol

Tisková zpráva

16. května 2008

Vývojový tým z Masarykovy univerzity spustil systém na odhalování plagiátů pro 17 vysokých škol, které se zapojily do celostátního projektu. Univerzity tak mají ode dneška k dispozici zcela nový systém, jehož prostřednictvím mohou zjišťovat, zda u jejich závěrečných prací nedochází k opisování. Tímto novým technologicky úspěšným nástrojem, který poskytuje účinné prostředky pro odhalení podobných dokumentů se Česká republika zařadila na přední místo ve světě.

Srovnatelný systém, který by vytvářel národní fond závěrečných prací a zajišťoval současně službu pro odhalování plagiátů, zatím nikde jinde neexistuje. Celý systém byl zprovozněn na adrese http://theses.cz/ na serveru Vysokoškolské kvalifikační práce.

Systém pro hledání podobných dokumentů, tvoří hlavní část projektu s názvem Národní registr vysokoškolských kvalifikačních prací a systém na odhalování plagiátů. Na jeho realizaci získaly vysoké školy částku necelých 10 milionů korun z rozvojových projektů ministerstva školství. Technické řešení vytvořila Masarykova univerzita, která systém zavedla v ČR jako první v roce 2006. Spolupracující vysoké školy připravují podmínky pro vkládání prací do systému.

Projekt se dělí na dvě hlavní části. Národní registr zajišťuje evidenci popisných údajů k závěrečným pracím (tzv. metadat), tj. údajů typu název práce, autor, předmětový popis, abstrakt, vedoucí, oponent, studijní program a obor, škola. Tato část slouží zejména veřejnosti a díky ní je možné zpřístupňovat informace o zajímavých pracích z různých oborů. Například, kdo práci zpracoval, na které škole nebo fakultě byl vytvořena, případně, kde nalezne celý text práce apod.

Druhá část, systém na odhalování plagiátů, řeší problém společensky velmi závažného charakteru, který univerzity skutečně trápí. Vyhledávání podobných dokumentů je prvním důležitým krokem v procesu správného posouzení, zda se jedná o plagiát. Má pomoci pedagogům odhalit podezřelé dokumenty, aby následně mohli zaujmout stanovisko, zda práce je nebo není plagiátem.

Univerzity mohou vyhledávat podobné dokumenty nejen mezi závěrečnými pracemi zapojených vysokých škol, ale i mezi dalšími dokumenty, například mezi vybranými zdroji z Internetu (pozn.: všechny systémy pracují vždy na principu stažení těchto dokumentů k sobě) nebo seminárními pracemi a publikacemi, které jsou součástí dalších projektů. V tomto roce se odhaduje, že systém bude obsahovat přes sto tisíc závěrečných prací a vyhledávat podobnosti mezi miliónem dokumentů.

"V těchto dnech jsme také zprovoznili zcela novou generaci algoritmů na vyhledávání podobností. Díky tomu má systém schopnost pojmout velké množství dat v rozsahu desítek až stovek milionů dokumentů a umí vyhledat podobné dokumenty během velmi krátké doby bez ohledu na použitý jazyk textu," řekl o přednostech systému hlavní řešitel projektu Michal Brandejs z Masarykovy univerzity. "Jsme přesvědčeni, že budeme schopni přinášet našim kolegům z univerzit nebo uživatelům další inovativní myšlenky, které systém obohatí a budou ho dál rozvíjet," dodal Brandejs.