Institutional Repository of Scientific And Professional Articles Connected with the Plagiarism-Tracing System

Michal Brandejs, Jitka Brandejsová, Ľuboš Lunter, Daniel Jakubík, Martin Stančík

článek na konferenci UNINFOS 2010 (3. – 4. listopadu 2010)

Abstract: Professional branch information in the form of scientific articles, publications, monographies and other professional works of the academic staff is necessary to store within the university while having an access to it at the same time. Therefore, a demand for creating a n institutional repository (i.e. full texts) of scientific and professional works has been noticed at Masaryk University. For up to now, full texts have not been stored systematically, homogeneously and to an overall extent. What was registered consistently were only the metadata for these professional works. The discussions on the topic of plagiarism in professional publications have also contributed to creating our own fund of employees´works, and typically also of those of doctoral students. The contribution will present the assets of the MU institutional repository based on the current university plagiarism-tracing publication system. Most importantly, it will list the possibilities of quotation recording, the information about the „impact factor“ of the periodical the work has been published in, the usage of the Creative Commons licences within the frame of the Open access, the advantages of the carefully worked-out system of access rights and the plagiarism-tracing service. The problems with plagiarism-tracing have been dealt with by Masaryk University since 2006 when the users of the Information System of Masaryk University (IS MU) could start using the functions of tracing similarities (potential plagiarisms) not only in theses and e-learning materials but in all documents stored in the system. In 2008, the joint initiative of most public universities in the Czech Republic resulted in the development of the National Register of Theses and plagiarism-tracing system Theses.cz, which is nowadays used by 29 universities (2 from Slovakia). This was followed by the start of the system tracing plagiarisms in seminar papers Odevzdej.cz in 2009, used by 19 universities and even secondary schools. A large number of Czech universities are also interested in continuing the interuniversity control of plagiarisms in the field of scientific and professional publications.

Keywords: institutional repository, publications, plagiarism tracing, theses, IS MU

Od evidence záznamů o publikacích ke sběru plných textů

Uživatelé Informačního systému Masarykovy univerzity (IS MU), zejména publikující akademičtí pracovníci, evidují záznamy o své publikační činnosti v agendě Publikace. Ta slouží jednak jako sběrné místo informací o publikacích přenášených každoročně do centrální databáze RIV (Registr informací o výsledcích státem podporovaného výzkumu a vývoje) a dále umožňuje řadu užitečných funkcí pro udržování seznamu vlastních i cizích publikací, které se mohou např. zobrazovat v životopisu uživatele, slouží pro hromadné výběry a statistiky univerzity. V současnosti pracuje vývojový tým IS MU na implementaci institucionálního repozitáře MU, který rozšíří stávající systém evidence publikací a nabídne možnost ke každému bibliografickému záznamu ukládat, organizovat a spravovat libovolné množství nejen textového, ale také multimediálního obsahu.

Přínos institucionálního repozitáře

Řadu užitečných nástrojů pro zadávání, správu, vyhledávání a zveřejňování publikací nabídne aplikace Publikace v IS MU pro evidenci publikačních záznamů, rozšířená o Institucionální repozitář MU. Stane se vhodným nástrojem pro trvalé uskladnění publikovaných výsledků budoucím generacím jak pro univerzitu, tak pro veřejnost, a nabídne zpřístupnění veřejnosti často velice cenných děl vědeckých pracovníků a jejich studentů na základě dodržení práv autorů. Umožní také zvýšení citovanosti autorů, a tím i růst jejích profesního renomé.

Open Access a využití licencí Creative Commons

Masarykova univerzita se hlásí ke zveřejňování intelektuálních výsledků akademických a vědecko-výzkumných pracovníků v režimu otevřeného přístupu (Open Access), tedy volně a bezplatně komukoliv na Internetu. Důvody lze nalézt v článcích k tomu zaměřených. V současnosti je však zřejmé, že tito pracovníci převážně publikují ve vydavatelstvích, s nimiž uzavírají smluvní dohody o různých formách ne-/šíření svého díla. Týká se to zejména zahraničních vydavatelství, která se často řídí jinou legislativou v oblasti autorského práva než ČR. Proto budou mít autoři při zavádění plného textu díla v rámci moderního trendu "Open Access" možnost jednoduchým výběrem z roletkového menu využít bezplatných licencí typu Creative Commons (soubor veřejných licencí, které posilují pozici autora při rozhodování, za jakých podmínek bude dílo veřejně zpřístupněno). Autor jejich prostřednictvím plošně uzavírá se všemi potencionálními uživateli díla smlouvu, čímž jim poskytuje některá svá práva k dílu a jiná si vyhrazuje. Licence se vzájemně liší dle různě odstupňovaných převedených a vyhrazených práv autora k jeho dílu.

Typy Creative Commons licencí:

Uveďte autora
Uveďte autora – Zachovejte licenci
Uveďte autora – Nezasahujte do díla
Uveďte autora – Nevyužívejte komerčně
Uveďte autora – Nevyužívejte komerčně – Zachovejte licenci
Uveďte autora – Nevyužívejte komerčně – Nezasahujte do díla [1]
Díky licencím Creative Commons dává autor všem uživatelům díla jasné podmínky, za jakých můžou dílo použít. Zvyšuje se tak autorskoprávní ochrana samotného autora i univerzity.

Důmyslný systém přístupových práv

Aby mohly být do systému zavedeny také díla podléhající omezenému režimu zveřejňování (např. z důvodu licenční smlouvy s vydavatelem), bude institucionální repozitář disponovat do nejmenších detailů promyšlenými přístupovými právy, pomocí nichž bude možné přístup omezit pouze pro vybrané osoby. Přístupová práva je možné, stejně jako v dalších aplikacích IS MU, omezit od výčtu konkrétních osob po skupiny studentů daných fakult, oborů, předmětů, seminárních skupin, a stejně tak na skupiny zaměstnanců vybraných fakult, kateder nebo pracovišť. Navíc lze samotné zveřejnění díla v systému automaticky odložit časově do doby, kdy vyprší platnost omezeného přístupu (např. vyprší podmínka nezveřejnění v licenční smlouvě s vydavatelem).

Vyhledávání plagiátů

Podobně jako u závěrečných prací, které Masarykova univerzita začala jako první v ČR zveřejňovat plošně na internetu už v roku 2006 (zveřejněny na internetu jsou i práce před rokem 2006, pokud autor sám povolil/nastavil zveřejnění světu, zejména od roku 2004 toho využilo mnoho dnes již absolventů), nese zveřejňování odborných článků akademických pracovníků univerzity riziko zneužití díla. Institucionální repozitář MU proto nabídne uživatelům na univerzitě nástroj na odhalování plagiátů, populární pod názvem „vejce vejci“ (resp. „podobný jako vejce vejci“), který odhalí podobnosti v textových dokumentech (potenciální plagiáty). Propojením institucionálního repozitáře se systémem na odhalování plagiátů v závěrečných pracích Theses (http://theses.cz/) a systémem na odhalování plagiátů v seminárních pracích Odevzdej (http://odevzdej.cz/), se pravděpodobnost odhalení neetického chování ještě zvýší. V současnosti se podobnosti porovnávají napříč databázemi o 2,2 mil. dokumentech (z toho je více než 140 000 závěrečných prací z různých univerzit) a počet dokumentů v databázích díky desítkám zapojených škol výrazně roste. Vývojový tým IS MU plánuje již koncem roku 2010 spustit do testovacího provozu vyhledávání podobností s dokumenty na internetu.

Vyhledávání a štítkování publikací

Vedle fulltextového vyhledávání nabídne institucionální repozitář MU i tzv. pokročilé vyhledávání s možností upřesnit vyhledávané položky (např. autory, klíčová slova, nakladatelství, rok, další příznaky) pro rychlejší a efektivnější nalezení hledané publikace. Navíc lze publikačním záznamům v IS MU přiřadit štítky, které mohou uživatelé využít ke snazšímu třídění a vyhledávání publikací nebo k vytváření seznamů publikací pro různé, např. studijní účely (učitelé tak mohou vytvořit seznam doporučené literatury pro jednotlivé předměty a odkaz na jednotlivé seznamy mohou vkládat do sylabů nebo studijních materiálů). Štítek může být veřejný (vidí všichni uživatelé) nebo soukromý (vidí pouze zadavatel). Štítkování usnadní vyhledávání podobně jako klíčová slova - lze se tak dopracovat k publikacím s určitou tématikou či určitého oboru. [2]

Nástroje ulehčující vkládání nových publikačních záznamů

Vkládání kompletních záznamů o publikacích bývá někdy časově náročné, protože pro kompletní evidenci záznamu je potřebné evidovat velké množství položek. Uživatelé si mohou tuto práci výrazně ulehčit například vyhledáním záznamů v publikační bázi Národní knihovny České republiky a vybrané publikace z něj do IS MU importovat. V případě, že se publikace v této databázi nenachází, mohou využít nástroj „Poloautomatické načítání z citačních záznamů“, který významně zjednoduší vložení informací k publikacím načítáním ze získaného bibliografického záznamu (například z Google Scholar, CiteSeer, CiteULike atd.). V tomto bibliografickém záznamu označí postupně položky (Autoři, Název výsledku, Název časopisu, ...) a myší označí text z vloženého záznamu, který vybrané položce odpovídá. Tyto nástroje značně usnadňují uživatelům vkládání nových záznamů do IS MU. U většiny vkládaných záznamů díky ním odpadá nutnost zdlouhavě vyplňovat formulář nové publikace. Takto zavedenou publikaci lze v IS MU následně zkontrolovat a v případě potřeby dále editovat.

Služby

Jako přidanou hodnotu poskytne repozitář další služby, které zefektivní a ulehčí práci s evidencí publikací. Autorům nabídne možnost evidovat citovanost jejich děl, uchovávat informaci o „impact faktoru“ periodika, ve kterém bylo dílo vydáno, nebo možnost přiřazení publikace k libovolnému kódu projektu evidovaného v univerzitním systému pro správu projektů ISEP. Zajímavou zpětnou vazbou pro autory (resp. vkladatele publikace či publikačního záznamu) pak může být možnost hodnocení kvality vyplnění záznamu o publikaci, kdy je možno ke každému záznamu vložit kladné nebo záporné hodnocení.

Závěr

Zavedením institucionálního repozitáře MU získá univerzita jedinečný nástroj pro budování vlastního fondu vědeckých prací a záznamů o nich. Samotnému plošnému zveřejňování vědeckých prací akademických pracovníků univerzity však předchází vyjasnění některých autorskoprávních otázek, což se týká konkrétních jednotlivých publikovaných děl. I tyto otázky jsou předmětem podaného centralizovaného rozvojového projektu MU spolu se 14 veřejnými vysokými školami, které plánují v rámci projektu v roce 2011 kooperovat na centralizovaném řešení repozitáře vědeckých prací Repozitář (http://repozitar.cz/) s možností meziuniverzitní kontroly plagiátů. Centralizovaný systém Repozitář nabídne zapojeným školám kromě nástrojů pro správu a evidenci publikací, široké možnosti zveřejňování záznamů i plných textů, funkce odhalování plagiátů i další služby včetně výkaznictví (RIV).

Abstrakt

Odborné oborové informace v podobě vědeckých článků, publikací, monografií a dalších odborných děl akademických pracovníků je potřeba v rámci univerzity uchovat a současně mít také možnost z tohoto fondu čerpat. Na Masarykově univerzitě byla proto zaznamenána poptávka po vybudování institucionálního repozitáře (tj. plných textů) vědeckých a odborných prací. Dosud totiž nebyly plné texty systematicky, jednotně a v plošné míře uchovávány, evidována byla důsledně zatím jen metadata k těmto odborným pracím. K budování vlastního fondu zaměstnaneckých děl, typicky také děl doktorských studentů, přispěly i diskuse na téma plagiátorství v odborných publikacích. Příspěvek představí přínosy institucionálního repozitáře MU založeném na stávajícím publikačním systému univerzity s vyhledáváním plagiátů. Především uvede možnosti zaznamenávání citací, informace o „impact factoru“ periodika, ve kterém bylo dílo vydáno, použití licencí Creative Commons v rámci přístupu Open access, výhody propracovaného systému přístupových práv a službu pro odhalování plagiátů. Problematiku odhalování plagiátů řeší Masarykova univerzita od roku 2006, kdy uživatele Informačního systému Masarykovy univerzity (IS MU) mohli začít využívat funkce odhalování podobností (potenciálních plagiátů), a to nejen v závěrečných pracích a e-learningových materiálech, ale ve všech dokumentech uložených v systému. V roce 2008 vznikl společnou iniciativou většiny veřejných vysokých škol v ČR projekt Národní registr VŠKP a systém na odhalování plagiátů Theses.cz, který dnes využívá 29 vysokých škol (z toho 2 ze Slovenska). Následně byl v roce 2009 spuštěn systém na odhalování plagiátů v seminárních pracích Odevzdej.cz, který využívá 19 vysokých škol a zapojují se i gymnázia. Zájmem velkého počtu vysokých škol v ČR je také pokračovat v meziuniverzitní kontrole plagiátů právě v oblasti vědeckých a odborných publikací.

Klíčová slova

odhalování plagiátů, publikace, institucionální repozitář, IS MU

Literatura

[1] Creative Commons Česká republika [online]. 2010. Dostupný z www: http://www.creativecommons.cz [cit. 2010-10-15]

[2] Možnosti využití štítků v publikacích [online]. 2010. Dostupný z www: http://is.muni.cz/info/nov_20100222_publikace_stitky.pl [cit. 2010-10-15]

[3] Správa publikací v novém kabátě [online]. 2010. Dostupný z www: http://is.muni.cz/info/nov_20091018_publikace.pl [cit. 2010-10-15]