Hledání podobných souborů ve Správci souborů


  1. Jak rámcově funguje hledání podobných souborů?
    plagiáty

    Obsah souborů v datovém úložišti ISu (tj. objektů dostupných ve Správci souborů), u kterých je k dispozici čistě textová verze, je průběžně strojově analyzován. Pomocí odkazů

    Osobní administrativa → Správce souborů → Operace → Podobné dokumenty (ikona dvou vajíček "podobných jako vejce vejci")

    můžete IS (příp. další zdroje) prohledat a zobrazit si soubory, které mají podobný obsah. IS zobrazí ty nalezené podobné soubory, které máte oprávnění číst. U nalezených podobných souborů IS vypíše míru shody v procentech. K prověření můžete vybrat jeden soubor, více souborů nebo celou složku, či celý strom složek (označte zaškrtávátkem vlevo od názvu; více souvislých řádků lze zaškrtnout obvyklým postupem: klik, shift-klik).

    Spočítání podobných dokumentů trvá jistou dobu. Zpravidla do jedné hodiny od zavedení nového dokumentu do ISu je tento analyzován a připraven pro uživatelské hledání.

    Soubory se vyhledávají v celém ISu. Tedy bez ohledu na předměty, semestry, fakulty a agendy (Studijní materiály, Poskytovny, Dokumentový server, Závěrečné práce, Můj web, Úschovna).

    Systém nezkoumá seznam citací uvedený v dokumentu.

  2. Mezi jakými pracemi se podobnosti porovnávají?

    Systém vyhledává podobnosti napříč sdílenou databází porovnávaných dokumentů, která zahrnuje vedle dokumentového serveru ISu i závěrečné práce zapojených škol v systému Theses.cz, seminární a jiné práce v systému Odevzdej.cz, vědecké publikace v systému Repozitar.cz a další dokumenty v informačních systémech provozovaných MU. Součástí vyhledávání podobností je i algoritmus, který porovnávaný dokument analyzuje a zkoumá možné podobnosti i vůči zdrojům z celého Internetu.

  3. K čemu je hledání podobných souborů?

    Typická použití jsou dvě: hledáte dokument "na podobné téma", aniž byste přesně chtěli specifikovat klíčová slova do aplikace

    Osobní administrativa → Hledání

    anebo jakožto vyučující chcete ověřit, zda studentem odevzdaný soubor je dostatečně originální (tzn. nebyl opsán; není plagiátem).

  4. Chci prověřit originalitu závěrečné práce.

    Vedoucí práce, který zpravidla chce prověřit kvalitu práce při psaní posudku, ji najde pomocí

    Osobní administrativa → Správce souborů → Agenda všechny závěrečné práce

    po zadání učo studenta. Zaškrtněte zaškrtávátkem vlevo od názvu souboru s textem práce závěrečné práce a použijte ikonu 'nalézt podobné dokumenty' .

    U nalezených podobných souborů využijte odkaz 'Podobnosti' a shodu posuďte.

    Pozor: je na lidském čtenáři, aby posoudil význam nalezených podobností, tj. zda například student korektně cituje. Originalitu závěrečné práce nejlépe posoudí vedoucí práce nebo oponent (jsou nejvíce obeznámeni s publikacemi v oboru). Pokud není reálné, že by sám vedoucí prováděl tuto operaci v IS, lze ji delegovat např. na sekretářku katedry. Závěrečné práce předložené k obhajobě jsou ze zákona veřejnosti dostupné již před samotnou obhajobou. Sekretářka nebo jiná pověřená osoba může podobnosti vyhledat a "podezřelé výsledky" (vysoceprocentní shoda, shoda s jinými závěrečnými pracemi, ...) předat k posouzení.

  5. Potřebuji soubor porovnat s materiálem, který není v IS!

    Pokud materiál máte v podobě, z níž lze vytvořit textovou verzi (není to tedy např. obrázek), vložte jej například do Poskytovny, do Mého webu, případně do Studijních materiálů předmětu. IS jej do mechanismu zahrne. Pokud soubor vložíte dočasně do své Úschovny, budou se podobnosti kontrolovat jen v rámci této Úschovny, tento postup tedy nedoporučujeme. Informační systém sám už též umí porovnávat soubory oproti některým externím dokumentovým serverům, aniž by bylo nutné z nich texty kopírovat a ukládat do ISu. Pokud naleznete nějaký další externí dokumentový server, ze kterého je práce opsaná, vložte si jeho obsah do Poskytovny ("co je jednou vloženo do Poskytovny, nikdy již nebude opsáno").

    Můžete také srovnat podobnost dvou materiálů mimo IS.

  6. Tušíme, že studenti opisují závěrečné práce z jiných škol.

    Pokud katedra/fakulta tuší, že studenti čerpají při psaní závěrečných prací z webového archivu typicky jiné školy, je vhodné, aby technik fakulty zajistil zkopírování onoho archivu do IS MU (nemusí řešit každý vedoucí práce samostatně).

  7. Jak jako student zjistím, zda můj text je dostatečně originální?

    Před odevzdáním úkolu jej zaveďte do své Úschovny a vyčkejte. Pak proveďte vyhledání podobných souborů.

  8. Studenti mi odevzdávájí úlohy ve formátech, ke kterým IS neumí vytvořit prohledávatelnou verzi.

    Zakažte jim to, požadujte např. Word nebo PDF.

  9. Jak souvisí software pro hledání podobných souborů s Poskytovnami?

    Poskytovny jsou webový prostor, kde studenti kurzu sdílí elektronické materiály dle svého výběru, bez organizace vyučujícím. Pokud k povinnostem kurzu patří zpracování domácích úkolů, studenti mají tendence sdílet koncepty, pre-verze, nebo i hotové verze úkolů, aby si vzájemně ušetřili práci se zpracováním (toto není specialitou Poskytoven v ISu, existuje celá řada serverů tohoto typu v Internetu). Pokud požadujete, aby studenti odevzdávali originální kreativní práce, je nejjednodušší každý semestr měnit zadání úkolu. Není-li to možné, upozorněte předem studenty, že odevzdané práce prověřujete hledáním podobných souborů; IS vás upozorní, pokud student odevzdá práci podobnou materiálu v Poskytovně, či jiné práci odevzdané letos či v minulých letech.

    Pokud jsou někde na webu dostupné sady zpracovaných úloh, zkopírujte je do Poskytovny. Stačí pouze do jednoho libovolného semestru (není nutné kopírovat obsahy poskytoven mezi semestry). "Co je jednou vloženo do Poskytovny, již nikdy nebude opsáno." Pozn.: V Poskytovnách se nezveřejňuje, kdo dokumenty vložil.

  10. Jak funguje vyhledávací algoritmus?

    Jedná se o srovnávání všech části textů dokumentů mezi sebou. Nesrovnají se maličké soubory (obsahující jen jednotky slov). Srovnávají se texty v češtině, angličtině a slovenštině. Jako varovný mechanismus pro studenty je důležité, že odevzdané práce jsou v IS archivovány a mohou být podrobeny zkoumání opakovaně kdykoliv později vylepšenou verzí algoritmu; ušetření si práce opisováním je tedy diskutabilní nebo přímo nevýhodné. Vývojáři ISu budou postupně algoritmus vylepšovat a budou rozšiřovat databázi prohledávaných souborů o vybrané externí weby (tj. o weby mimo školu). Aktuálně (leden 2014) se prohledává přes 15 milionů odevzdaných dokumentů (domácích úloh, esejí, závěrečných prací).

  11. Co znamená, že soubor nebyl zkontrolován/podobnosti nebyly spočítány?

    Při kontrole podobnosti souborů může aplikace ohlásit, že dokument nebyl zatím zkontrolován. Spočítání podobností souborů trvá nějakou dobu. Dokument by měl být analyzován zpravidla do jedné hodiny od zavedení do ISu. V době zvýšené zátěže nebo většího množství vkládaných souborů to může trvat od několika hodin do několika desítek hodin. Soubor není kontrolován také v případě, že jeho velikost je příliš malá.

  12. Co vyjadřuje údaj celková podobnost?

    Tento údaj uvádí celkové procento podobnosti se všemi nalezenými podobnými dokumenty. Uživatel si může kliknutím na odkaz "Celková podobnost" zobrazit všechny nalezené podobné pasáže ze všech podobných dokumentů.

  13. K čemu slouží funkce "Podobnosti s vybranými"?

    Uživatel má možnost zaškrtnout dokumenty, pro které chce spočítat procento podobnosti zkoumaného dokumentu s vybranými podobnými dokumenty. Např. pokud se najde podobnost se zákonem, který je správně citován, uživatel může vyjmout tento dokument a přepočítat podobnost pouze s ostatními nalezenými podobnými dokumenty, ke kterým si zobrazí červeně zvýrazněné podobné pasáže.

  14. Systém našel k mé práci podobnosti. Co to znamená?

    Důležité upozornění! Podobnost, kterou systém nalezl mezi vaší prací a prací/pracemi v databázi, nemusí vždy nutně znamenat, že se jedná o plagiát. Každou práci (podobnost) je nutné posoudit individuálně, zkontrolovat správnost citací apod. Neexistuje univerzální hodnota %, od které lze práci považovat za plagiát.

    [1] celková nalezená procentuální podobnost zkoumaného souboru vůči všem dokumentům v databázi
    [2] kliknutím na 'Celková podobnost' se zobrazí červeně zvýrazněné podobné pasáže všech podobných dokumentů s daným souborem
    [3] kliknutím na 'Podobnosti s vybranými' se zobrazí červeně zvýrazněné podobné pasáže zaškrtnutých dokumentů s daným souborem
    [4] po rozkliknutí odkazu se zobrazí podobnost souborů v databázi vůči zkoumané práci (zobrazují se podobnosti nad 5 %)

  15. Kontrolují se i odpovědi v Odpovědnících?

    Systém také kontroluje delší texty vepsané jako odpovědi do Odpovědníků. Kontrolují se odpovědi na otázky typu :a Vepište text, pokud bylo vepsáno více jak 50 znaků. Tyto odpovědi automaticky systém vkládá do Studijních materiálů (je-li odpovědník ve studijních materiálech) předmětu následovně:
    Odpovědníky → Textové odpovědi → Odpovědník → Jméno studenta
    Pokud odpovědník není ve studijních materiálech, pak se ukládají pod soubor s popisem odpovědníku. Tyto soubory nejsou studentům implicitně dostupné.

    Odkaz na kontrolu učitel najde buď v agendě

    Správa odpovědníků → Odpovědi → kontrola na podobné soubory (opisování) dlouhých textů
    Nebo lze ve Správci souborů zaškrtnout např. složku Textové odpovědi a kliknout na ikonu podobných vajec.

  16. Co se stane, když budu opisovat?

    Plagiátorství (opisování, zhotovování napodobenin) je neetická činnost a podvodné jednání, která nemá na vysoké škole svoje místo. Převzetí obsahu jiného textu/textu jiného autora bez uvedení zdroje a viditelného označení převzatého textu jako citace představuje neoprávněný zásah do autorského práva v rozporu s § 31 autorského zákona, což může být podle § 68 zákona o vysokých školách posuzováno jako disciplinární přestupek. Podle disciplinárního řádu pro studenty příslušné fakulty může být za takový přestupek podle okolností případu uložena sankce napomenutí, podmíněného vyloučení nebo nepodmíněného vyloučení ze studia.


Nenašli jste odpověď? Pošlete nám svůj dotaz na etech(zavináč/atsign)fi(tečka/dot)muni(tečka/dot)cz.

Relevantní odkazy 


Nahoru | Aktuální datum a čas: 20. 8. 2017 00:16, 33. (lichý) týden

Kontakty: istech(zavináč/atsign)fi(tečka/dot)muni(tečka/dot)cz, studijní odd., správci práv, is-technici, e-technici, IT podpora | Použití cookies | Více o Informačním systému