Novinky a zajímavosti ze světa IS MU

RSS Máte-li zájem, přihlaste se k odběru novinek e-mailem. Novinky můžete odebírat také pomocí RSS nebo si zařaďte blog mezi sledované, pokud jste uživatel IS MU.
This blog is written by
PhotographsFI:Vývojový tým IS MU, Mgr. Eva Zárybnická, 206552
Old posts
Category
Blog owners: FI:Vývojový tým IS MU, Mgr. Eva Zárybnická, 206552
Right to read: anyone on the Internet, a specific group of users: FI:CVT FI
Right to post comments: a specific group of users: FI:CVT FI
17. 8.
2006

Unicode - podpora všech znaků v IS MU

Not rated yet.
Novinky

Na Masarykově univerzitě s rozvojem e-learningu v Informačním systému vznikla potřeba vkládat do aplikací texty v cizím jazyce (ruština, francouzština, japonština aj.), jejichž písmo zahrnuje znaky, které nejsou ve středoevropských jazycích běžné. Například může učitel chtít studentům do interaktivních osnov nebo do otázek pro odpovědníky vkládat text v příslušném jazyce, student může potřebovat odpovídat na odpovědníky v tomtéž cizím jazyce, vzájemně mohou diskutovat v předmětových diskusních fórech ve vyučovaném jazyce.

Tyto jazyky si nevystačí se znaky dostupnými ve znakových sadách středoevropských jazyků, a proto Informační systém Masarykovy univerzity nyní běží s podporou Unicode znaků (univerzální sada znaků).
Interně se používá kódování UTF-8 (Universal Transformation Format, 8 bitů).

Informační systém Masarykovy univerzity je v provozu od roku 1999, tedy z doby, kdy ještě takové univerzální způsoby ukládání znaků nebyly rozšířené. Proto systém nebyl vybaven UTF-8 od svého vzniku, jak by se u dnes do provozu uváděných systémů mohlo zdát běžné.

Unicode je založeno na unikátním 32-bitovém čísle (tzv. codepoint) pro každý znak všech světových jazyků. Unicode (včetně UTF-8) je nezávislé na provozované platformě, konkrétním programu a používaném jazyce.
Kódování UTF-8 zapisuje jednotlivé znaky (codepointy) jedním až čtyřmi bajty, přičemž znaky anglické abecedy se zapisují stejně jako v kódování US-ASCII. UTF-8 je tedy s ASCII zpětně kompatibilní.

Proces migrace na Unicode v Informačním systému MU, tedy na sadu znaků, kdy lze vkládat do aplikací jakýkoli znak, který existuje, byl velmi technicky i časově náročný. První fáze - převedení databáze do interního kódování UTF-8, proběhla již v loňském roce. V letošním roce pak byla převedena aplikační infrastruktura tak, aby interně i směrem k uživateli pracovala s kódováním UTF-8.

Úprava aplikační vrstvy si vyžádala revizi v podstatě veškerého aplikačního kódu, který tvoří IS. Jako příklad lze uvést ty části programového vybavení, které v některém místě počítají s délkou vstupního textu. Tato místa bylo třeba jednotlivě prověřit, jestli daná část programu má na mysli délku ve smyslu počtu znaků (písmen) textu, nebo délku jako počet bajtů (protože v UTF-8 může být jeden znak kódován jedním až čtyřmi bajty, mohou být tedy tyto dvě délky obecně různé).

Dále bylo třeba vytvořit infrastrukturu a nastavit parametry jednotlivých aplikací tak, aby některé aplikace umožňovaly uživateli zadávat libovolné Unicode znaky, a některé naopak množinu povolených znaků omezovaly. Jde o to, že některé údaje v systému jsou exportovány do externích systémů jako je matrika studentů nebo personalistika, které ještě nejsou na práci s Unicode připraveny. Podobně tiskový subsystém ISu je omezen na znaky dostupné v používaných písmech a zpracovatelné použitým sázecím systémem. Proto i údaje, které je třeba někam tisknout (například na diplom nebo diploma supplement), mohou obsahovat jen omezenou množinu znaků. IS MU tedy rozeznává tři kategorie znaků: Unicode (plný rozsah znaků), latinka (znaky latinské abecedy s případnými diakritickými značkami, používá se zejména pro tiskové výstupy) a ISO Latin 2 (znaková sada středoevropských jazyků, používá se pro výstupy do externích systémů).

Některé obvyklé otázky vývojáři zodpověděli v Nápovědě systému (v IS MU: Osobní administrativa -> Nápověda -> Jiné/Znaky v ISu a cizí abecedy). Dále je pro uživatele připravena aplikace, do níž uživatel vloží znak nebo více znaků, a aplikace ověří, do kterých kategorií znaky spadají (v IS MU: Osobní administrativa -> Systém -> Které znaky je povoleno zadávat v aplikacích?).

Přesto, jakkoli složité bylo konvertovat celý systém do Unicode, ukázalo se, že byla historicky správná volba jazyka Perl jako základního programovacího jazyka pro IS MU, neboť podpora Unicode a UTF-8 v Perlu má mnohem lepší architekturu než v jiných skriptovacích jazycích.

17. srpna 2006

Not read yet0 commentspermalink
17. 8.
2006

Masarykova univerzita vyvinula software proti plagiátům

Not rated yet.
Novinky – plagiáty

Tisková zpráva, Brno 16. srpna 2006

Masarykova univerzita je první vysokou školou v České republice, která disponuje ve svém studijním informačním systému elektronickou službou na odhalování plagiátů ve vysokoškolských pracích. V Evropě zatím není taková služba na univerzitách příliš rozšířena, první podobné systémy se objevují spíše na zámořských univerzitách.

Masarykova univerzita má značný zájem na tom, aby se dbalo na kvalitu studentských prací, které v rámci vysokoškolského studia vznikají. Snaží se proto potírat nejen běžné opisování prací, ale především odhalovat plagiátorství, které může znamenat i případné porušení autorských práv.

Softwarovou službu na odhalování plagiátů vytvořil Vývojový tým Informačního systému MU (IS MU). Služba je určena pro všechny uživatele tohoto studijního informačního systému, tedy pro pracovníky a studenty univerzity, ale největší význam má právě pro učitele. Technologie pro vyhledávání podobných dokumentů odhaluje nejen opsané práce mezi diplomovými a jinými závěrečnými pracemi studentů, ale i mezi domácími úkoly, referáty, seminárními pracemi a dalšími elektronickými dokumenty.

Technologie pro vyhledávání podobných dokumentů je unikátním vlastním know-how Vývojového týmu IS MU, který působí na Fakultě informatiky MU. Implementovaná služba je vysoce účinná zejména proto, že studijní informační systém integruje v sobě nejen administrativní část studia, ale kompletní úložiště dokumentů (závěrečných prací, dokumentů, studijních materiálů) a e-learningové agendy vyznačující se širokou nabídkou souborů ve formě předmětových studijních materiálů nebo odevzdáváním studentských prací. Integraci tohoto rozsahu má Masarykova univerzita ojedinělou, díky tomu je vyhledávání souborů on-line mezi nezměrným množstvím dat účinné a rychlé.

„Masarykova univerzita považuje účinné odhalování plagiátů za nezbytnou součást svého úsilí o zajištění kvality vysokoškolských prací a chápe je jako příspěvek k etice odborné práce,“ vyjádřil se k této službě rektor Masarykovy univerzity Petr Fiala.


Další podrobnosti

Soubory se vyhledávají v celém IS MU. Tedy bez ohledu na předměty, semestry, fakulty a agendy (Studijní materiály, Poskytovny, Dokumentový server, Závěrečné práce, Můj web, Úschovna, Odpovědníky).
Obsah souborů v datovém úložišti IS MU (tj. objekty v úložišti jsou dostupné přes Osobní administrativa -> Správce souborů) je průběžně strojově analyzován. Zpravidla do jedné hodiny od zavedení nového dokumentu je tento připraven pro uživatelské hledání. U nalezených podobných souborů IS MU vypíše míru shody v procentech. K prověření můžete vybrat jeden soubor, více souborů, celou složku, či celý strom složek.
Pokud materiál je v podobě, z níž lze vytvořit textovou verzi (není to tedy např. obrázek), lze ho vložit například do Poskytovny, do Mého webu, do Studijních materiálů předmětu, příp. dočasně do své Úschovny. IS MU jej do mechanismu vyhledávání zahrne. Lze vložit stránky z Wikipedie do Poskytovny ("co je jednou vloženo do Poskytovny, nikdy již nebude opsáno"), nebo srovnat podobnost dvou materiálů mimo IS MU, pokud se vloží např. oba do Úschovny.

Systém nezkoumá dodržování autorského práva, je tedy na čtenáři, aby posoudil, zda je dodržováno.

Závěrem
Nejen učitelé, ale i studenti mají možnost dohledat podobné dokumenty. (Každý uživatel však vždy mezi dokumenty, které jsou mu veřejně přístupné.)

Další přínos pro uživatele ve vyhledávání podobných dokumentů spočívá v možnosti dohledat vlastní (i cizí) dokumenty například za účelem jejich odstranění, změny nebo aktualizace.

Srovnávají se texty v češtině, angličtině a slovenštině.

Aktuálně se nyní prohledává přes 200 tisíc uložených dokumentů (odevzdaných domácích úloh, esejí, závěrečných prací a dalších).

Znamená-li plagiátorství v konkrétním případě porušení autorských práv, může být neoprávněný zásah do autorského práva v rozporu s autorským zákonem a podle zákona o vysokých školách posuzován jako disciplinární přestupek. Studentovi může být za takový přestupek podle okolností případu uložena sankce od napomenutí až po podmíněné nebo nepodmíněné vyloučení ze studia.

17. srpna 2006

Not read yet0 commentspermalink
17. 8.
2006

Informační systém MU představen na světovém fóru EISTA 06

Not rated yet.
Novinky

Po loňském mimořádném úspěchu, kdy Informační systém Masarykovy univerzity obdržel prestižní evropskou cenu EUNIS Elite Award for Excellence 2005 za výjimečnou implementaci univerzitního počítačového systému, byl systém letos prezentován také na celosvětové úrovni. V minulém měsíci byla koncepce IS MU včetně samotné implementace poprvé představena na mezinárodní konferenci EISTA'06, která je každoročně zaměřena na informační technologie a aplikace ve vzdělávání.

Během této konference, která se konala ve městě Orlando v americkém státě Florida (20.-23.července 2006), bylo vedle IS MU představeno více než sto dalších projektů ze všech pěti kontinentů. Řešení, která nabízí IS MU pro řízení a integraci různých typů univerzitní výuky zaznamenalo i zde řadu pozitivních ohlasů. Zejména ve srovnání s běžně využívanými komerčními systémy nabízí IS MU mimořádnou přidanou hodnotu uživatelům různých kategorií. Účastníci konference rovněž kladně hodnotili dosaženou stabilitu a vysokou dostupnost systému, která je pro jejich běžnou práci velmi důležitá a ne vždy se daří poskytovat služby v požadované kvalitě.

Konference otevřeně naznačila, že v oblasti integrace služeb v jednom systému patří IS MU patříme k průkopníkům v celosvětovém měřítku. Za zmínku stojí i názory
e-learningových praktiků, které zde zazněly a říkají, že významnými důvody, proč učit v běžné výuce za pomocí informačních technologií jsou pro ně ekonomické důvody (přinášejí úsporu škole i studentům) a efektivita ve výuce (soustředění se na problematické partie namísto kompletního výkladu celé semestrální látky).

Mimořádně kladně byl také hodnocen přínos nových projektů, zejména integrované softwarové služby pro odhalování plagiátů. Tyto a jiné projekty pomáhají řešit problémy, s nimiž se univerzitní učitelé setkávají na celém světě.

17. srpna 2006

Not read yet0 commentspermalink
16. 8.
2006

Unicode - podpora všech znaků v IS MU

Not rated yet.
Novinky

Na Masarykově univerzitě s rozvojem e-learningu v Informačním systému vznikla potřeba vkládat do aplikací texty v cizím jazyce (ruština, francouzština, japonština aj.), jejichž písmo zahrnuje znaky, které nejsou ve středoevropských jazycích běžné. Například může učitel chtít studentům do interaktivních osnov nebo do otázek pro odpovědníky vkládat text v příslušném jazyce, student může potřebovat odpovídat na odpovědníky v tomtéž cizím jazyce, vzájemně mohou diskutovat v předmětových diskusních fórech ve vyučovaném jazyce.

Tyto jazyky si nevystačí se znaky dostupnými ve znakových sadách středoevropských jazyků, a proto Informační systém Masarykovy univerzity nyní běží s podporou Unicode znaků (univerzální sada znaků).
Interně se používá kódování UTF-8 (Universal Transformation Format, 8 bitů).

Informační systém Masarykovy univerzity je v provozu od roku 1999, tedy z doby, kdy ještě takové univerzální způsoby ukládání znaků nebyly rozšířené. Proto systém nebyl vybaven UTF-8 od svého vzniku, jak by se u dnes do provozu uváděných systémů mohlo zdát běžné.

Unicode je založeno na unikátním 32-bitovém čísle (tzv. codepoint) pro každý znak všech světových jazyků. Unicode (včetně UTF-8) je nezávislé na provozované platformě, konkrétním programu a používaném jazyce.
Kódování UTF-8 zapisuje jednotlivé znaky (codepointy) jedním až čtyřmi bajty, přičemž znaky anglické abecedy se zapisují stejně jako v kódování US-ASCII. UTF-8 je tedy s ASCII zpětně kompatibilní.

Proces migrace na Unicode v Informačním systému MU, tedy na sadu znaků, kdy lze vkládat do aplikací jakýkoli znak, který existuje, byl velmi technicky i časově náročný. První fáze - převedení databáze do interního kódování UTF-8, proběhla již v loňském roce. V letošním roce pak byla převedena aplikační infrastruktura tak, aby interně i směrem k uživateli pracovala s kódováním UTF-8.

Úprava aplikační vrstvy si vyžádala revizi v podstatě veškerého aplikačního kódu, který tvoří IS. Jako příklad lze uvést ty části programového vybavení, které v některém místě počítají s délkou vstupního textu. Tato místa bylo třeba jednotlivě prověřit, jestli daná část programu má na mysli délku ve smyslu počtu znaků (písmen) textu, nebo délku jako počet bajtů (protože v UTF-8 může být jeden znak kódován jedním až čtyřmi bajty, mohou být tedy tyto dvě délky obecně různé).

Dále bylo třeba vytvořit infrastrukturu a nastavit parametry jednotlivých aplikací tak, aby některé aplikace umožňovaly uživateli zadávat libovolné Unicode znaky, a některé naopak množinu povolených znaků omezovaly. Jde o to, že některé údaje v systému jsou exportovány do externích systémů jako je matrika studentů nebo personalistika, které ještě nejsou na práci s Unicode připraveny. Podobně tiskový subsystém ISu je omezen na znaky dostupné v používaných písmech a zpracovatelné použitým sázecím systémem. Proto i údaje, které je třeba někam tisknout (například na diplom nebo diploma supplement), mohou obsahovat jen omezenou množinu znaků. IS MU tedy rozeznává tři kategorie znaků: Unicode (plný rozsah znaků), latinka (znaky latinské abecedy s případnými diakritickými značkami, používá se zejména pro tiskové výstupy) a ISO Latin 2 (znaková sada středoevropských jazyků, používá se pro výstupy do externích systémů).

Některé obvyklé otázky vývojáři zodpověděli v Nápovědě systému (v IS MU: Osobní administrativa -> Nápověda -> Jiné/Znaky v ISu a cizí abecedy). Dále je pro uživatele připravena aplikace, do níž uživatel vloží znak nebo více znaků, a aplikace ověří, do kterých kategorií znaky spadají (v IS MU: Osobní administrativa -> Systém -> Které znaky je povoleno zadávat v aplikacích?).

Přesto, jakkoli složité bylo konvertovat celý systém do Unicode, ukázalo se, že byla historicky správná volba jazyka Perl jako základního programovacího jazyka pro IS MU, neboť podpora Unicode a UTF-8 v Perlu má mnohem lepší architekturu než v jiných skriptovacích jazycích.

17. srpna 2006

Not read yet0 commentspermalink