Digitální kurátorství
Mgr. Michal Konečný
Digitální kurátorství
Info
Období
jaro 2019

Kapitola obsahuje:
1
Diskusní fórum
3
Obrázek
6
PDF
4
Studijní text
1
Web
Učitel doporučuje studovat od 25. 2. 2019 do 3. 3. 2019.
Kapitola obsahuje:
1
Diskusní fórum
4
PDF
1
Studijní text
2
Web
Učitel doporučuje studovat od 4. 3. 2019 do 10. 3. 2019.
Kapitola obsahuje:
1
Diskusní fórum
4
PDF
1
Studijní text
Učitel doporučuje studovat od 11. 3. 2019 do 17. 3. 2019.
Kapitola obsahuje:
1
Diskusní fórum
2
PDF
1
Studijní materiály
1
Studijní text
2
Web
Učitel doporučuje studovat od 18. 3. 2019 do 24. 3. 2019.
Kapitola obsahuje:
1
Studijní materiály
1
Studijní text
Učitel doporučuje studovat od 25. 3. 2019 do 31. 3. 2019.
Kapitola obsahuje:
1
Diskusní fórum
2
PDF
2
Studijní materiály
1
Studijní text
7
Web
Učitel doporučuje studovat od 1. 4. 2019 do 7. 4. 2019.
Kapitola obsahuje:
1
Diskusní fórum
1
PDF
1
Studijní text
7
Web
Učitel doporučuje studovat od 8. 4. 2019 do 14. 4. 2019.
Kapitola obsahuje:
3
PDF
1
Studijní text
2
Web
Učitel doporučuje studovat od 15. 4. 2019 do 21. 4. 2019.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 22. 4. 2019 do 28. 4. 2019.
Týden 11
Učitel doporučuje studovat od 29. 4. 2019 do 5. 5. 2019.
Kapitola obsahuje:
1
Odevzdávárna
1
Studijní text
Učitel doporučuje studovat od 6. 5. 2019 do 12. 5. 2019.
Týden 13
Učitel doporučuje studovat od 13. 5. 2019 do 19. 5. 2019.

Týden 1

  1. Představíme si digitální kurátorství jako etablovaný transdisciplinární obor
  2. Seznámíme se s jeho historií
  3. Povíme si, co je to kurátorský životní cyklus DCC
  4. Vysvětlíme si, co dělá digitální kurátor a co všechno by měl znát
Preserving Digital Information
Report of the Task Force on Archiving of Digital Information.
Digital Curation for Science, Digital Libraries, and Individuals
The paper explores emerging field of digital curation as an area of inter-disciplinary research and practice, and the trends which are influencing its development. It analyses the genesis of the term and how traditional roles relating to digital assets are in transition.


Co je digitální kurátorství

Termín digitální kurátorství byl poprvé použit v roce 2001 v názvu semináře Digital Curation: digital archives, libraries and e-science seminar (Beagrie, 2006, s. 4). Na tomto semináři pořádaném organizacemi Digital Preservation Coalition a British National Space Centre se setkali zástupci řady oborů, aby společně diskutovali o nejnovějším vývoji v oblasti dlouhodobého uchovávání dat. Podle samotných účastníků vedl seminář k zahájení důležitého mezioborového dialogu mezi archiváři, specialisty na knihovní a informační management a správci dat (Beagrie a Pothen, 2002). Důležitým příspěvkem k tomuto úspěšnému dialogu byla volba pojmu digitální kurátorství (digital curation) pro název semináře. Nový termín těžil z výhod pojmu kurátorství, zažitého jak v oboru knihovnictví a muzejnictví, tak v biologických vědách – ve všech těchto oblastech kurátorství představuje nejen ochranu a údržbu sbírek nebo databází, ale také určitou přidanou hodnotu a znalosti. Důvodem k prosazování nového pojmu byla snaha přenést do digitálního prostředí kurátorské postupy používané v muzeích a archivech a současně upozornit na nutnost změn těchto přístupů, která vyplývá z rozdílu mezi fyzickými a digitálními artefakty (Beagrie, 2006, s. 5).

David Giaretta, jeden z lidí, kteří hráli zcela zásadní roli při zrodu nového oboru, reagoval na počáteční zmatení kolem výkladu toho, co vlastně digitální kurátorství znamená vytvořením vlastní definice, podle níž se „v širším pojetí jedná o udržování a přidávání hodnoty důvěryhodnému jádru digitálních informací pro současné a budoucí použití[1]“ (Giaretta, 2008).

S přidáváním hodnoty se můžeme setkat také v definici na stránkách Digital Curation Centre: „Digitální kurátorství zahrnuje správu, ochranu a zhodnocení digitálních výzkumných dat během jejich životního cyklu[2]“ (What is digital curation?, 2015).

Abbottová (2008) popisuje digitální kurátorství jako aktivity zapojené do správy dat od plánu jejich tvorby přes návody na digitalizaci a dokumentaci až po zajištění jejich dostupnosti a připravenosti pro budoucí využití.

Vedle těchto definic, jejichž původ můžeme vysledovat ve světě vědeckých a paměťových institucí, existuje ještě další pohled na digitální kurátorství. Ten souvisí se stále větším objemem dat (často multimediálních), která jsou publikována na internetu formou uživateli spravovaného obsahu. Ačkoliv se v této souvislosti častěji hovoří o obsahovém kurátorství (Rosenbaum, 2010), Erin Scime (2009) používá označení digitální kurátor právě pro zdůraznění pojítek s fyzickým kurátorstvím. Kurátorem se podle ní stává ten, kdo „formuje sbírku vytvořením zastřešující strategie, která definuje, jak by měl být obsah organizovaný, umístěný a učiněný relevantním[3]“. V podobném smyslu používá pojmy digitální kurátorství a digitální kurátor v sérii článků zaměřených na obsahové kurátorství ve vzdělávání také Černý[4] (2014).

Další důležité pojmy

V literatuře se můžeme setkat i s dalšími pojmy, které s digitálním kurátorstvím souvisejí a mezi kterými je občas obtížné rozlišit. Na nejasnost v oblasti terminologie upozorňuje Giaretta (2008), který zdůrazňuje, že je nutné pojmy používat tak, aby nedošlo ke zmatení čtenáře, a navrhuje následující rozdělení[5]:

-        Uchovávání dat (data preservation): obecný termín, který je v daném kontextu ekvivalentní k termínu digitální uchovávání.

-        Digitální uchovávání (digital preservation): zajištění přístupnosti originálních „bitů a bajtů“.[6]

-        Uchovávání digitálních informací (digital information preservation): představuje to, k čemu se odkazuje OAIS[7] standard – důležité nejsou originální „bity a bajty“, ale obsah.

-        Kurátorství (curation): obecný termín – pečování o věci.

-        Datové kurátorství (data curation): péče o data a přidávání hodnoty.

-        Digitální kurátorství (digital curation): péče o digitální data a přidávání hodnoty, které pravděpodobně předpokládá vytváření nových dat z těch existujících, aby byla zajištěna větší užitečnost a vyhovění jejich účelu.

Vztah digitálního kurátorství a dlouhodobé ochrany dat

V anglicky psané literatuře je termín digital curation (digitální kurátorství) velmi často používán v souvislosti s pojmy digital preservation (digitální uchovávání) a long term preservation[8] (dlouhodobé uchovávání) a může s nimi být někdy nesprávně zaměňován.

Pro správné pochopení vztahu mezi uchováváním a kurátorstvím pomůže rozdělení, které použili Lord a Macdonaldová (2004, s. 3):

-        Kurátorství: Aktivita správy a poskytování dat od okamžiku jejich vzniku pro zajištění toho, aby plnila svůj účel a aby byla dohledatelná a znovu použitelná. Pro dynamická data to znamená průběžné obohacování nebo aktualizování, aby vyhovovala svému zamýšlenému účelu.

-        Archivace: Kurátorská aktivita, která zajišťuje, že data jsou správně vybrána, uložena a mohou být zpřístupněna a že jejich logická i fyzická integrita je průběžně udržována a to včetně bezpečnosti a autenticity.

-        Uchovávání: Archivační aktivita, při níž jsou specifické datové jednotky průběžně udržovány tak, aby mohly být přístupné a pochopitelné navzdory neustálé změně a zastarávání technologií.

Podle definice Neila Beagrieho v příručce vydané Digital Preservation Coalition[9] je digitální uchovávání „řada řízených aktivit nezbytných k zajištění kontinuálního přístupu k digitálním materiálům po tak dlouhou dobu, jak je nutné[10]“ (Preservation Management of Digital Materials, 2008).

V podobném duchu definují Hutař a Melichar (2013b) dlouhodobé uchovávání. Podle nich se jedná o „soubor aktivit a postupů, jejichž cílem je zajistit použitelnost, vyhledatelnost, dostupnost a autenticitu digitálního obsahu v průběhu času“. Tito autoři ve své práci používají popisnější termín dlouhodobá ochrana digitálních informací[11].

Z pohledu definic jsou tedy pojmy „digitální uchovávání“ a „dlouhodobé uchovávání“ téměř shodné a vzájemně zaměnitelné[12]. Nejsou však zaměnitelné s digitálním kurátorstvím, které můžeme chápat jako nadstavbu dlouhodobého uchovávání. Důležitou součástí kurátorství je podle Giaretty (2008) přidávání hodnoty, aby uchovávaná data časem neztrácela svůj původní účel, což je aspekt, který se v dlouhodobém uchovávání nevyskytuje.

Digitální stewardství

V některých zdrojích se setkáváme také s označením digital stewardship, tedy digitální stewardství. Tento termín je rozšířený zejména ve Spojených státech, kde významnou roli v oblasti dlouhodobé ochrany digitálních informací hraje National Digital Stewardship Alliance, konsorcium založené Knihovnou Kongresu[13] (National Digital Stewardship Alliance, [b. r.]).

Podle Lazorchaka (2011) má tento termín kořeny v environmentalistické komunitě, jejíž myšlenky uchovávání zdrojů pro budoucí generace našly odezvu i mezi ochránci digitálních informací. Lazorchak tvrdí, že stewardství uspokojivě spojuje dlouhodobé uchovávání s kurátorstvím a rozšiřuje důraz původně kladený na vědecká data i na všechny ostatní druhy digitálních materiálů.

Pojmu stewardství dává přednost i Bastianová et al. (2011), protože podle jejího názoru lépe vystihuje celou šíři činností a problémů, s nimiž se kurátoři setkávají. Odvolává se při tom na původní významy obou pojmů – zatímco kurátor je spíše „dozorce“, steward je nejen „dozorce“, ale také „opatrovník[14]“.

V českém jazykovém prostředí se s pojmem digitální stewardství běžně nesekáváme a proto se tato práce bude držet termínu kurátorství, který je diskurzní komunitou obvykle chápán v takové šíři záběru, s jakou Bastianová a Lazorchak definují stewardství [15].



[1] „Digital curation, broadly interpreted, is about maintaining and adding value to, a trusted body of digital information for current and future use.“

[2] „Digital curation involves maintaining, preserving and adding value to digital research data throughout its lifecycle.“ Překlad Pavla Švástová.

[3] „...the content strategist-as-curator works to reframe the collection by creating an overarching strategy that defines how content should be organized, positioned, and made relevant...“

[4] V těchto článcích se objevují i další podoby kurátorů: informační, online, datový, digitální informační...

[5] Podle (Giaretta, 2008).

[6] Je na místě poznamenat, že většina autorů chápe pojem digital preservation komplexněji, spíše podle Beagrieho definice uvedené dále v textu.

[7] Open Archive Information System – referenční model digitálního archivu, který je standardizován v mezinárodní normě ISO 14721.

[8] S tímto termínem se můžeme setkat v textu normy ISO 14721 a také v souvislosti s informačními systémy a softwarovými nástroji určenými pro dlouhodobou ochranu digitálních informací.

[9] Britská organizace, jejímž cílem je rozvoj v oblasti digitálního uchovávání. Mezi její členy patří významné vysoké školy, státní instituce, paměťové a akademické instituce.

[10]„Digital Preservation Refers to the series of managed activities necessary to ensure continued access to digital materials for as long as necessary.“

[11] V době, kdy vznikala citovaná práce, neexistovala zavedená česká terminologie a použití delšího a popisnějšího překladu bylo logické i s ohledem na zdůraznění rozdílu mezi prostou archivací digitálních dat a promyšlenou dlouhodobou ochranou.

[12] V práci bude nadále používán termín „dlouhodobá ochrana digitálních informací“ tam, kde původní kontext použití termínu naznačuje větší přesah směrem do oblasti kurátorství a „dlouhodobé uchovávání“ zejména tam, kde se bude text vztahovat k zavedeným normám a standardům, neboť s tímto termínem pracuje český překlad normy ISO 14721.

[13] Library of Congress – http://www.loc.gov/

[14] V originále „overseer“ a „keeper“.

[15] Tato skutečnost byla autorem ověřena při práci na projektu LTP-pilot, jehož cílem bylo získání zkušeností v nízkonákladovém řešení dlouhodobé ochrany digitálních informací pilotní implementací systému Archivematica a jeho evaluací mimo jiné také z pohledu potřeb digitálního kurátorství.

Historické souvislosti

Ačkoliv sám pojem digitální kurátorství je poměrně mladý, problematika, k níž se vztahuje, sahá více do minulosti. V roce 1990 byl poprvé použit termín digital preservation v souvislosti s projektem knihovny Cornellovy univerzity a společnosti Xerox, který měl za cíl využít digitální technologie v rámci procesu uchování analogových médií (Hirtle, 2010, s. 124 cit. podle Tibbo, 2012, s. 188).

V roce 1994 vytvořily Commision on Preservation and Access (CPA)[1] a Research Libraries Group[2]  pracovní skupinu Task Force on Archiving of Digital Information[3], aby prozkoumala možnosti nepřetržitého a časově neomezeného přístupu k záznamům uloženým v digitální elektronické podobě.

Skupina byla složená z osobností z akademické sféry, průmyslu, muzeí, archivů a knihoven, nakladatelství, školství a vládních organizací. Byla pověřena popsáním hlavních problémů spojených s přístupností digitálních záznamů. (Preserving Digital Information, 1996, s. iii)

Její závěrečná zpráva nazvaná Ochrana digitálních informací[4] je považována za první významný příspěvek v oblasti digitálního kurátorství. Zpráva se mimo jiné zabývala vizí vybudování národní technologické infrastruktury pro digitální archiv zajištující dlouhodobé uchování národního kulturního, ekonomického a společenského dědictví. Šest z devíti doporučení pro CPA uvedených v této zprávě se však netýkalo technologií. Tato doporučení se zaměřovala na problematiku metodik a koncepčních návrhů při tvorbě digitálních archivů. Závěrečná zpráva zdůrazňující nutnost vyvážení technických a netechnických aspektů dlouhodobého uchovávání se stala základem a inspirací pro mnoho pozdějších aktivit a iniciativ v této oblasti (Tibbo, 2012; Preserving Digital Information, 1996).

V polovině devadesátých let vznikla řada vysokoúrovňových aktivit zaměřených na problematiku dlouhodobého uchovávání také ve Velké Británii. Na workshopu o dlouhodobém uchovávání elektronických materiálů, pořádaném v rámci programu eLib[5] na univerzitě ve Warwicku, byly prezentovány první výstupy americké Task Force on Archiving of Digital Information. Workshop upozornil na množství problémů vztahujících se k dlouhodobé ochraně digitálních informací. Joint Information Systems Committee[6] (JISC) následně zadal vypracování osmi studií dozorovaných nově vytvořenou pracovní skupinu Digital Archiving Working Group[7]. Syntéza těchto studií[8] pak dospěla k závěru, že existuje potřeba po zvýšení povědomí, spolupráci mezi organizacemi a vylepšených strategiích, guidelines a checklistech (Higginsová, 2011, s. 79).

V roce 1999 se uskutečnil na Univerzitě ve Warwicku druhý workshop, zaměřený na uchovávání informací z výzkumu. Na základě doporučení z tohoto workshopu byl vytvořen JISC Digital Preservation Focus, který měl koordinovat a šířit výzkum a zkušenosti mezi vysokými školami ve Velké Británii. V roce 2001 následovalo vytvoření Digital Preservation Coalition[9] – organizace sdružující řadu institucí, jejímž cílem bylo vytvoření britské koncepce pro dlouhodobou ochranu digitálních informací v mezinárodním kontextu. (Higginsová, 2011, s. 80; Beagrie, 2006, s. 4-6).

Téhož roku byl také publikován draft normy OAIS, která vznikla na popud Mezinárodní organizace pro normalizaci[10] pod záštitou Consultative Committee for Space Data Systems (CCSDS). Původ referenčního modelu OAIS můžeme vysledovat v první polovině 90. let. V té době si instituce začaly uvědomovat, že do té doby všeobecně přijímaný model digitálních knihoven založený na architektuře Kahn-Wilenski nevyhovuje, protože cíleně neřeší budoucí zpřístupnění dat. Základ budoucího referenčního modelu byl tvořen pod záštitou CCSDS z toho důvodu, že právě instituce zabývající se vesmírným výzkumem nejvíce narážely na problémy spojené s dlouhodobým uchováváním velkých objemů dat. (Hutař a Melichar, 2013b, s. 16).

Je zřejmé, že na přelomu tisíciletí byla problematika uchovávání a zpřístupnění digitálních materiálů chápána v širším kontextu, než tomu bylo dříve. Uskutečnil se seminář Digital Curation: digital archives, libraries and e-science seminar zmíněný v předchozí kapitole a pomalu se začalo vžívat nové označení pro činnosti, které se zaměřují nejen na dlouhodobé uchovávání dat, ale také na dlouhodobou ochranu jejich užitečnosti a použitelnosti – digitální kurátorství.

Ve Spojených státech byl v roce 2001 zahájen National Digital Information Infrastructure and Preservation Program. Pod záštitou Knihovny Kongresu se tento dodnes trvající program zaměřil na získávání, ochranu a zpřístupnění významného digitálního obsahu, vytvoření celonárodní partnerské sítě a vývoj technické infrastruktury nástrojů a služeb pro podporu dlouhodobé ochrany digitálních dat (Library of Congress, [b.r.]).

Z iniciativy JISC bylo v roce 2004 založeno Digital Curation Centre (DCC). Jeho vytvoření bylo doporučeno o rok dříve ve zprávě o nutnosti kurátorství pro e-science[11] (Lord a Macdonald, 2003). V této zprávě byly pro chystané centrum definovány následující cíle:

-        zahájení výzkumného programu věnovaného širším souvislostem datového kurátorství;

-        vytvoření mezinárodního centra pro vývoj nástrojů a technik pro dlouhodobé, bezpečné datové kurátorství;

-        vývoj spolehlivého a udržitelného repozitáře nástrojů, software a dokumentů pro podporu kurátorství, dlouhodobé ochrany digitálních informací a použití digitálních zdrojů;

-        vývoj testovacího prostředí a certifikace pro systémy, nástroje a kurátorské služby;

-        pilotní vývoj služeb pro zaznamenávání a monitorování souborových formátů a nástrojů, které budou tyto služby využívat;

-        poskytování poradenských služeb a tvorba kurátorské dobré praxe.

Ve stejné době, kdy se rozbíhala činnost DCC, vzniklo na základě doporučení pracovní skupiny Task Force Permanent Access sdružení evropských vědeckých a akademických institucí nazvané Alliance for Permanent Access (APA), jehož činnost se zaměřuje zejména na dlouhodobé uchovávání výsledků a dat získaných při výzkumu.

V letech 2006 - 2010 byla z šestého rámcového programu EU financována řada projektů zaměřených na rozvoj nástrojů a metodologií v oblasti dlouhodobé ochrany digitálních informací. Jednalo se například o projekty Digital Preservation Europe (DPE), CASPAR a PLANETS (Higginsová, s. 81).

Digital Preservation Europe byl projekt probíhající v letech 2006 – 2009, který byl zaměřen na podporu spolupráce mezi různými národními iniciativami v rámci Evropského výzkumného prostoru. DPE vzniklo z potřeby zlepšit koordinaci a spolupráci v rámci různých aktivit cílených na efektivní uchovávání digitálních materiálů (About DPE, 2006).

Cílem projektu DPE bylo[12]:

-        zvýšení povědomí o dlouhodobé ochraně digitálních informací;

-        propagace schopnosti členských států postupovat společně v aktivitách týkajících se dlouhodobé ochrany digitálních informací;

-        kooperace, která měla zabránit zbytečnému a zdvojenému úsilí;

-        výběr a zavádění certifikovaných a kontrolovatelných standardů pro procesy dlouhodobé ochrany digitálních informací;

-        rozvoj kompetencí prostřednictvím vzdělávacích balíčků;

-        koordinace a sdílení výsledků výzkumu;

-        příprava a popularizace plánů výzkumu;

-        pomoc občanům i odborníkům související s rolí dlouhodobé ochrany digitálních informací.

Těžiště činnosti DPE se nacházelo zejména v koordinaci a přípravě metodik a nástrojů, které byly dávány k dispozici zájemcům o problematiku dlouhodobé ochrany digitálních informací a digitálního kurátorství.

PLANETS[13] byl čtyřletý projekt zahájený v roce 2006. Měl za cíl vytvoření praktických služeb a nástrojů, které měly pomoci zajistit dlouhodobý přístup ke kulturnímu a vědeckému bohatství v digitální podobě (About Planets, 2007). V rámci projektu byl mimo jiné vytvořen softwarový nástroj Plato, který slouží pro tvorbu plánů dlouhodobého uchovávání a který je nadále vyvíjen a spravován Technickou univerzitou ve Vídni.

CASPAR[14] byl integrovaný projekt spolufinancovaný Evropskou unií, který probíhal rovněž v letech 2006 – 2009. Jeho hlavním posláním bylo praktické ověření referenčního modelu OAIS a rozvoj technik pro práci s vysvětlujícími informacemi[15]. Dále se projekt zabýval rozvojem nástrojů a technik pro dlouhodobé uchovávání digitálních zdrojů nezávisle na změnách technologií a architektury. Mezi výstupy projektu CASPAR se vedle případových studií nacházely také metodické frameworky a konceptuální modely pro podporu systémového přístupu k problematice dlouhodobého uchovávání (CASPAR, [b.r.]).

V roce 2007 vstoupilo do druhé fáze své činnosti DCC a zaměřilo se více na kurátorství výzkumných dat a s tím spojené výzvy. V té době vznikl DCC model kurátorského životního cyklu, který popisoval aktivity nutné pro úspěšné kurátorství. (Higginsová, 2011, s. 82)

Na druhé straně Atlantiku se ve stejném období objevila významná aktivita zaměřená na vzdělávání digitálních kurátorů – na University of North Carolina at Chapel Hill (UNC) byl zahájen projekt DigCCurr, který dal později vzniknout komplexnímu otevřenému vysokoškolskému kurikulu. (About DigCCurr I, [b.r.])

Na konci první dekády druhé tisíciletí lze již digitální kurátorství považovat za etablovaný obor. V různých formách, které zahrnují vývoj nástrojů a platforem, výzkumnou činnost i vzdělávání, se mu věnovala řada institucí. V této době vznikly mimo jiné The University of California Curation Center (označované jako UC3) nebo The Digital Curation Institute na University of Toronto (Higginsová, 2011, s. 83). Do druhé fáze vstoupil projekt DigCCurr, který se soustředil na vytvoření mezinárodního kurikula a vzdělávací sítě pro doktorandské studium digitálního kurátorství. V rámci projektu byl vytvořen portál Digital Curation Exchange[16], který propojuje odborníky z praxe, výzkumníky, pedagogy a studenty digitálního kurátorství. (About DigCCurr II, [b.r.])

Na projekt PLANETS navázala v roce 2010 Open Planets Foundation[17], která zastřešila vývoj open-source programů používaných při dlouhodobém uchovávání. Mezi těmito programy najdeme například JHOVE určený pro identifikaci, validaci a charakterizaci digitálních objektů, nebo FIDO, který umožňuje identifikovat formát digitálního objektu[18] (About US, [b.r.]).

Ve stejném roce byl z programu DaVinci financovaného Evropskou unií zahájen projekt Digital Curator Vocational Education Europe, jehož cílem bylo vytvoření evropského frameworku pro další odborné vzdělávání[19] v oblasti digitálního kurátorství (About Digital Curator Vocational Education Europe, 2010).

Ze sedmého rámcového programu EU byl podpořen projekt SCAPE orientovaný na rozsáhlé heterogenní archivy komplexních digitálních objektů. V rámci projektu, který byl ukončen v roce 2014, vznikla infrastruktura, nástroje a metodiky pro částečně automatizovanou škálovatelnou ochranu. Mezi úspěšné výstupy projektu patří například sada softwarových nástrojů Digital Preservation Toolkit[20], nebo aplikace Plato[21] pro podporu rozhodování při plánování důvěryhodných digitálních repozitářů (SCAPE, 2014).

Období po roce 2011 nejlépe vystihuje titulek „Curation Goes Mainstream“ z práce Sarah Higginsové (2011, s. 83). Po předchozí éře poměrně bouřlivého vývoje a vzniku nových konceptů došlo v té následující k jistému útlumu a aktivity se soustředí spíše na šíření a praktickou aplikaci postupů, metodik a modelů vzniklých dříve. Zajímavá iniciativa se objevila v roce 2012, kdy pracovníci paměťových institucí státu Illinois vytvořili pod tlakem vyvolaným neustálými škrty v rozpočtech projekt POWRR[22]. Tento projekt se specializuje na hledání způsobů, jak dlouhodobou ochranu digitálních informací řešit s minimálními náklady (About POWRR, 2014).

V roce 2015 mezi nejvýznamnější organizace a instituce, které svojí činností aktivně přispívají k rozvoji digitálního kurátorství, patří například:

-        Digital Curation Centre, které se nachází ve třetí fázi své existence a zaměřuje se především na šíření kurátorské dobré praxe v oblasti terciárního školství;

-        Alliance for Permanent Access[23], která nabízí celou řadu networkingových i vzdělávacích aktivit a soustředí se především na uchovávání dat z vědeckého výzkumu;

-        Digital Preservation Coalition má hlavní těžiště své činnosti v oblasti osvěty a šíření informací;

-        Open Preservation Foundation kromě vývoje open-source nástrojů také buduje aktivní komunitu a přispívá k výměně informací;

-        Digital Curation Exchange slouží jako centrum pro výměnu informací týkajících se vzdělávání;

-        Library of Congress[24], která zastřešuje projekty, aktivity a sdružení v oblasti vzdělávání a šíření dobré praxe;

-        nestor[25], německá kompetenční síť aktivní v oblasti standardů, vzdělávání a výměny informací;

-        Impact Centre of Competence in Digitisation[26], které se věnuje digitalizaci.



[1] Americká organizace založená v roce 1986 za účelem ochrany kulturního dědictví: http://www.clir.org/about/history

[2] Sdružení amerických knihoven založené v roce 1974: http://www.oclc.org/research/partnership/history.html?urlm=160971

[3] Pracovní skupina pro archivaci digitálních informací

[4] Preserving Digital Information

[5] Electronic Libraries Programme: http://www.ukoln.ac.uk/services/elib/

[6] Britská nevládní nezisková organizace typu non-departmental public body, která se zaměřuje na podporu v oblasti digitálních služeb a řešení se zaměřením na odborné a další vzdělávání. Zdroj: https://www.jisc.ac.uk/about

[7] Pracovní skupina pro digitální archivaci.

[8] Dokument nazvaný The Digital Culture: Maximising the Nation's Investment je dotupný na http://www.ukoln.ac.uk/services/elib/papers/other/jisc-npo-dig/intro.html

[9] http://www.dpconline.org/

[10] International Standardization Organization – ISO

[11] E-Science je v kontextu zmíněné zprávy použito jako označení pro výzkumy související s využitím informačních technologií ve vědeckém výzkumu a zejména s rostoucími objemy dat napříč všemi vědními obory (Lord a Macdonald, 2003). Termín se také používá pro britský program rozvoje a financování této oblasti po roce 2000 (Hey a Trefethenová, [b.r.]).

[12] Podle (About DPE, 2006)

[13] Preservation and Long-term Access through Networked Services

[14] Cultural, Artistic and Scientific knowledge for Preservation, Access and Retrieval

[15] Vysvětlující informace (Representantion Information) slouží pro zachycení a uchování způsobu, jakým lze přistupovat k informacím uloženým v digitálních objektech.

[17] Později tato organizace změnila svůj název na Open Preservation Foundation – http://openpreservation.org/

[18] Oba tyto nástroje využívají veřejně přístupnou formátovou databázi PRONOM, kterou od roku 2002 spravuje a publikuje britský národní archiv.

[19] Český překlad originálního termínu vocational training se vztahuje k pojmu další vzdělávání, který se používá pro vzdělávání získávané po dosažení určitého stupně vzdělání a vstupu na trh práce.

[21] http://plato.openpreservation.org/. V současnosti aplikaci spravuje Technická univerzita ve Vídni, která ji také provozuje formou SAAS (Software As A Service) na http://www.ifs.tuwien.ac.at/dp/plato/intro/

[22] Zkratka znamená Preserving (Digital) Objects With Restricted Resources a přímo se tak odkazuje na obtížnou situaci způsobenou omezováním finančních prostředků.

[23] Členská organizace sdružující organizace z veřejného i soukromého sektoru – http://www.alliancepermanentaccess.org/

[24] Informace Knihovny Kongresu o tématech souvisejících s dlouhodobou ochranou digitálních informací jsou publikovány na stránkách http://www.digitalpreservation.gov/, které slouží jako rozcestník pro National Digital Stewardship Alliance, Digital Preservation Outreach and Education a National Digital Information Infrastructure and Preservation Program.

[25] http://www.langzeitarchivierung.de/

[26] http://www.digitisation.eu/

Digitální kurátorství v České republice

Historii dlouhodobé ochrany digitálních informací v České republice podrobně zmapovali Hutař s Melicharem (2013a, s. 4):

Domníváme se, že české knihovny, galerie, muzea a archivy jsou si v určitém smyslu podobné – všechny tyto instituce prošly třemi fázemi vývoje digitalizace, shromažďování tzv. born-digital dat[1], správy a ukládání digitální dat.

-        V první fázi, od raných devadesátých let zhruba do roku 2002, s digitalizací a hlavně s ukládáním digitálních dat převážně pouze experimentovaly.

-        Předělem ke druhé fázi byly povodně v roce 2002, po nichž se generování digitálního obsahu v paměťových institucích urychlilo. Objevily se také projekty zaměřené na born-digital dokumenty.

-        Dalším významným přelomem je rok 2011, kdy byly zahájeny velké projekty masové digitalizace v obou nejvýznamnějších národních institucích – Národní knihovně České republiky (NK ČR) a v Národním archivu České republiky (NA ČR). Zároveň se především díky financím EU stávají technologie pro digitalizaci více dostupné pro větší počet institucí, včetně těch menších. Součástí obou projektů je také získání systému na logickou dlouhodobou ochranu digitálních dat (LTP – long-term preservation systém).

V závěru citované práce autoři konstatují, že v českých institucích bylo v roce jejího vzniku malé povědomí o nutnosti chránit data víc, než jen pouhým uložením a zálohováním. Nebyly definované strategie dlouhodobého uchovávání a často se přijímala ad hoc řešení správy dat (Hutař a Melichar, 2013a, s . 45).

Vyjádřili také předpoklad, že do roku 2015 alespoň jedna instituce v ČR „bude mít funkční LTP systém v provozu a použití“ (tamtéž, s. 47). Tento předpoklad se naplnil například v případě projektu Národní digitální knihovny. Ta pro uchování digitalizovaných dokumentů používá LTP systém, který je v souladu se standardy OAIS (Financování, 2015) a připravuje se na získání certifikátu důvěryhodného úložiště (Certifikace dlouhodobého úložiště, 2015).



[1] Born-digital Hutař s Melicharem (2013, s. 4) definují jako „běžné označení pro dokumenty, data nebo informace, které vznikly v digitální podobě a nemají, nikdy neměly a není plánováno, že by měly fyzickou (např. tištěnou) podobu“.

Model životního cyklu digitálního kurátorství DCC

Model životního cyklu vypracovaný v DCC slouží jako ilustrační vysokoúrovňový pohled na jednotlivé složky potřebné pro úspěšné zvládnutí digitálního kurátorství a uchování dat. Může pomoci při plánování aktivit digitálního kurátora, který díky němu má jistotu, že podchytil všechny nezbytné kroky životního cyklu (DCC Curation Lifecycle Model, 2015).

Podle Tibbo (2012, s. 192) je DCC Digital Curation Lifecycle Model pravděpodobně nejznámější z mnoha modelů životního cyklu uchovávaných dat[1]. Zahrnuje mnoho funkcí a aktivit, které mají technické aspekty, ale žádná z nich nemůže být zvládnuta pouze technologií samotnou. Mnohé z nich vyžadují významnou míru lidských zásahů a úsudku.

Obrázek 1: Grafické znázornění životního cyklu digitálního kurátorství (Digital Curation Centre, © 2015)

DCC Lifecycle Model velmi promyšleným způsobem pracuje s vrstvami, v nichž můžeme vysledovat směrem od středu změnu kontextu uchování dokumentu od ochrany na bitové úrovni přes dlouhodobé uchovávání až po aktivity spojené s kurátorstvím.

Data[2]

Data neboli informace zaznamenané v binární digitální podobě se nachází v centru životního cyklu a zahrnují:

-        Digitální objekty, které mohou být jednoduché (například textové, obrazové nebo zvukové soubory, společně s jejich identifikátory a metadaty) nebo komplexní (digitální objekty tvořené kombinací jiných digitálních objektů)

-        Databáze – strukturované kolekce záznamů nebo dat uložené v počítačových systémech.

Akce napříč celým životním cyklem (Full Cycle Actions)
Popisné a vysvětlující informace (Description and Representation Information)

Datům a digitálním objektům jsou přiřazeny administrativní, popisná, technická a strukturální metadata a metadata o uchovávání. Při tom jsou dodržovány příslušné standardy, aby byl zaručen adekvátní popis a kontrola v dlouhém časovém období. Jsou také shromážděny a přiřazeny vysvětlující informace (Representation Information) nezbytné pro pochopení a správnou interpretaci digitálních materiálů i připojených metadat.

Plán uchovávání (Preservation Planning)

Uchovávání se řídí plánem, který zahrnuje řízení a administraci všech aktivit kurátorského životního cyklu.

Komunitní dohled a spoluúčast (Community Watch and Participation)

Kurátoři mají přehled o komunitních aktivitách a podílejí se na vývoji sdílených standardů, nástrojů a software.

Kurátorství a uchovávání (Curate and Preserve)

Kurátoři jsou si vědomi všech ochranných a kurátorských aktivit naplánovaných napříč životním cyklem a tyto akce provádějí.

Postupné akce (Sequential actions)
Konceptualizace (Conceptualise)

Promyšlení a naplánování způsobu jakým budou data vytvářena včetně způsobů jejich pořizování a možností pro ukládání.

Vytvoření nebo příjem (Create or Receive)

Vytvoření dat včetně administrativních, popisných, strukturálních a technických metadat. V okamžiku vytvoření mohou být rovněž pořízena metadata o uchovávání.

Příjem dat od tvůrců, z jiných archivů, repozitářů nebo datových center v souladu se zdokumentovanými pravidly pro sběr. V případě potřeby jsou přiřazována příslušná metadata.

Hodnocení a výběr (Appraise and Select)

Vyhodnocení a výběr dat pro dlouhodobé uchovávání podle zdokumentovaných návodů, pravidel nebo zákonných požadavků.

Příjem (Ingest)

Přemístění dat do archivu, repozitáře, datového centra nebo jiného úložiště podle zdokumentovaných návodů, pravidel nebo zákonných požadavků.

Akce uchovávání (Preservation Action)

Provedení aktivit potřebných pro dlouhodobé uchování dat a zachování jejich směrodatné povahy. Akce uchovávání by měly udržováním integrity zajistit, že data zůstanou autentická, spolehlivá a použitelná. Aktivity zahrnují čištění dat, validaci, přiřazení metadat o uchovávání, přiřazení vysvětlujících informací a zajištění vhodné struktury nebo formátu souboru.

Uložení (Store)

Bezpečné uložení dat v souladu s příslušnými standardy.

Přístup, použití a znovupoužití (Access, Use and Reuse)

Zajištění přístupnosti dat jak určeným uživatelům (designated users), tak zájemcům o opětovné použití. Data mohou být publikována veřejně, nebo mohou být aplikovány pravidla a procedury pro kontrolu přístupu a autentizaci.

Transformace (Transform)

Vytvoření nových dat z originálu například migrací do jiného formátu. V případě potřeby (například za účelem publikování) mohou být vytvořeny odvozené podmnožiny dat ručním nebo automatickým výběrem.

Občasné akce (Occasional actions)
Odstranění (Dispose)

Odstranění dat, která nebyla vybrána pro dlouhodobé uchovávání v souladu se zdokumentovanými návody, pravidly nebo zákonnými požadavky.

Obvykle bývají data přemístěna do jiného archivu, repozitáře, datového centra nebo jiného úložiště. V některých případech mohou být data smazána. Povaha dat může z důvodů dodržení zákona vyžadovat bezpečné smazání.

Opětovné hodnocení (Reappraise)

Návrat dat, která neprošla procedurami validace k dalšímu ocenění a výběru.

Migrace (Migrate)

Migrace dat do jiného formátu. Může být provedena pro zajištění shody s prostředím úložiště, nebo jako prevence proti zastaráváním hardwaru nebo softwaru.



[1] V originále je použit termín „data/content lifecycle model“.

[2] Popis modelu podle (DCC Curation Lifecycle Model, 2015).

Records Continuum Model

Records Continuum Model vytvořil Frank Upward z australské Monash University[1]. Upward, který svůj model popisuje jako „časoprostorový konstrukt, nikoliv životní model[2]“ (Upward, 1996) se jeho pojetím snažil vymezit proti tradičním modelům životního cyklu záznamů, které podle něj příliš zdůrazňovaly hranici mezi archiváři a správci záznamů (Lappin, 2012). Podle Xiaomi (2003, s. 27) je role archivářů v tomto modelu proaktivní[3], na rozdíl od tradičních modelů životního cyklu, které je staví spíše do pozice reaktivní. Skutečnost, že tento model pojímá záznam (archivovaný dokument) jako logickou nikoli fyzickou entitu jej podle (tamtéž, s. 28) činí obzvlášť vhodný jako vzor dobré praxe pro správu elektronických záznamů.

Obrázek 2: Diagram znázorňující Records Continuum Model (Upward © 1996 podle Flynn, 2001, s. 82)

Records Continuum Model popisuje dokument, okolnosti jeho vzniku, souvislosti a prostředí, ve kterém se vše odehrává, pomocí os a úrovní.

Úrovně představují vývoj dokumentu, „cestu“ v něm zachycených informací od událostí, které vedou k jeho vzniku uvnitř uzavřeného systému až do chvíle, kdy se stává součástí „kolektivní paměti“.

Osy modelu reprezentují:

-        způsob uchovávání záznamu (Recordkeeping containers);

-        udržitelnost a smysl obsažených informací (Transactionality);

-        identitu a vlastnictví záznamu (Identity);

-        roli záznamu jako stopy a důkazu o událostech a jeho význam v paměti organizace a kolektivní paměti (Evidentiality).



[1] Upward přednášel na Katedře knihovnictví, archivnictví a záznamů a původ modelu a propojení s archivnickou diskurzní komunitou jsou patrné jak z terminologie v modelu samotném, tak v citované literatuře.

[2] „A records continuum is continuous and is a time/space construct not a life model.“

[3] Jako příklad je uvedena možnost ovlivnit podobu archivovaných záznamů ještě před jejich vznikem tím, že se archiváři podílejí na nastavení systémů pro tvorbu dokumentů a zajišťují tak například opatření dokumentů odpovídajícími metadaty.

Týden 2

  1. Řekneme si, co je referenční model OAIS a co vedlo k jeho vzniku.
  2. Vysvětlíme si základní funkce modelu.
  3. Popíšeme si entity modelu a vztahy mezi nimi.
  4. Pokusíme se aplikovat model na digitální archiv fiktivní instituce.
Digitální knihovny – teorie a praxe
Teorie digitálních knihoven s popisem Kahn-Wilenského architektury.
Open Archival Information System (OAIS) Reference Model
Článek Christophera A. Leeho popisující vznik OAIS a důvody, které k němu vedly.

Úvod do OAIS
Český překlad technologické zprávy, která zjednodušeně vysvětluje OAIS.
OAIS: možnosti a limity aplikace
Shrnutí různých přístupů k praktické implementaci OAIS.

Co je OAIS

OAIS[1] představuje jeden z nejdůležitějších standardů, s nimiž se mohou digitální kurátoři při své práci setkat a současně je to také konceptuální a informační model, který dává ucelenou představu o povaze jejich práce.

Hlavním důvodem jeho vzniku byla skutečnost, že neexistoval konsensus o potřebách a požadavcích na dlouhodobé uchovávání digitálních dat. Jednotící rámec, který by mohl vyplnit tuto mezeru, by byl velmi užitečný v tom, že by umožnil dialog a spolupráci mezi účastníky snah o budování standardů, a také by mohl pomoci identifikovat oblasti, kde je standardizace potřebná. 

V roce 1999 byl  publikován draft normy OAIS, která vznikla na popud Mezinárodní organizace pro normalizaci (ISO)  pod záštitou Consultative Committee for Space Data Systems (CCSDS). Původ referenčního modelu OAIS můžeme vysledovat v první polovině 90. let. V té do-bě si instituce začaly uvědomovat, že do té doby všeobecně přijímaný model digitálních knihoven založený na architektuře Kahn-Wilenski nevyhovuje, protože cíleně neřeší budoucí zpřístupnění dat. Základ budoucího referenčního modelu byl tvořen pod zášti-tou CCSDS z toho důvodu, že právě instituce zabývající se vesmírným výzkumem nejvíce narážely na problémy spojené s dlouhodobým uchováváním velkých objemů dat. (Hutař a Melichar, 2013b, s. 16).

Pro pochopení vztahu OAIS a digitálního kurátorství je nutné si uvědomit, že tento referenční model neřeší procesy odehrávající se mimo archiv. Ty jsou součástí jiných fází v rámci životního cyklu digitálního objektu (Hutař a Melichar, 2013b, s. 17).

OAIS představuje společný terminologický a konceptuální rámec pro oblast digitálních archivů. Referenční model pro OAIS je definován standardem ISO 14721:2012, který se problematiky digitálního kurátorství dotýká především v tématech souvisejících s dlouhodobou ochranou digitálních informací. Model poskytuje framework pro

-        popis a porovnávání architektury existujících i budoucích řešení;

-        volbu strategií dlouhodobého uchovávání;

-        porovnání datových modelů digitálních archivů;

-        odhadování změny datových modelů v průběhu času.

Slovo otevřený odkazuje na skutečnost, že referenční model vznikl a byl zveřejněn v otevřeném veřejném fóru, kterého se mohl zúčastnit kdokoli, kdo měl zájem. Otevřený zde tedy neznamená úroveň dostupnosti objektů v archivu, ani se nic takového nepředpokládá.

Archiv podle tohoto referenčního modelu musí:

  • vyjednávat a získávat příslušné informace od jejich tvůrců;
  • získat nad informacemi dostatečnou kontrolu tak, aby byl schopen zajistit dlouhodobé uchování - je potřeba, aby archiv odpovídající OAIS získal dostatečná práva duševního vlastnictví k objektům, které spravuje a musí mít též potřebná práva k provádění kroků nezbytných pro realizaci cílů dlouhodobé ochrany
  • definovat uživatelskou komunitu archivu;
  • zajistit, aby uchovávané informace byly samostatně srozumitelné uživatelské komunitě bez asistence tvůrců informací;
  • následovat zdokumentované politiky a procesy s cílem zajistit ochraňované informace proti všem eventuálním nebezpečím a zabránit neúmyslnému smazání;
  • zpřístupňovat ochraňované informace uživatelské komunitě. 


[1] Open Archival Information System

Funkční model OAIS

Model OAIS popisuje vlastnosti digitálního archivu pomocí šesti základních funkčních celků, které se nacházejí uvnitř systému a tří externích entit, které tvoří jeho okolí.
Externí entity

-        Tvůrci (Producers) jsou lidé, organizace nebo systémy, které předávají archivu informace určené k dlouhodobému uchovávání.

-        Koncoví uživatelé (Consumers) jsou lidé, organizace nebo systémy, které využívají informace uložené v archivu. Speciální podskupinou koncových uživatelů je tzv. určená skupina (Designated Community). Jsou to uživatelé, kterým je obsah archivu určen primárně a kteří jsou schopní jeho informacím porozumět ve formě, ve které je OAIS archiv poskytuje.

-        Vedení (Management) je pověřeno tvorbou, kontrolou a v některých případech i vynucováním pravidel, která zastřešují aktivity OAIS archivu na nejvyšší úrovni.

Funkční celek příjmu (Ingest)

Funkční celek příjmu je sada procesů odpovědných za přijetí informace poskytnuté tvůrci dat a její přípravu k zařazení do úložiště. Zahrnuje validaci dat po přijetí, převod do vhodné formy, extrakci nebo vytvořen popisných metadat a přesun do úložiště.

Funkční celek archivního uložení (Archival Storage)

Další funkční celek je systémová část archivu, která spravuje dlouhodobé úložiště a udržuje digitální materiály svěřené OAIS archivu. Je zodpovědná za to, že archivovaný obsah se nachází v odpovídajícím úložišti a jeho data zůstávají úplná a je možné je poskytovat. Funkce archivního uložení zahrnují i procedury migrace a výměny médií. Tento funkční celek také zajišťuje získávání vyžádaného obsahu.

Funkční celek správy dat (Data Management)

Funkční celek správy dat udržuje databáze popisných metadat, které identifikují a popisují archivované informace. Dále spravuje administrativní data určená pro podporu vnitřních systémů archivu. Slouží jako podpora pro vyhledávání a získávání archivovaného obsahu.

Funkční celek plánování uchovávání (Preservation planning)

Funkční celek plánování uchovávání je služba odpovědná za zmapování strategie dlouhodobého uchovávání a její průběžnou aktualizaci. Služba monitoruje okolí OAIS archivu a v případě nutnosti vytváří doporučení k provedení nezbytných změn v reakci na změny prostředí. Je to pojistka archivu proti neustálým změnám uživatelského a technologického prostředí.

Funkční celek zpřístupnění (Access)

Funkční celek zpřístupnění řídí procesy a služby, které koncovým uživatelům umožňují najít, vyžádat a získat obsah archivu. Zprostředkovává uživatelům služby funkčních celků archivního uložení a správy dat a provádí nezbytné úpravy požadovaného obsahu (například změnu formátu) před jeho poskytnutím.

Funkční celek správy (Administration)

Funkční celek správy je odpovědný za řízení každodenních operací OAIS archivu a koordinaci zbývajících pěti funkčních celků. Dalším jeho úkolem je interakce s tvůrci, koncovými uživateli a vedením. Je to ústředí celého archivu, které komunikuje směrem dovnitř i ven. 

Informační model OAIS

Informační model OAIS je založen na konceptu informačního balíčku: popisuje uspořádání informací při pohybu archivačním systémem, při vstupu do něj, průchodem a výstupu z něj.

  • Submission Information Package vstupuje do archivačního systému
  • Archival Information Package je předmětem dlouhodobého uchovávání
  • Dissemination Information Package je určen koncovým uživatelům

Balíčky SIP, AIP a DIP jsou informačními objekty, které jsou vkládány, spravovány a zveřejňovány archivem odpovídajícím OAIS. Předmětem dlouhodobého uchovávání je však AIP – Archivní Informační Balíček.  

AIP ztělesňuje přísnější výklad pojmu informační balíček, protože musí obsahovat kompletní soubor metadat nutných k zajištění dlouhodobého uchování a zpřístupňování obsahu Určené Skupině. Referenční model popisuje jednotlivé typy metadat, která by měla být součástí archivované informace.

Informační balíček se skládá z objektu, který je předmětem ochrany a z metadat nutných pro zajištění dlouhodobého uchovávání, zpřístupnění, včetně srozumitelnosti.

Informační objekt je tvořen kombinací Datového objektu (bit-stream) a Vysvětlující informace, která umožňuje jeho interpretaci a použití.

Vysvětlující informaci můžeme rozdělit na dva typy:

  1. Informace o Uspořádání (Structure Information) je v kontextu digitálních objektů snadno pochopitelná, odkazuje na mapování mezi digitálními bity a různými koncepty a datovými strukturami, které umožňují načíst bity do srozumitelné informace – například jako obrázek, text nebo interaktivní program. Obecně řečeno, Informace o Uspořádání popisuje formát digitálního objektu.
  2. Informace o Významu (Semantic Information) na druhou stranu objasňuje význam nebo poskytuje odpovídající interpretaci Datového Objektu s Obsahem. Příkladem Informací o Významu jsou glosář, datový slovník nebo dokumentace k softwarové aplikaci.
  3. Referenční model také definuje zbytkovou kategorii Ostatní Vysvětlující Informace (Other Representation Information), která zahrnuje Vysvětlující Informace, jež nejsou snadno definovatelné jako Informace o Uspořádání nebo Informace o Významu

Vysvětlující Informace je nezbytná pro zobrazení a porozumění bitům, které tvoří Datový Objekt s Obsahem. Vysvětlující Informace může obsahovat popis hardwarového a softwarového prostředí potřebného k zobrazení Datového Objektu s Obsahem nebo k zpřístupnění jeho obsahu. Může také shrnovat postup interpretace Datového Objektu s Obsahem.

Sítě Vysvětlujících Informací jsou vnořené řetězy informací tvořící kontext, který Určené Skupině postačuje k porozumění Datovému Objektu s Obsahem a jeho doprovodným Vysvětlujícím Informacím. Teoreticky mohou Sítě Vysvětlujících Informací obsahovat nekonečnou regresi vedoucí k absurdním koncům.

V praxi pochopitelně OAIS archiv Sítě Vysvětlujících Informací v nějakém bodě zastaví. Tam, kde je možné předpokládat rozumnou míru znalosti u Určené Skupiny. Lze například předpokládat, že členové Určené Skupiny rozumí anglicky. Referenční model OAIS popisuje tuto předpokládanou znalost Určené Skupiny jako Znalostní Základnu (Knowledge Base).

Formáty informačního balíčků

Jednotlivé platformy digitálních archivů (ve smyslu kombinace hardware a software) mohou pro dlouhodobé uchovávání AIP používat různé formáty AIP. Pro zjednodušení interoperability archivů byly vytvořeny univerzální formáty, z nichž ty nejznámější jsou METS a Bagit.

METS měl usnadnit výměnu digitálních objektů a podpořit interoperabilitu mezi systémy digitálních knihoven a podporovat dlouhodobou archivaci objektů v digitálních knihovnách. Byl zamýšlen jako standard pro kódování potenciálních Vstupních Informačních Balíčků (SIP), Archivních Informačních Balíčků (AIP) a Výstupních Informačních Balíčků (DIP) z referenčního modelu OAIS.“

Dokument METS pro digitální objekt obsahuje sebepopisující hlavičku, popisná metadata k objektu, administrativní metadata (přesněji řečeno technická metadata, metadata přístupových práv, metadata o analogové předloze digitálního objektu, metadata o původu objektu), seznam souborů tvořících objekt, strukturální mapu všech komponentů digitálního objektu, seznam odkazů, které vyjadřují vztahy mezi komponenty strukturální mapy a seznam „chování“, která mohou s digitálními objekty souviset. 

Bagit je formát archivního balíčku vytvořený společným úsilím americké Kongresové knihovny a Digitální knihovny Kalifornie. Jedná se o hierarchický souborový archivační formát určený pro výměnu obecného digitálního obsahu. „Bag“ obsahuje pouze nezbytnou strukturu zahrnující vlastní digitální obsah, tzv. „payload“ a „tagy“ které jej popisují. 

Pro větší efektivitu při přenosu dat mohou být fyzické soubory v payloadu nahrazeny referencemi na internetové úložiště.

Týden 3

  1. Povíme si, jak model OAIS souvisí s významnými vlastnostmi
  2. Představíme si framework InSPECT
  3. Zkusíme zjistit, jak poznáme, co je významné
  4. A jak to zapíšeme pomocí metadat

Závěrečná zpráva projektu InSPECT
Shrnutí projektu zaměřeného na metodické určování významných vlastností a jeho výstupů

Framework InSpect
Detailní popis frameworku pro určování významných vlastností
Significant Properties, Authenticity, Provenance, Representation
Článek Davida Giaretty o významných vlastnostech z pohledu modelu OAIS.
PREMIS Data dictionary
Standard pro metadata uchovávání s podporou pro definici významných vlastností.
Testovací zprávy projektu InSPECT
Určování významných vlastností  audiozáznamů, strukturovaného textu, rastrových obrazů a e-mailů.

Týden 4

  1. Zamyslíme se nad tím, co je nutné zvážit při návrhu digitálního archivu
  2. Představíme si různé strategie pro dlouhodobou ochranu
  3. A také jejich výhody a nevýhody
  4. Na závěr se pokusíme zjistit, které jsou vhodné pro náš archiv
Thirteen Ways of Looking at… Digital Preservation
Přehled hlavních aspektů, které je vhodné zvážit při návrhu archivu.
Dlouhodobá digitální archivace: Přehled a úvod do problematiky
Shrnutí základních strategií dlouhodobého uchovávání, jejich výhod i nevýhod.
Digital Preservation Guidance Note 1: Selecting file formats for long-term preservation
Jak správně postupovat při výběru vhodných formátů pro archivaci.

Týden 5

  1. Zopakujeme si důležité standardy týkající se dlouhodobého uchovávání
  2. Vysvětlíme si základní kategorie nástrojů, se kterými pracuje digitální kurátor
  3. Projdeme nejdůležitější nástroje a popíšeme si jejich použití
  4. Zamyslíme se nad tím, jak vybrat ty vhodné
Nástroje pro digitální archivaci
Článek Jana Hutaře a Marka Melichara shrnující základní problematiku standardů a nástrojů.

Evaluation of characterisation tools
Přehled nástrojů a posouzení jejich schopností vypracovaný v rámci projektu SCAPE.
Přehled používaných nástrojů
Seznam publikovaný na webu digitalpreservation.cz.
Normy v oblasti dlouhodobého uchovávání
Přehled formálních standardů na stránkách LTP Portál.

Týden 6

  1. Opakování - framework inSpect
  2. Připojení ke vzdálenému serveru pomocí Putty
  3. Nástroje pro identifikaci, popis a konverzi souborů
  4. Nástroje pro vytváření a validaci metadat

      Týden 7

      1. Shrneme si, jak postupovat při vytváření archivu
      2. Povíme si, jak se dají popsat procesy a požadavky
      3. Vrátíme se (opět) k určeným skupinám a významným vlastnostem
      4. Zamyslíme se nad tím, co do našeho archivu patří a jak to poznáme
      5. Zkusíme se dopátrat toho, jak vypadají ty správné balíčky
      DPC Handbook
      Průvodce při návrhu a správě digitálního archivu
      How (and Why) to Write Great User Stories
      Vysvětlení, co jsou user stories a jak je používat
      Agile User Story Template
      Šablona pro vytváření user stories v Excelu
      BPMN
      Stručné vysvětlení, co je BPMN a jak se používá
      BPMN Fast Guide
      Přehled Business Process Model and Notation
      draw.io
      Nástroj pro vytváření (nejen) BPMN modelů
      Instalment on “Appraisal and Selection”
      Materiál k hodnocení a výběru podle DCC lifecycle
      DPC Decision Tree
      Pomůcka při rozhodování o výběru

      POWRR Tool Grid
      Vyčerpávající přehled nástrojů pro dlouhodobou ochranu

      Týden 8

      1. Povíme si, proč je komunikace důležitá v práci digitálního kurátora
      2. Zjistíme, kdo jsou stakeholdeři a jak je poznat
      3. Zopakujeme si zásady pro úspěšné prezentování
      4. Představíme si důležité komunitní aktivity
      Advocacy of digital preservation
      Shrnutí od Digital Preservation Coalition
      POWRR Webinar on Advocacy & Policy
      Identifikace a vzdělávání stakeholderů a členů týmu
      How to write a lay summary
      Inspirace pro psaní shrnujících reportů
      Jak připravit prezentaci a jak prezentovat
      2 x 10 tipů pro lepší prezentace

      Jak nemá vypadat prezentace
      Video shrnující nejčastější nedostatky prezentací


      digitalbevaring.dk
      Kolekce ilustrací bezprostředně souvisejících s digital preservation šířená pod licencí Creative Commons

      Týden 9

      1. Vysvětlíme si, k čemu je digitálním kurátorům znalost projektového managementu.
      2. Představíme si základní postupy a nástroje projektového řízení.
      3. Podíváme se na plánovací nástroj PLATTER.
      4. A vyzkoušíme si ho na našem fiktivním repozitáři.
      VÝKLADOVÝ SLOVNÍK POJMŮ
      Terminologie projektového řízení podle IPMA
      Průvodce plánem důvěryhodného repozitáře
      Český překlad příručky pro PLATTER
      Prezentace PLATTER
      Úvodní přehled informací o PLATTER

      Týden 10

      Opakování, otázky a odpovědi

      1. Struktura informačního balíčku
      2. Digitální objekt vs. metadata
      3. Procesy spojené s archivem

      Týden 11

      Týden 11

      Obsah není zveřejněný.

      Týden 12

      Návrh digitálního archivu

      Připravte stručný dokument s popisem návrhu vašeho fiktivního repozitáře. Inspirujte se dostupnými vzory, které popisují architekturu repozitáře, práci s digitálními objekty, určenou skupinu, strategie, nástroje a všechno ostatní, co jste průběžně dělali ve svých úkolech. 

      Dokument opatřete titulní stranou, krátkým úvodem (manažerským shrnutím) a obsahem. V dokumentu by dále neměly chybět následující informace:

      1. Popis instituce, která archiv provozuje
      2. Identifikace a stručný popis procesů. stakeholderů a určené skupiny
      3. Popis digitálních objektů, které budou v archivu obsaženy a obvyklého způsobu jejich získávání a využívání
      4. Popis zvolené strategie dlouhodobého uchovávání
      5. Popis archivu strukturovaný podle OAIS a používající příslušou terminologii
        1. Okolí archivu
        2. Funkční celky
        3. Informační balíčky
      6. Seznam nástrojů a vysvětlení proč a jak budou používány

      Prezentace

      Připravte krátkou prezentaci (maximálně 10 minut), ve které svůj repozitář představíte, shrnete jeho zásadní charakteristiky a zejména se zaměříte na kurátorský přístup k dlouhodobé ochraně. Zaměřte se na zdůraznění toho, jakým způsobem jsou aplikovány hlavní znaky kurátorství, jaké z toho vyplývají výhody a jaká jsou případná rizika a úskalí.

      Odevzdávárny
      Domácí úkoly, sběr souborů.
      Týden 13

      Týden 13

      Obsah není zveřejněný.