Máte zapnutý náhled celé osnovy, zpět na běžné zobrazení.
Načítání a prohlížení osnovy může být v závislosti na množství obsahu pomalejší.
Týden 1
- Představíme si digitální kurátorství jako etablovaný transdisciplinární obor
- Seznámíme se s jeho historií
- Povíme si, co je to kurátorský životní cyklus DCC
- Vysvětlíme si, co dělá digitální kurátor a co všechno by měl znát
Co je digitální kurátorství
Termín digitální kurátorství byl poprvé použit v roce 2001 v
názvu semináře Digital Curation: digital
archives, libraries and e-science seminar
(Beagrie, 2006,
s. 4). Na tomto semináři pořádaném organizacemi Digital Preservation Coalition
a British National Space Centre se setkali zástupci řady oborů, aby společně diskutovali
o nejnovějším vývoji v oblasti dlouhodobého uchovávání dat. Podle
samotných účastníků vedl seminář k zahájení důležitého mezioborového dialogu
mezi archiváři, specialisty na knihovní a informační management a správci dat (Beagrie
a Pothen, 2002). Důležitým příspěvkem k tomuto úspěšnému
dialogu byla volba pojmu digitální
kurátorství (digital curation) pro název semináře. Nový termín těžil
z výhod pojmu kurátorství, zažitého jak v oboru knihovnictví a muzejnictví,
tak v biologických vědách – ve všech těchto oblastech kurátorství
představuje nejen ochranu a údržbu sbírek nebo databází, ale také určitou
přidanou hodnotu a znalosti. Důvodem k prosazování nového pojmu byla
snaha přenést do digitálního prostředí kurátorské postupy používané
v muzeích a archivech a současně upozornit na nutnost změn těchto
přístupů, která vyplývá z rozdílu mezi fyzickými a digitálními artefakty (Beagrie,
2006, s. 5).
David Giaretta, jeden z lidí, kteří hráli zcela zásadní
roli při zrodu nového oboru, reagoval na počáteční zmatení kolem výkladu toho,
co vlastně digitální kurátorství znamená vytvořením vlastní definice, podle níž
se „v širším pojetí jedná o udržování a přidávání hodnoty důvěryhodnému
jádru digitálních informací pro současné a budoucí použití[1]“
(Giaretta,
2008).
S přidáváním hodnoty se můžeme setkat také
v definici na stránkách Digital Curation Centre: „Digitální kurátorství
zahrnuje správu, ochranu a zhodnocení digitálních výzkumných dat během jejich
životního cyklu[2]“
(What is
digital curation?, 2015).
Abbottová (2008)
popisuje digitální kurátorství jako aktivity zapojené do správy dat od plánu
jejich tvorby přes návody na digitalizaci a dokumentaci až po zajištění jejich
dostupnosti a připravenosti pro budoucí využití.
Vedle těchto definic, jejichž původ můžeme vysledovat ve
světě vědeckých a paměťových institucí, existuje ještě další pohled na
digitální kurátorství. Ten souvisí se stále větším objemem dat (často
multimediálních), která jsou publikována na internetu formou uživateli
spravovaného obsahu. Ačkoliv se v této souvislosti častěji hovoří o obsahovém kurátorství (Rosenbaum,
2010), Erin Scime (2009)
používá označení digitální kurátor právě pro zdůraznění pojítek s fyzickým
kurátorstvím. Kurátorem se podle ní stává ten, kdo „formuje sbírku vytvořením
zastřešující strategie, která definuje, jak by měl být obsah organizovaný,
umístěný a učiněný relevantním[3]“.
V podobném smyslu používá pojmy digitální kurátorství a digitální kurátor
v sérii článků zaměřených na obsahové kurátorství ve vzdělávání také Černý[4]
(2014).
Další důležité pojmy
V literatuře se můžeme setkat i s dalšími pojmy,
které s digitálním kurátorstvím souvisejí a mezi kterými je občas obtížné
rozlišit. Na nejasnost v oblasti terminologie upozorňuje Giaretta (2008),
který zdůrazňuje, že je nutné pojmy používat tak, aby nedošlo ke zmatení
čtenáře, a navrhuje následující rozdělení[5]:
-
Uchovávání
dat (data preservation): obecný termín, který je v daném kontextu
ekvivalentní k termínu digitální uchovávání.
-
Digitální
uchovávání (digital preservation): zajištění přístupnosti originálních
„bitů a bajtů“.[6]
-
Uchovávání
digitálních informací (digital information preservation): představuje to,
k čemu se odkazuje OAIS[7]
standard – důležité nejsou originální „bity a bajty“, ale obsah.
-
Kurátorství
(curation): obecný termín – pečování o věci.
-
Datové
kurátorství (data curation): péče o data a přidávání hodnoty.
-
Digitální
kurátorství (digital curation): péče o digitální data a přidávání hodnoty,
které pravděpodobně předpokládá vytváření nových dat z těch existujících,
aby byla zajištěna větší užitečnost a vyhovění jejich účelu.
Vztah digitálního kurátorství a dlouhodobé ochrany dat
V anglicky psané literatuře je termín digital curation (digitální kurátorství)
velmi často používán v souvislosti s pojmy digital
preservation (digitální uchovávání) a long
term preservation[8]
(dlouhodobé uchovávání) a může s nimi být někdy nesprávně zaměňován.
Pro správné pochopení vztahu mezi uchováváním a kurátorstvím
pomůže rozdělení, které použili Lord a Macdonaldová (2004, s. 3):
-
Kurátorství:
Aktivita správy a poskytování dat od okamžiku jejich vzniku pro zajištění toho,
aby plnila svůj účel a aby byla dohledatelná a znovu použitelná. Pro dynamická
data to znamená průběžné obohacování nebo aktualizování, aby vyhovovala svému
zamýšlenému účelu.
-
Archivace:
Kurátorská aktivita, která zajišťuje, že data jsou správně vybrána, uložena a
mohou být zpřístupněna a že jejich logická i fyzická integrita je průběžně
udržována a to včetně bezpečnosti a autenticity.
-
Uchovávání:
Archivační aktivita, při níž jsou specifické datové jednotky průběžně udržovány
tak, aby mohly být přístupné a pochopitelné navzdory neustálé změně a zastarávání
technologií.
Podle definice Neila Beagrieho v příručce vydané Digital
Preservation Coalition[9]
je digitální uchovávání „řada řízených aktivit nezbytných k zajištění
kontinuálního přístupu k digitálním materiálům po tak dlouhou dobu, jak je
nutné[10]“
(Preservation
Management of Digital Materials, 2008).
V podobném duchu definují Hutař a Melichar (2013b)
dlouhodobé uchovávání. Podle nich se jedná o „soubor aktivit a postupů, jejichž
cílem je zajistit použitelnost, vyhledatelnost, dostupnost a autenticitu
digitálního obsahu v průběhu času“. Tito autoři ve své práci používají
popisnější termín dlouhodobá ochrana
digitálních informací[11].
Z pohledu definic jsou tedy pojmy „digitální uchovávání“
a „dlouhodobé uchovávání“ téměř shodné a vzájemně zaměnitelné[12].
Nejsou však zaměnitelné s digitálním kurátorstvím, které můžeme chápat jako
nadstavbu dlouhodobého uchovávání. Důležitou součástí kurátorství je podle
Giaretty (2008) přidávání hodnoty, aby uchovávaná data časem neztrácela svůj původní
účel, což je aspekt, který se v dlouhodobém uchovávání nevyskytuje.
Digitální stewardství
V některých zdrojích se setkáváme také s označením
digital stewardship, tedy digitální
stewardství. Tento termín je rozšířený zejména ve Spojených státech, kde
významnou roli v oblasti dlouhodobé ochrany digitálních informací hraje
National Digital Stewardship Alliance, konsorcium založené Knihovnou Kongresu[13]
(National Digital Stewardship
Alliance, [b. r.]).
Podle Lazorchaka (2011)
má tento termín kořeny v environmentalistické komunitě, jejíž myšlenky
uchovávání zdrojů pro budoucí generace našly odezvu i mezi ochránci digitálních
informací. Lazorchak tvrdí, že stewardství uspokojivě spojuje dlouhodobé
uchovávání s kurátorstvím a rozšiřuje důraz původně kladený na vědecká
data i na všechny ostatní druhy digitálních materiálů.
Pojmu stewardství dává přednost i Bastianová et al. (2011),
protože podle jejího názoru lépe vystihuje celou šíři činností a problémů, s
nimiž se kurátoři setkávají. Odvolává se při tom na původní významy obou pojmů
– zatímco kurátor je spíše „dozorce“, steward je nejen „dozorce“, ale také „opatrovník[14]“.
V českém jazykovém prostředí se s pojmem digitální stewardství běžně nesekáváme a proto se tato práce bude držet termínu kurátorství, který je diskurzní komunitou obvykle chápán v takové šíři záběru, s jakou Bastianová a Lazorchak definují stewardství [15].
[1] „Digital
curation, broadly interpreted, is about maintaining and adding value to, a
trusted body of digital information for current and future use.“
[2] „Digital
curation involves maintaining, preserving and adding value to digital research
data throughout its lifecycle.“ Překlad Pavla Švástová.
[3] „...the
content strategist-as-curator works to reframe the collection by creating an
overarching strategy that defines how content should be organized, positioned,
and made relevant...“
[4]
V těchto článcích se objevují i další podoby kurátorů: informační, online,
datový, digitální informační...
[5] Podle
(Giaretta, 2008).
[6] Je na
místě poznamenat, že většina autorů chápe pojem digital preservation
komplexněji, spíše podle Beagrieho definice uvedené dále v textu.
[7] Open Archive Information System – referenční
model digitálního archivu, který je standardizován v mezinárodní normě ISO
14721.
[8]
S tímto termínem se můžeme setkat v textu normy ISO 14721 a také v
souvislosti s informačními systémy a softwarovými nástroji určenými pro
dlouhodobou ochranu digitálních informací.
[9] Britská organizace,
jejímž cílem je rozvoj v oblasti digitálního uchovávání. Mezi její členy
patří významné vysoké školy, státní instituce, paměťové a akademické instituce.
[10]„Digital
Preservation Refers to the series of managed activities necessary to ensure
continued access to digital materials for as long as necessary.“
[11] V době,
kdy vznikala citovaná práce, neexistovala zavedená česká terminologie a použití
delšího a popisnějšího překladu bylo logické i s ohledem na zdůraznění
rozdílu mezi prostou archivací digitálních dat a promyšlenou dlouhodobou
ochranou.
[12] V práci
bude nadále používán termín „dlouhodobá ochrana digitálních informací“
tam, kde původní kontext použití termínu naznačuje větší přesah směrem do
oblasti kurátorství a „dlouhodobé uchovávání“ zejména tam, kde se bude text
vztahovat k zavedeným normám a standardům, neboť s tímto termínem pracuje
český překlad normy ISO 14721.
[13] Library
of Congress – http://www.loc.gov/
[14]
V originále „overseer“ a „keeper“.
[15] Tato
skutečnost byla autorem ověřena při práci na projektu LTP-pilot, jehož cílem
bylo získání zkušeností v nízkonákladovém řešení dlouhodobé ochrany
digitálních informací pilotní implementací systému Archivematica a jeho
evaluací mimo jiné také z pohledu potřeb digitálního kurátorství.
Historické souvislosti
Ačkoliv sám pojem digitální kurátorství je poměrně mladý,
problematika, k níž se vztahuje, sahá více do minulosti. V roce 1990 byl
poprvé použit termín digital preservation
v souvislosti s projektem knihovny Cornellovy univerzity a společnosti
Xerox, který měl za cíl využít digitální technologie v rámci procesu uchování
analogových médií (Hirtle, 2010, s. 124 cit. podle Tibbo,
2012, s. 188).
V roce 1994 vytvořily Commision on Preservation and Access
(CPA)[1]
a Research Libraries Group[2]
pracovní skupinu Task Force on Archiving of Digital Information[3],
aby prozkoumala možnosti nepřetržitého a časově neomezeného přístupu k záznamům
uloženým v digitální elektronické podobě.
Skupina byla složená z osobností z akademické sféry,
průmyslu, muzeí, archivů a knihoven, nakladatelství, školství a vládních
organizací. Byla pověřena popsáním hlavních problémů spojených s přístupností
digitálních záznamů. (Preserving Digital Information, 1996, s. iii)
Její závěrečná zpráva nazvaná Ochrana digitálních informací[4]
je považována za první významný příspěvek v oblasti digitálního
kurátorství. Zpráva se mimo jiné zabývala vizí vybudování národní technologické
infrastruktury pro digitální archiv zajištující dlouhodobé uchování národního
kulturního, ekonomického a společenského dědictví. Šest z devíti doporučení pro
CPA uvedených v této zprávě se však netýkalo technologií. Tato doporučení se
zaměřovala na problematiku metodik a koncepčních návrhů při tvorbě digitálních
archivů. Závěrečná zpráva zdůrazňující nutnost vyvážení technických a
netechnických aspektů dlouhodobého uchovávání se stala základem a inspirací pro
mnoho pozdějších aktivit a iniciativ v této oblasti (Tibbo, 2012; Preserving Digital
Information, 1996).
V polovině devadesátých let vznikla řada vysokoúrovňových
aktivit zaměřených na problematiku dlouhodobého uchovávání také ve Velké
Británii. Na workshopu o dlouhodobém uchovávání elektronických materiálů,
pořádaném v rámci programu eLib[5]
na univerzitě ve Warwicku, byly prezentovány první výstupy americké Task Force on Archiving of Digital
Information. Workshop upozornil na množství problémů vztahujících se k dlouhodobé
ochraně digitálních informací. Joint Information Systems Committee[6]
(JISC) následně zadal vypracování osmi studií dozorovaných nově vytvořenou
pracovní skupinu Digital Archiving
Working Group[7].
Syntéza těchto studií[8]
pak dospěla k závěru, že existuje potřeba po zvýšení povědomí, spolupráci mezi
organizacemi a vylepšených strategiích, guidelines a checklistech (Higginsová,
2011, s. 79).
V roce 1999 se uskutečnil na Univerzitě ve Warwicku druhý workshop,
zaměřený na uchovávání informací z výzkumu. Na základě doporučení z tohoto
workshopu byl vytvořen JISC Digital
Preservation Focus, který měl koordinovat a šířit výzkum a zkušenosti mezi
vysokými školami ve Velké Británii. V roce 2001 následovalo vytvoření Digital
Preservation Coalition[9]
– organizace sdružující řadu institucí, jejímž cílem bylo vytvoření britské
koncepce pro dlouhodobou ochranu digitálních informací v mezinárodním kontextu.
(Higginsová, 2011, s. 80; Beagrie, 2006, s. 4-6).
Téhož roku byl také publikován draft normy OAIS, která
vznikla na popud Mezinárodní organizace pro normalizaci[10]
pod záštitou Consultative Committee for Space Data Systems (CCSDS). Původ
referenčního modelu OAIS můžeme vysledovat v první polovině 90. let. V té
době si instituce začaly uvědomovat, že do té doby všeobecně přijímaný model
digitálních knihoven založený na architektuře Kahn-Wilenski nevyhovuje, protože
cíleně neřeší budoucí zpřístupnění dat. Základ budoucího referenčního modelu
byl tvořen pod záštitou CCSDS z toho důvodu, že právě instituce zabývající
se vesmírným výzkumem nejvíce narážely na problémy spojené s dlouhodobým
uchováváním velkých objemů dat. (Hutař a
Melichar, 2013b, s. 16).
Je zřejmé, že na přelomu tisíciletí byla problematika
uchovávání a zpřístupnění digitálních materiálů chápána v širším kontextu, než tomu
bylo dříve. Uskutečnil se seminář Digital
Curation: digital archives, libraries and e-science seminar zmíněný v
předchozí kapitole a pomalu se začalo vžívat nové označení pro činnosti, které
se zaměřují nejen na dlouhodobé uchovávání dat, ale také na dlouhodobou ochranu
jejich užitečnosti a použitelnosti – digitální kurátorství.
Ve Spojených státech byl v roce 2001 zahájen National Digital Information Infrastructure
and Preservation Program. Pod záštitou Knihovny Kongresu se tento dodnes
trvající program zaměřil na získávání, ochranu a zpřístupnění významného digitálního
obsahu, vytvoření celonárodní partnerské sítě a vývoj technické infrastruktury
nástrojů a služeb pro podporu dlouhodobé ochrany digitálních dat (Library of
Congress, [b.r.]).
Z iniciativy JISC bylo v roce 2004 založeno Digital Curation
Centre (DCC). Jeho vytvoření bylo doporučeno o rok dříve ve zprávě o nutnosti
kurátorství pro e-science[11]
(Lord a Macdonald, 2003). V této zprávě byly pro chystané centrum definovány
následující cíle:
-
zahájení výzkumného programu věnovaného širším
souvislostem datového kurátorství;
-
vytvoření mezinárodního centra pro vývoj
nástrojů a technik pro dlouhodobé, bezpečné datové kurátorství;
-
vývoj spolehlivého a udržitelného repozitáře nástrojů,
software a dokumentů pro podporu kurátorství, dlouhodobé ochrany digitálních
informací a použití digitálních zdrojů;
-
vývoj testovacího prostředí a certifikace pro
systémy, nástroje a kurátorské služby;
-
pilotní vývoj služeb pro zaznamenávání a monitorování
souborových formátů a nástrojů, které budou tyto služby využívat;
-
poskytování poradenských služeb a tvorba
kurátorské dobré praxe.
Ve stejné době, kdy se rozbíhala činnost DCC, vzniklo na základě
doporučení pracovní skupiny Task Force Permanent Access sdružení evropských
vědeckých a akademických institucí nazvané Alliance for Permanent Access (APA),
jehož činnost se zaměřuje zejména na dlouhodobé uchovávání výsledků a dat
získaných při výzkumu.
V letech 2006 - 2010 byla z šestého rámcového programu
EU financována řada projektů zaměřených na rozvoj nástrojů a metodologií v
oblasti dlouhodobé ochrany digitálních informací. Jednalo se například o
projekty Digital Preservation Europe (DPE), CASPAR a PLANETS (Higginsová, s. 81).
Digital Preservation Europe byl projekt probíhající v letech
2006 – 2009, který byl zaměřen na podporu spolupráce mezi různými národními
iniciativami v rámci Evropského výzkumného prostoru. DPE vzniklo z potřeby
zlepšit koordinaci a spolupráci v rámci různých aktivit cílených na efektivní
uchovávání digitálních materiálů (About
DPE, 2006).
Cílem projektu DPE bylo[12]:
-
zvýšení povědomí o dlouhodobé ochraně
digitálních informací;
-
propagace schopnosti členských států postupovat
společně v aktivitách týkajících se dlouhodobé ochrany digitálních informací;
-
kooperace, která měla zabránit zbytečnému a
zdvojenému úsilí;
-
výběr a zavádění certifikovaných a
kontrolovatelných standardů pro procesy dlouhodobé ochrany digitálních
informací;
-
rozvoj kompetencí prostřednictvím vzdělávacích
balíčků;
-
koordinace a sdílení výsledků výzkumu;
-
příprava a popularizace plánů výzkumu;
-
pomoc občanům i odborníkům související s rolí dlouhodobé
ochrany digitálních informací.
Těžiště činnosti DPE se nacházelo zejména v koordinaci a
přípravě metodik a nástrojů, které byly dávány k dispozici zájemcům o
problematiku dlouhodobé ochrany digitálních informací a digitálního
kurátorství.
PLANETS[13]
byl čtyřletý projekt zahájený v roce 2006. Měl za cíl vytvoření praktických
služeb a nástrojů, které měly pomoci zajistit dlouhodobý přístup ke kulturnímu
a vědeckému bohatství v digitální podobě (About Planets, 2007). V
rámci projektu byl mimo jiné vytvořen softwarový nástroj Plato, který slouží
pro tvorbu plánů dlouhodobého uchovávání a který je nadále vyvíjen a spravován Technickou
univerzitou ve Vídni.
CASPAR[14]
byl integrovaný projekt spolufinancovaný Evropskou unií, který probíhal rovněž
v letech 2006 – 2009. Jeho hlavním posláním bylo praktické ověření
referenčního modelu OAIS a rozvoj technik pro práci s vysvětlujícími
informacemi[15].
Dále se projekt zabýval rozvojem nástrojů a technik pro dlouhodobé uchovávání
digitálních zdrojů nezávisle na změnách technologií a architektury. Mezi
výstupy projektu CASPAR se vedle případových studií nacházely také metodické
frameworky a konceptuální modely pro podporu systémového přístupu k
problematice dlouhodobého uchovávání (CASPAR,
[b.r.]).
V roce 2007 vstoupilo do druhé fáze své činnosti DCC a zaměřilo
se více na kurátorství výzkumných dat a s tím spojené výzvy. V té době vznikl
DCC model kurátorského životního cyklu, který popisoval aktivity nutné pro
úspěšné kurátorství. (Higginsová, 2011, s. 82)
Na druhé straně Atlantiku se ve stejném období objevila
významná aktivita zaměřená na vzdělávání digitálních kurátorů – na University
of North Carolina at Chapel Hill (UNC) byl zahájen projekt DigCCurr, který dal později
vzniknout komplexnímu otevřenému vysokoškolskému kurikulu. (About
DigCCurr I, [b.r.])
Na konci první dekády druhé tisíciletí lze již digitální kurátorství
považovat za etablovaný obor. V různých formách, které zahrnují vývoj nástrojů
a platforem, výzkumnou činnost i vzdělávání, se mu věnovala řada
institucí. V této době vznikly mimo jiné The University of California Curation
Center (označované jako UC3) nebo The Digital Curation Institute na
University of Toronto (Higginsová, 2011, s. 83). Do druhé fáze vstoupil projekt
DigCCurr, který se soustředil na vytvoření mezinárodního kurikula a vzdělávací
sítě pro doktorandské studium digitálního kurátorství. V rámci projektu byl
vytvořen portál Digital Curation Exchange[16],
který propojuje odborníky z praxe, výzkumníky, pedagogy a studenty
digitálního kurátorství. (About DigCCurr II, [b.r.])
Na projekt PLANETS navázala v roce 2010 Open Planets
Foundation[17],
která zastřešila vývoj open-source programů používaných při dlouhodobém
uchovávání. Mezi těmito programy najdeme například JHOVE určený pro
identifikaci, validaci a charakterizaci digitálních objektů, nebo FIDO, který umožňuje
identifikovat formát digitálního objektu[18]
(About US, [b.r.]).
Ve stejném roce byl z programu DaVinci financovaného
Evropskou unií zahájen projekt Digital Curator Vocational Education Europe,
jehož cílem bylo vytvoření evropského frameworku pro další odborné vzdělávání[19]
v oblasti digitálního kurátorství (About Digital Curator
Vocational Education Europe, 2010).
Ze sedmého rámcového programu EU byl podpořen projekt SCAPE
orientovaný na rozsáhlé heterogenní archivy komplexních digitálních objektů.
V rámci projektu, který byl ukončen v roce 2014, vznikla
infrastruktura, nástroje a metodiky pro částečně automatizovanou škálovatelnou
ochranu. Mezi úspěšné výstupy projektu patří například sada softwarových
nástrojů Digital Preservation Toolkit[20],
nebo aplikace Plato[21]
pro podporu rozhodování při plánování důvěryhodných digitálních repozitářů (SCAPE,
2014).
Období po roce 2011 nejlépe vystihuje titulek „Curation Goes
Mainstream“ z práce Sarah Higginsové (2011, s. 83). Po předchozí éře poměrně
bouřlivého vývoje a vzniku nových konceptů došlo v té následující
k jistému útlumu a aktivity se soustředí spíše na šíření a praktickou
aplikaci postupů, metodik a modelů vzniklých dříve. Zajímavá iniciativa se
objevila v roce 2012, kdy pracovníci paměťových institucí státu Illinois
vytvořili pod tlakem vyvolaným neustálými škrty v rozpočtech projekt POWRR[22].
Tento projekt se specializuje na hledání způsobů, jak dlouhodobou ochranu
digitálních informací řešit s minimálními náklady (About POWRR,
2014).
V roce 2015 mezi nejvýznamnější organizace a instituce,
které svojí činností aktivně přispívají k rozvoji digitálního kurátorství,
patří například:
-
Digital Curation Centre, které se nachází ve
třetí fázi své existence a zaměřuje se především na šíření kurátorské dobré
praxe v oblasti terciárního školství;
-
Alliance for Permanent Access[23],
která nabízí celou řadu networkingových i vzdělávacích aktivit a soustředí se
především na uchovávání dat z vědeckého výzkumu;
-
Digital Preservation Coalition má hlavní těžiště
své činnosti v oblasti osvěty a šíření informací;
-
Open Preservation Foundation kromě vývoje
open-source nástrojů také buduje aktivní komunitu a přispívá k výměně informací;
-
Digital Curation Exchange slouží jako centrum
pro výměnu informací týkajících se vzdělávání;
-
Library of Congress[24],
která zastřešuje projekty, aktivity a sdružení v oblasti vzdělávání a
šíření dobré praxe;
-
nestor[25],
německá kompetenční síť aktivní v oblasti standardů, vzdělávání a výměny
informací;
-
Impact Centre of Competence in Digitisation[26],
které se věnuje digitalizaci.
[1] Americká
organizace založená v roce 1986 za účelem ochrany kulturního dědictví: http://www.clir.org/about/history
[2] Sdružení
amerických knihoven založené v roce 1974: http://www.oclc.org/research/partnership/history.html?urlm=160971
[3] Pracovní
skupina pro archivaci digitálních informací
[4] Preserving
Digital Information
[5]
Electronic Libraries Programme: http://www.ukoln.ac.uk/services/elib/
[6] Britská
nevládní nezisková organizace typu non-departmental
public body, která se zaměřuje na podporu v oblasti digitálních služeb
a řešení se zaměřením na odborné a další vzdělávání. Zdroj: https://www.jisc.ac.uk/about
[7] Pracovní
skupina pro digitální archivaci.
[8] Dokument
nazvaný The Digital Culture: Maximising the Nation's Investment je dotupný na http://www.ukoln.ac.uk/services/elib/papers/other/jisc-npo-dig/intro.html
[9] http://www.dpconline.org/
[10]
International Standardization Organization – ISO
[11] E-Science
je v kontextu zmíněné zprávy použito jako označení pro výzkumy související s
využitím informačních technologií ve vědeckém výzkumu a zejména s rostoucími
objemy dat napříč všemi vědními obory (Lord a Macdonald, 2003). Termín se také
používá pro britský program rozvoje a financování této oblasti po roce 2000 (Hey
a Trefethenová, [b.r.]).
[13] Preservation
and Long-term Access through Networked Services
[14] Cultural,
Artistic and Scientific knowledge for Preservation, Access and Retrieval
[15]
Vysvětlující informace (Representantion Information) slouží pro zachycení a
uchování způsobu, jakým lze přistupovat k informacím uloženým
v digitálních objektech.
[17] Později
tato organizace změnila svůj název na Open Preservation Foundation – http://openpreservation.org/
[18] Oba
tyto nástroje využívají veřejně přístupnou formátovou databázi PRONOM, kterou
od roku 2002 spravuje a publikuje britský národní archiv.
[19] Český
překlad originálního termínu vocational
training se vztahuje k pojmu další
vzdělávání, který se používá pro vzdělávání získávané po dosažení
určitého stupně vzdělání a vstupu na trh práce.
[21] http://plato.openpreservation.org/.
V současnosti aplikaci spravuje Technická univerzita ve Vídni, která ji
také provozuje formou SAAS (Software As A Service) na http://www.ifs.tuwien.ac.at/dp/plato/intro/
[22] Zkratka
znamená Preserving (Digital) Objects With Restricted Resources a přímo se tak
odkazuje na obtížnou situaci způsobenou omezováním finančních prostředků.
[23] Členská
organizace sdružující organizace z veřejného i soukromého sektoru – http://www.alliancepermanentaccess.org/
[24]
Informace Knihovny Kongresu o tématech souvisejících s dlouhodobou
ochranou digitálních informací jsou publikovány na stránkách http://www.digitalpreservation.gov/,
které slouží jako rozcestník pro National Digital Stewardship Alliance, Digital
Preservation Outreach and Education a National Digital Information
Infrastructure and Preservation Program.
[25] http://www.langzeitarchivierung.de/
[26] http://www.digitisation.eu/
Digitální kurátorství v České republice
Historii dlouhodobé ochrany digitálních informací v České
republice podrobně zmapovali Hutař s Melicharem (2013a, s. 4):
Domníváme se, že české knihovny, galerie, muzea a archivy jsou si
v určitém smyslu podobné – všechny tyto instituce prošly třemi fázemi
vývoje digitalizace, shromažďování tzv. born-digital dat[1],
správy a ukládání digitální dat.
-
V první
fázi, od raných devadesátých let zhruba do roku 2002, s digitalizací a hlavně s
ukládáním digitálních dat převážně pouze experimentovaly.
-
Předělem
ke druhé fázi byly povodně v roce 2002, po nichž se generování digitálního
obsahu v paměťových institucích urychlilo. Objevily se také projekty zaměřené
na born-digital dokumenty.
-
Dalším
významným přelomem je rok 2011, kdy byly zahájeny velké projekty masové
digitalizace v obou nejvýznamnějších národních institucích – Národní knihovně
České republiky (NK ČR) a v Národním archivu České republiky (NA ČR). Zároveň se
především díky financím EU stávají technologie pro digitalizaci více dostupné pro
větší počet institucí, včetně těch menších. Součástí obou projektů je také získání
systému na logickou dlouhodobou ochranu digitálních dat (LTP – long-term
preservation systém).
V závěru citované práce autoři konstatují, že v českých
institucích bylo v roce jejího vzniku malé povědomí o nutnosti chránit
data víc, než jen pouhým uložením a zálohováním. Nebyly definované strategie
dlouhodobého uchovávání a často se přijímala ad hoc řešení správy dat (Hutař a
Melichar, 2013a, s . 45).
Vyjádřili také předpoklad, že do roku 2015 alespoň jedna
instituce v ČR „bude mít funkční LTP systém v provozu a použití“ (tamtéž, s.
47). Tento předpoklad se naplnil například v případě projektu Národní
digitální knihovny. Ta pro uchování digitalizovaných dokumentů používá LTP
systém, který je v souladu se standardy OAIS (Financování, 2015)
a připravuje se na získání certifikátu důvěryhodného úložiště (Certifikace
dlouhodobého úložiště, 2015).
[1]
Born-digital Hutař s Melicharem (2013, s. 4) definují jako „běžné označení
pro dokumenty, data nebo informace, které vznikly v digitální podobě a nemají,
nikdy neměly a není plánováno, že by měly fyzickou (např. tištěnou) podobu“.
Model životního cyklu digitálního kurátorství DCC
Model životního cyklu vypracovaný v DCC slouží jako
ilustrační vysokoúrovňový pohled na jednotlivé složky potřebné pro úspěšné
zvládnutí digitálního kurátorství a uchování dat. Může
pomoci při plánování aktivit digitálního kurátora, který díky němu má jistotu,
že podchytil všechny nezbytné kroky životního cyklu (DCC Curation
Lifecycle Model, 2015).
Podle Tibbo (2012, s. 192) je DCC Digital Curation Lifecycle
Model pravděpodobně nejznámější z mnoha modelů životního cyklu uchovávaných dat[1].
Zahrnuje mnoho funkcí a aktivit, které mají technické aspekty, ale žádná z
nich nemůže být zvládnuta pouze technologií samotnou. Mnohé z nich vyžadují
významnou míru lidských zásahů a úsudku.
Obrázek 1: Grafické znázornění životního cyklu
digitálního kurátorství (Digital Curation Centre, © 2015)
DCC Lifecycle Model velmi promyšleným způsobem pracuje
s vrstvami, v nichž můžeme vysledovat směrem od středu změnu kontextu
uchování dokumentu od ochrany na bitové úrovni přes dlouhodobé uchovávání až po
aktivity spojené s kurátorstvím.
Data[2]
Data neboli informace zaznamenané v binární digitální podobě
se nachází v centru životního cyklu a zahrnují:
-
Digitální
objekty, které mohou být jednoduché (například textové, obrazové nebo
zvukové soubory, společně s jejich identifikátory a metadaty) nebo komplexní
(digitální objekty tvořené kombinací jiných digitálních objektů)
-
Databáze
– strukturované kolekce záznamů nebo dat uložené v počítačových systémech.
Akce napříč celým životním cyklem (Full Cycle Actions)
Popisné a vysvětlující informace (Description and Representation
Information)
Datům a digitálním objektům jsou přiřazeny administrativní,
popisná, technická a strukturální metadata a metadata o uchovávání. Při tom
jsou dodržovány příslušné standardy, aby byl zaručen adekvátní popis a kontrola
v dlouhém časovém období. Jsou také shromážděny a přiřazeny vysvětlující
informace (Representation Information) nezbytné pro pochopení a správnou
interpretaci digitálních materiálů i připojených metadat.
Plán uchovávání (Preservation Planning)
Uchovávání se řídí plánem, který zahrnuje řízení a
administraci všech aktivit kurátorského životního cyklu.
Komunitní dohled a spoluúčast (Community Watch and Participation)
Kurátoři mají přehled o komunitních aktivitách a podílejí se
na vývoji sdílených standardů, nástrojů a software.
Kurátorství a uchovávání (Curate and Preserve)
Kurátoři jsou si vědomi všech ochranných a kurátorských aktivit
naplánovaných napříč životním cyklem a tyto akce provádějí.
Postupné akce (Sequential actions)
Konceptualizace (Conceptualise)
Promyšlení a naplánování způsobu jakým budou data vytvářena
včetně způsobů jejich pořizování a možností pro ukládání.
Vytvoření nebo příjem (Create or Receive)
Vytvoření dat včetně administrativních, popisných,
strukturálních a technických metadat. V okamžiku vytvoření mohou být
rovněž pořízena metadata o uchovávání.
Příjem dat od tvůrců, z jiných archivů, repozitářů nebo
datových center v souladu se zdokumentovanými pravidly pro sběr. V případě
potřeby jsou přiřazována příslušná metadata.
Hodnocení a výběr (Appraise and Select)
Vyhodnocení a výběr dat pro dlouhodobé uchovávání podle zdokumentovaných
návodů, pravidel nebo zákonných požadavků.
Příjem (Ingest)
Přemístění dat do archivu, repozitáře, datového centra nebo
jiného úložiště podle zdokumentovaných návodů, pravidel nebo zákonných
požadavků.
Akce uchovávání (Preservation Action)
Provedení aktivit potřebných pro dlouhodobé uchování dat a
zachování jejich směrodatné povahy. Akce uchovávání by měly udržováním
integrity zajistit, že data zůstanou autentická, spolehlivá a použitelná. Aktivity
zahrnují čištění dat, validaci, přiřazení metadat o uchovávání, přiřazení
vysvětlujících informací a zajištění vhodné struktury nebo formátu souboru.
Uložení (Store)
Bezpečné uložení dat v souladu s příslušnými standardy.
Přístup, použití a znovupoužití (Access, Use and Reuse)
Zajištění přístupnosti dat jak určeným uživatelům
(designated users), tak zájemcům o opětovné použití. Data mohou být
publikována veřejně, nebo mohou být aplikovány pravidla a procedury pro
kontrolu přístupu a autentizaci.
Transformace (Transform)
Vytvoření nových dat z originálu například migrací do jiného
formátu. V případě potřeby (například za účelem publikování) mohou být
vytvořeny odvozené podmnožiny dat ručním nebo automatickým výběrem.
Občasné akce (Occasional actions)
Odstranění (Dispose)
Odstranění dat, která nebyla vybrána pro dlouhodobé
uchovávání v souladu se zdokumentovanými návody, pravidly nebo zákonnými
požadavky.
Obvykle bývají data přemístěna do jiného archivu,
repozitáře, datového centra nebo jiného úložiště. V některých případech mohou
být data smazána. Povaha dat může z důvodů dodržení zákona vyžadovat bezpečné
smazání.
Opětovné hodnocení (Reappraise)
Návrat dat, která neprošla procedurami validace k dalšímu
ocenění a výběru.
Migrace (Migrate)
Migrace dat do jiného formátu. Může být provedena pro zajištění
shody s prostředím úložiště, nebo jako prevence proti zastaráváním hardwaru
nebo softwaru.
[1]
V originále je použit termín „data/content lifecycle model“.
[2] Popis
modelu podle (DCC Curation
Lifecycle Model, 2015).
Records Continuum Model
Records Continuum Model vytvořil Frank Upward z australské
Monash University[1].
Upward, který svůj model popisuje jako „časoprostorový konstrukt, nikoliv
životní model[2]“
(Upward,
1996) se jeho pojetím snažil vymezit proti tradičním modelům životního cyklu
záznamů, které podle něj příliš zdůrazňovaly hranici mezi archiváři a správci
záznamů (Lappin,
2012). Podle Xiaomi (2003, s. 27) je role archivářů v tomto modelu
proaktivní[3],
na rozdíl od tradičních modelů životního cyklu, které je staví spíše do pozice
reaktivní. Skutečnost, že tento model pojímá záznam (archivovaný dokument) jako
logickou nikoli fyzickou entitu jej podle (tamtéž, s. 28) činí obzvlášť vhodný
jako vzor dobré praxe pro správu elektronických záznamů.
Obrázek 2: Diagram znázorňující Records Continuum
Model (Upward © 1996 podle Flynn, 2001, s. 82)
Records Continuum Model popisuje dokument, okolnosti jeho
vzniku, souvislosti a prostředí, ve kterém se vše odehrává, pomocí os a úrovní.
Úrovně představují vývoj dokumentu, „cestu“ v něm
zachycených informací od událostí, které vedou k jeho vzniku uvnitř uzavřeného
systému až do chvíle, kdy se stává součástí „kolektivní paměti“.
Osy modelu reprezentují:
-
způsob uchovávání záznamu (Recordkeeping
containers);
-
udržitelnost a smysl obsažených informací
(Transactionality);
-
identitu a vlastnictví záznamu (Identity);
-
roli záznamu jako stopy a důkazu o událostech a
jeho význam v paměti organizace a kolektivní paměti (Evidentiality).
[1] Upward
přednášel na Katedře knihovnictví, archivnictví a záznamů a původ modelu a
propojení s archivnickou diskurzní komunitou jsou patrné jak z
terminologie v modelu samotném, tak v citované literatuře.
[2] „A
records continuum is continuous and is a time/space construct not a life model.“
[3] Jako
příklad je uvedena možnost ovlivnit podobu archivovaných záznamů ještě před
jejich vznikem tím, že se archiváři podílejí na nastavení systémů pro tvorbu
dokumentů a zajišťují tak například opatření dokumentů odpovídajícími metadaty.
Týden 2
- Řekneme si, co je referenční model OAIS a co vedlo k jeho vzniku.
- Vysvětlíme si základní funkce modelu.
- Popíšeme si entity modelu a vztahy mezi nimi.
- Pokusíme se aplikovat model na digitální archiv fiktivní instituce.
Co je OAIS
OAIS[1]
představuje jeden z nejdůležitějších standardů, s nimiž se mohou
digitální kurátoři při své práci setkat a současně je to také konceptuální a
informační model, který dává ucelenou představu o povaze jejich práce.
Hlavním důvodem jeho vzniku byla skutečnost, že neexistoval konsensus o potřebách a požadavcích na dlouhodobé uchovávání digitálních dat. Jednotící rámec, který by mohl vyplnit tuto mezeru, by byl velmi užitečný v tom, že by umožnil dialog a spolupráci mezi účastníky snah o budování standardů, a také by mohl pomoci identifikovat oblasti, kde je standardizace potřebná.
V roce 1999 byl publikován draft normy OAIS, která vznikla na popud Mezinárodní organizace pro normalizaci (ISO) pod záštitou Consultative Committee for Space Data Systems (CCSDS). Původ referenčního modelu OAIS můžeme vysledovat v první polovině 90. let. V té do-bě si instituce začaly uvědomovat, že do té doby všeobecně přijímaný model digitálních knihoven založený na architektuře Kahn-Wilenski nevyhovuje, protože cíleně neřeší budoucí zpřístupnění dat. Základ budoucího referenčního modelu byl tvořen pod zášti-tou CCSDS z toho důvodu, že právě instituce zabývající se vesmírným výzkumem nejvíce narážely na problémy spojené s dlouhodobým uchováváním velkých objemů dat. (Hutař a Melichar, 2013b, s. 16).
Pro pochopení vztahu OAIS a digitálního kurátorství je nutné
si uvědomit, že tento referenční model neřeší procesy odehrávající se mimo
archiv. Ty jsou součástí jiných fází v rámci životního cyklu digitálního
objektu (Hutař a Melichar, 2013b, s. 17).
OAIS představuje společný terminologický a konceptuální
rámec pro oblast digitálních archivů. Referenční model pro OAIS je definován
standardem ISO 14721:2012, který se problematiky digitálního kurátorství dotýká
především v tématech souvisejících s dlouhodobou ochranou digitálních
informací. Model poskytuje framework pro
-
popis a porovnávání architektury existujících i
budoucích řešení;
-
volbu strategií dlouhodobého uchovávání;
-
porovnání datových modelů digitálních archivů;
-
odhadování změny datových modelů v průběhu
času.
Slovo otevřený odkazuje na skutečnost, že referenční model vznikl a byl zveřejněn v otevřeném veřejném fóru, kterého se mohl zúčastnit kdokoli, kdo měl zájem. Otevřený zde tedy neznamená úroveň dostupnosti objektů v archivu, ani se nic takového nepředpokládá.
Archiv podle tohoto referenčního modelu musí:
- vyjednávat a získávat příslušné informace od jejich tvůrců;
- získat nad informacemi dostatečnou kontrolu tak, aby byl schopen zajistit dlouhodobé uchování - je potřeba, aby archiv odpovídající OAIS získal dostatečná práva duševního vlastnictví k objektům, které spravuje a musí mít též potřebná práva k provádění kroků nezbytných pro realizaci cílů dlouhodobé ochrany
- definovat uživatelskou komunitu archivu;
- zajistit, aby uchovávané informace byly samostatně srozumitelné uživatelské komunitě bez asistence tvůrců informací;
- následovat zdokumentované politiky a procesy s cílem zajistit ochraňované informace proti všem eventuálním nebezpečím a zabránit neúmyslnému smazání;
- zpřístupňovat ochraňované informace uživatelské komunitě.
[1] Open
Archival Information System
Funkční model OAIS
Externí entity
-
Tvůrci
(Producers) jsou lidé, organizace nebo systémy, které předávají archivu
informace určené k dlouhodobému uchovávání.
-
Koncoví
uživatelé (Consumers) jsou lidé,
organizace nebo systémy, které využívají informace uložené v archivu. Speciální
podskupinou koncových uživatelů je tzv. určená skupina (Designated Community).
Jsou to uživatelé, kterým je obsah archivu určen primárně a kteří jsou schopní
jeho informacím porozumět ve formě, ve které je OAIS archiv poskytuje.
-
Vedení
(Management) je pověřeno tvorbou, kontrolou a v některých případech i vynucováním
pravidel, která zastřešují aktivity OAIS archivu na nejvyšší úrovni.
Funkční
celek příjmu (Ingest)
Funkční celek příjmu je sada procesů odpovědných za přijetí
informace poskytnuté tvůrci dat a její přípravu k zařazení do úložiště.
Zahrnuje validaci dat po přijetí, převod do vhodné formy, extrakci nebo
vytvořen popisných metadat a přesun do úložiště.
Funkční celek archivního uložení (Archival
Storage)
Další funkční celek je systémová část archivu, která spravuje
dlouhodobé úložiště a udržuje digitální materiály svěřené OAIS archivu. Je
zodpovědná za to, že archivovaný obsah se nachází v odpovídajícím úložišti a
jeho data zůstávají úplná a je možné je poskytovat. Funkce archivního uložení zahrnují
i procedury migrace a výměny médií. Tento funkční celek také zajišťuje získávání
vyžádaného obsahu.
Funkční
celek správy dat (Data
Management)
Funkční celek správy dat udržuje databáze popisných metadat,
které identifikují a popisují archivované informace. Dále spravuje
administrativní data určená pro podporu vnitřních systémů archivu. Slouží jako
podpora pro vyhledávání a získávání archivovaného obsahu.
Funkční celek plánování uchovávání (Preservation planning)
Funkční celek plánování uchovávání je služba odpovědná za
zmapování strategie dlouhodobého uchovávání a její průběžnou aktualizaci.
Služba monitoruje okolí OAIS archivu a v případě nutnosti vytváří
doporučení k provedení nezbytných změn v reakci na změny prostředí. Je to
pojistka archivu proti neustálým změnám uživatelského a technologického
prostředí.
Funkční celek zpřístupnění (Access)
Funkční celek zpřístupnění řídí procesy a služby, které koncovým
uživatelům umožňují najít, vyžádat a získat obsah archivu. Zprostředkovává uživatelům
služby funkčních celků archivního uložení a správy dat a provádí nezbytné
úpravy požadovaného obsahu (například změnu formátu) před jeho poskytnutím.
Funkční celek správy (Administration)
Funkční celek správy je odpovědný za řízení každodenních
operací OAIS archivu a koordinaci zbývajících pěti funkčních celků. Dalším jeho
úkolem je interakce s tvůrci, koncovými uživateli a vedením. Je to ústředí
celého archivu, které komunikuje směrem dovnitř i ven.
Informační model OAIS
Informační model OAIS je založen na konceptu informačního balíčku: popisuje uspořádání informací při pohybu archivačním systémem, při vstupu do něj, průchodem a výstupu z něj.
- Submission Information Package vstupuje do archivačního systému
- Archival Information Package je předmětem dlouhodobého uchovávání
- Dissemination Information Package je určen koncovým uživatelům
Balíčky SIP, AIP a DIP jsou informačními objekty, které jsou vkládány, spravovány a zveřejňovány archivem odpovídajícím OAIS. Předmětem dlouhodobého uchovávání je však AIP – Archivní Informační Balíček.
AIP ztělesňuje přísnější výklad pojmu informační balíček, protože musí obsahovat kompletní soubor metadat nutných k zajištění dlouhodobého uchování a zpřístupňování obsahu Určené Skupině. Referenční model popisuje jednotlivé typy metadat, která by měla být součástí archivované informace.
Informační balíček se skládá z objektu, který je předmětem ochrany a z metadat nutných pro zajištění dlouhodobého uchovávání, zpřístupnění, včetně srozumitelnosti.
Informační objekt je tvořen kombinací Datového objektu (bit-stream) a Vysvětlující informace, která umožňuje jeho interpretaci a použití.
Vysvětlující informaci můžeme rozdělit na dva typy:
- Informace o Uspořádání (Structure Information) je v kontextu digitálních objektů snadno pochopitelná, odkazuje na mapování mezi digitálními bity a různými koncepty a datovými strukturami, které umožňují načíst bity do srozumitelné informace – například jako obrázek, text nebo interaktivní program. Obecně řečeno, Informace o Uspořádání popisuje formát digitálního objektu.
- Informace o Významu (Semantic Information) na druhou stranu objasňuje význam nebo poskytuje odpovídající interpretaci Datového Objektu s Obsahem. Příkladem Informací o Významu jsou glosář, datový slovník nebo dokumentace k softwarové aplikaci.
- Referenční model také definuje zbytkovou kategorii Ostatní Vysvětlující Informace (Other Representation Information), která zahrnuje Vysvětlující Informace, jež nejsou snadno definovatelné jako Informace o Uspořádání nebo Informace o Významu
Vysvětlující Informace je nezbytná pro zobrazení a porozumění bitům, které tvoří Datový Objekt s Obsahem. Vysvětlující Informace může obsahovat popis hardwarového a softwarového prostředí potřebného k zobrazení Datového Objektu s Obsahem nebo k zpřístupnění jeho obsahu. Může také shrnovat postup interpretace Datového Objektu s Obsahem.
Sítě Vysvětlujících Informací jsou vnořené řetězy informací tvořící kontext, který Určené Skupině postačuje k porozumění Datovému Objektu s Obsahem a jeho doprovodným Vysvětlujícím Informacím. Teoreticky mohou Sítě Vysvětlujících Informací obsahovat nekonečnou regresi vedoucí k absurdním koncům.
V praxi pochopitelně OAIS archiv Sítě Vysvětlujících Informací v nějakém bodě zastaví. Tam, kde je možné předpokládat rozumnou míru znalosti u Určené Skupiny. Lze například předpokládat, že členové Určené Skupiny rozumí anglicky. Referenční model OAIS popisuje tuto předpokládanou znalost Určené Skupiny jako Znalostní Základnu (Knowledge Base).Jednotlivé platformy digitálních archivů (ve smyslu kombinace hardware a software) mohou pro dlouhodobé uchovávání AIP používat různé formáty AIP. Pro zjednodušení interoperability archivů byly vytvořeny univerzální formáty, z nichž ty nejznámější jsou METS a Bagit.
METS měl usnadnit výměnu digitálních objektů a podpořit interoperabilitu mezi systémy digitálních knihoven a podporovat dlouhodobou archivaci objektů v digitálních knihovnách. Byl zamýšlen jako standard pro kódování potenciálních Vstupních Informačních Balíčků (SIP), Archivních Informačních Balíčků (AIP) a Výstupních Informačních Balíčků (DIP) z referenčního modelu OAIS.“
Dokument METS pro digitální objekt obsahuje sebepopisující hlavičku, popisná metadata k objektu, administrativní metadata (přesněji řečeno technická metadata, metadata přístupových práv, metadata o analogové předloze digitálního objektu, metadata o původu objektu), seznam souborů tvořících objekt, strukturální mapu všech komponentů digitálního objektu, seznam odkazů, které vyjadřují vztahy mezi komponenty strukturální mapy a seznam „chování“, která mohou s digitálními objekty souviset.
Bagit je formát archivního balíčku vytvořený společným úsilím americké Kongresové knihovny a Digitální knihovny Kalifornie. Jedná se o hierarchický souborový
archivační formát určený pro výměnu obecného digitálního obsahu. „Bag“ obsahuje pouze nezbytnou strukturu
zahrnující vlastní digitální obsah, tzv. „payload“ a „tagy“ které jej popisují.
Pro větší efektivitu při přenosu dat mohou být fyzické soubory v payloadu nahrazeny referencemi na internetové úložiště.
Týden 3
- Povíme si, jak model OAIS souvisí s významnými vlastnostmi
- Představíme si framework InSPECT
- Zkusíme zjistit, jak poznáme, co je významné
- A jak to zapíšeme pomocí metadat
Týden 4
- Zamyslíme se nad tím, co je nutné zvážit při návrhu digitálního archivu
- Představíme si různé strategie pro dlouhodobou ochranu
- A také jejich výhody a nevýhody
- Na závěr se pokusíme zjistit, které jsou vhodné pro náš archiv
Týden 5
- Zopakujeme si důležité standardy týkající se dlouhodobého uchovávání
- Vysvětlíme si základní kategorie nástrojů, se kterými pracuje digitální kurátor
- Projdeme nejdůležitější nástroje a popíšeme si jejich použití
- Zamyslíme se nad tím, jak vybrat ty vhodné
Týden 6
- Opakování - framework inSpect
- Připojení ke vzdálenému serveru pomocí Putty
- Nástroje pro identifikaci, popis a konverzi souborů
- Nástroje pro vytváření a validaci metadat
Týden 7
- Shrneme si, jak postupovat při vytváření archivu
- Povíme si, jak se dají popsat procesy a požadavky
- Vrátíme
se
(opět)
k určeným skupinám a významným vlastnostem
- Zamyslíme se nad tím, co do našeho archivu patří a jak to poznáme
- Zkusíme
se dopátrat toho, jak vypadají ty správné balíčky
Týden 8
- Povíme si, proč je komunikace důležitá v práci digitálního kurátora
- Zjistíme, kdo jsou stakeholdeři a jak je poznat
- Zopakujeme si zásady pro úspěšné prezentování
- Představíme si důležité komunitní aktivity
Týden 9
- Vysvětlíme si, k čemu je digitálním kurátorům znalost projektového managementu.
- Představíme si základní postupy a nástroje projektového řízení.
- Podíváme se na plánovací nástroj PLATTER.
- A vyzkoušíme si ho na našem fiktivním repozitáři.
Týden 10
Opakování, otázky a odpovědi
- Struktura informačního balíčku
- Digitální objekt vs. metadata
- Procesy spojené s archivem
Týden 11
Týden 12
Návrh digitálního archivu
Připravte stručný dokument s popisem návrhu vašeho fiktivního repozitáře. Inspirujte se dostupnými vzory, které popisují architekturu repozitáře, práci s digitálními objekty, určenou skupinu, strategie, nástroje a všechno ostatní, co jste průběžně dělali ve svých úkolech.
Dokument opatřete titulní stranou, krátkým úvodem (manažerským shrnutím) a obsahem. V dokumentu by dále neměly chybět následující informace:
- Popis instituce, která archiv provozuje
- Identifikace a stručný popis procesů. stakeholderů a určené skupiny
- Popis digitálních objektů, které budou v archivu obsaženy a obvyklého způsobu jejich získávání a využívání
- Popis zvolené strategie dlouhodobého uchovávání
- Popis archivu strukturovaný podle OAIS a používající příslušou terminologii
- Okolí archivu
- Funkční celky
- Informační balíčky
- Seznam nástrojů a vysvětlení proč a jak budou používány
Prezentace
Připravte krátkou prezentaci (maximálně 10 minut), ve které svůj repozitář představíte, shrnete jeho zásadní charakteristiky a zejména se zaměříte na kurátorský přístup k dlouhodobé ochraně. Zaměřte se na zdůraznění toho, jakým způsobem jsou aplikovány hlavní znaky kurátorství, jaké z toho vyplývají výhody a jaká jsou případná rizika a úskalí.