Digitální knihovny Daniel Jakubík Fakulta Informatiky, MU Co je to digitální knihovna? Pohled knihovníka Digitální knihovny jsou organizace, které poskytují zdroje (včetně specializovaného personálu) umožňující provádět výběr, strukturování a zpřístupnění sbírek digitálních prací, tyto práce dále distribuovat, udržovat jejich integritu a dlouhodobě uchovávat – a to vše s ohledem na snadné a ekonomické využití určitou komunitou nebo množinou komunit uživatelů. - Digital Library Federation, 1997 Pohled pracovníka IT Digitální knihovna je spravovaná sbírka informací spolu s odpovídajícími službami, přičemž informace jsou uloženy v digitální podobě a jsou dostupné prostřednictvím sítě. - W.Y.Arms, 2000 Budování sbírek • digitalizace – Digitalizace informačních zdrojů existujících v analogové podobě. • born-digital – Začleňování zdrojů vzniklých přímo v digitální podobě. • harvesting – Sklízení informačních zdrojů z webu. Metadata • Metadata členíme do tří kategorií: – metadata popisná – metadata strukturální – metadata administrativní • V praxi nemusí být toto rozdělení striktně dodržováno a jednotlivé typy se často překrývají. MARC • MARC (Machine Readable Cataloging) Dublin Core • nekvalifikovaný Dublin Core – 15 základních metadatových prvků – obsah (název, předmět, popis, pokrytí, typ, zdroj, vztah) – Intelektuální vlastnictví (tvůrce, přispěvatel, vydavatel, práva) – instance síťového zdroje (identifikátor, datum, jazyk, formát) • kvalifikovaný Dublin Core – kvalifikátor prvku – kvalifikátor hodnoty – kvalifikátory musí splňovat princip ”dumb-down” Metadata Kongresové knihovny • MODS (Metadata Object Description Schema) – navrženo odborníky z Kongresové knihovny (Library of Congres) a Marc Standard Office – založen na jazyce XML (titleInfo, name, typeOfResource, genre, originInfo, language, physicalDescription, abstract, tableOfContents, targetAudience, note, subject, classification, relatedItem, identifier, location, accessCondition, part, extension, recordInfo) • obsahuje 20 základních prvků – dělí se na podprvky – mohou obsahovat atributy METS • METS – Metadata Encoding and Transmission Standard – Kontejnerový formát založený na jazyce XML – může obsahovat data v různých formátech (např. popisná metadata ve formátech MARC21, MARC XML, Dublin Core, MODS aj.) • obsahuje 20 základních prvků – dělí se na podprvky – mohou obsahovat atributy Identifikace • koncept URN – globální rozsah, perzistence, škálovatelnost, legacy support, rozšiřitelnost • klasické bibliografické identifikátory – ISBN, ISSN – ISADN, ISTC, ISAN, ISWC, SICI, BICI, ... • PURL • handle-system • DOI PURL • URL poskytující nepřímou adresaci • http://purl.oclc.org/catalog/item1 • na odkazované adrese je uloženo skutečné URL • přesměrování pomocí http redirect • libovolný počet PURL serverů Handle System • kompatibilní s konceptem URN • hdl:cnri.dlib/magazine – pojmenovávací autorita – Jedinečný řetězec znaků v rámci autority • dvojúrovňová architektura – globální registr – libovolný počet lokálních serverů • distribuovaný systém s decentralizovanou administrací • nutnost instalovat plugin do prohlížeče, jinak neúplná činnost DOI • směrovací mechanismus na základě DOI • http://dx.doi.org/10.1000/182 – prefix: 10. následovaný číslem registrující organizace – identifikátor digitálního objektu - jedinečný v rámci autority • silně centralizovaný – povinná registrace u jediné registrační autority • není bezplatný Interoperabilita • Schopnost vzájemně si rozumět, spolupracovat a dosáhnout součinnosti mezi nezávislými, technicky různorodými systémy. – Z39.50 – OAI-PMH – Open URL Z39.50 • architektura klient/server • stavový protokol • komunikaci inicializuje klient, provede sekvenci interakcí a spojení uzavře Open Archives Initiative (OAI) • OAI-PMH (OAI Protocol for Metadata Harvesting) • protokol pro hromadné sklízení metadat • založen na základních otevřených standardech a protokolech (HTML, XML, HTTP) • 6 příkazů kódovaných do URL – Identify, ListSets, ListIdentifiers, ListMetadataFormats, GetRecord, ListRecords • příklad dotazu: – http://memory.loc.gov/cgi-bin/oai2_0?verb=ListIdentifiers&set =gmd&metadataPrefix=oai_dc OpenURL a SFX • Open URL – standard pro kódování metadat o zdroji do jeho URL (ANSI norma Z39.88) • SFX – aplikační rámec nad OpenURL Konec Děkuji za pozornost