LObecný úvod Identifikátory Metadata Interoperabilita 1 / 33 . . . . . . Digitální knihovny a repozitáře Daniel Jakubík LObecný úvod Identifikátory Metadata Interoperabilita 2 / 33 . . . . . . Obecný úvod 1 Obecný úvod 2 Identifikátory 3 Metadata 4 Interoperabilita LObecný úvod Identifikátory Metadata Interoperabilita 3 / 33 . . . . . . Co je to digitální knihovna? Problém s vymezením pojmu: neustále se vyvíjí různé úhly pohledu nejednotné názvosloví LObecný úvod Identifikátory Metadata Interoperabilita 3 / 33 . . . . . . Co je to digitální knihovna? Problém s vymezením pojmu: neustále se vyvíjí různé úhly pohledu nejednotné názvosloví Po masovém rozšíření webových technologií se objevili i názory, že celý Internet je vlastně digitální knihovnou. LObecný úvod Identifikátory Metadata Interoperabilita 3 / 33 . . . . . . Co je to digitální knihovna? Problém s vymezením pojmu: neustále se vyvíjí různé úhly pohledu nejednotné názvosloví Po masovém rozšíření webových technologií se objevili i názory, že celý Internet je vlastně digitální knihovnou. LObecný úvod Identifikátory Metadata Interoperabilita 4 / 33 . . . . . . Definice digitálních knihoven Pohled pracovníka v IT Digitální knihovna je spravovaná sbírka informací spolu s odpovídajícími službami, přičemž informace jsou uloženy v digitální podobě a jsou dostupné prostřednictvím sítě. - W.Y.Arms, 2000 LObecný úvod Identifikátory Metadata Interoperabilita 5 / 33 . . . . . . Definice digitálních knihoven Pohled knihovníka Digitální knihovny jsou organizace, které poskytují zdroje (včetně specializovaného personálu) umožňující provádět výběr, strukturování a zpřístupnění sbírek digitálních prací, tyto práce dále distribuovat, udržovat jejich integritu a dlouhodobě uchovávat – a to vše s ohledem na snadné a ekonomické využití určitou komunitou nebo množinou komunit uživatelů. - Digital Library Federation, 1997 LObecný úvod Identifikátory Metadata Interoperabilita 6 / 33 . . . . . . Srovnání digitálních a klasických knihoven dlouhodobě budovaná a spravovaná sbírka dokumentů vybraných na základě stanovených kritérií tvorba metadat používaných pro sestavování katalogů, rejstříků poskytování služeb určité komunitě uživatelů LObecný úvod Identifikátory Metadata Interoperabilita 7 / 33 . . . . . . Srovnání digitálních a klasických knihoven Výhody digitálních knihoven: vzdálený a nepřetržitý přístup k informacím digitální data zabírají minimum prostoru jednodušší vyhledávání informací, fulltextové hledání současný přístup několika uživatelů k jednomu dokumentu menší pravděpodobnost zničení, poškození či ztráty dokumentů možnost okamžité aktualizace LObecný úvod Identifikátory Metadata Interoperabilita 8 / 33 . . . . . . Příklady projektů digitálních knihoven LObecný úvod Identifikátory Metadata Interoperabilita 9 / 33 . . . . . . Architektura digitálních knihoven Kahn-Wilenského architektura digitální objekt obsah metadata repozitáře jednoznačné globální jméno umožňuje řízený přístup k objektům 2 typy metadatových záznamů záznam vlastností objektu transakční záznam RAP (Repository Access Protocol) handle-system LObecný úvod Identifikátory Metadata Interoperabilita 10 / 33 . . . . . . Identifikátory 1 Obecný úvod 2 Identifikátory 3 Metadata 4 Interoperabilita LObecný úvod Identifikátory Metadata Interoperabilita 11 / 33 . . . . . . Jména a identifikátory koncept URN globální rozsah perzistence škálovatelnost legacy support rozšiřitelnost klasické bibliografické identifikátory ISBN ISSN ISADN, ISTC, ISAN, ISWC, SICI, BICI, ... PURL handle-system DOI LObecný úvod Identifikátory Metadata Interoperabilita 12 / 33 . . . . . . ISBN ISBN (International Standard Book Number) přidělují nakladatelé složený identifikátor ISBN-10 ISBN 80-204-0105-9 identifikace země identifikace nakladatele konkrétní vydání kontrolní číslice ISBN-13 + tříznakový prefix (978, 979) kontrolní mechanismus váhy střídavě 1, 3 modulo 10 LObecný úvod Identifikátory Metadata Interoperabilita 12 / 33 . . . . . . ISBN ISBN (International Standard Book Number) přidělují nakladatelé složený identifikátor ISBN-10 ISBN 80-204-0105-9 identifikace země identifikace nakladatele konkrétní vydání kontrolní číslice 10*8 + 8*2 + 6*4 + 4*1 + 2*5 + 1*9 = 143 = 13*11 ISBN-13 + tříznakový prefix (978, 979) kontrolní mechanismus váhy střídavě 1, 3 modulo 10 LObecný úvod Identifikátory Metadata Interoperabilita 13 / 33 . . . . . . ISSN ISSN (International Standard Serial Number) přiděluje mezinárodní centrum pro ISSN jednoduchý identifikátor 1214-4029 poslední číslice kontrolní LObecný úvod Identifikátory Metadata Interoperabilita 13 / 33 . . . . . . ISSN ISSN (International Standard Serial Number) přiděluje mezinárodní centrum pro ISSN jednoduchý identifikátor 1214-4029 poslední číslice kontrolní 8*1 + 7*2 + 6*1 + 5*4 + 4*4 + 3*0 + 2*2 + 1*9 = 77 = 7*11 LObecný úvod Identifikátory Metadata Interoperabilita 14 / 33 . . . . . . PURL URL poskytující nepřímou adresaci http://purl.oclc.org/catalog/item1 na odkazované adrese je uloženo skutečné URL přesměrování pomocí http redirect libovolný počet PURL serverů LObecný úvod Identifikátory Metadata Interoperabilita 15 / 33 . . . . . . System handles kompatibilní s konceptem URN hdl:cnri.dlib/magazine pojmenovávací autorita jedinečný řetězec znaků v rámci autority dvojúrovňová architektura globální registr libovolný počet lokálních serverů distribuovaný systém s decentralizovanou administrací nutnost instalovat plugin do prohlížeče, jinak neúplná činnost LObecný úvod Identifikátory Metadata Interoperabilita 16 / 33 . . . . . . DOI směrovací mechanismus na základě DOI http://dx.doi.org/10.1000/182 prefix: 10. následovaný číslem registrující organizace identifikátor digitálního objektu - jedinečný v rámci autority silně centralizovaný povinná registrace u jediné registrační autority není bezplatný LObecný úvod Identifikátory Metadata Interoperabilita 17 / 33 . . . . . . Metadata 1 Obecný úvod 2 Identifikátory 3 Metadata 4 Interoperabilita LObecný úvod Identifikátory Metadata Interoperabilita 18 / 33 . . . . . . Členění metadat Metadata členíme do tří kategorií: metadata popisná metadata strukturální metadata administrativní V praxi nemusí být toto rozdělení striktně dodržováno a jednotlivé typy se často překrývají. LObecný úvod Identifikátory Metadata Interoperabilita 19 / 33 . . . . . . MARC MARC (Machine Readable Cataloging) LObecný úvod Identifikátory Metadata Interoperabilita 20 / 33 . . . . . . MARC Rozmezí Význam Rozmezí Význam 000-008 kontrolní pole 4XX údaje o edici 01X-04X kódované údaje 5XX poznámky 05X-08X klasifikace, signatury 6XX věcný popis 1XX hlavní záhlaví 70X-75X vedlejší záhlaví 20X-24X názvové údaje 76X-78X vazebná pole 250-270 nakladatelské údaje 80X-830 vedl. záhlaví pro edice 3XX fyzický popis 841-88X holdings, lokace Table: Struktura pole dat formátu MARC 21 LObecný úvod Identifikátory Metadata Interoperabilita 21 / 33 . . . . . . Dublin Core nekvalifikovaný Dublin Core 15 základních metadatových prvků obsah (název, předmět, popis, pokrytí, typ, zdroj, vztah) intelektuální vlastnictví (tvůrce, přispěvatel, vydavatel, práva) instance síťového zdroje (identifikátor, datum, jazyk, formát) kvalifikovaný Dublin Core kvalifikátor prvku kvalifikátor hodnoty kvalifikátory musí splňovat princip ”dumb-down” LObecný úvod Identifikátory Metadata Interoperabilita 22 / 33 . . . . . . Dublin Core Ukázka kvalifikovaného Dublin Core IDENTIFIER=http://www.ukoln.ac.uk/metadata/resources/dc/datamodel/WD-dc-rdf: URL TITLE = Guidance on expressing the Dublin Core within the RDF TITLE = Dublin Core in RDF: Eine Anleitung CREATOR = Eric Miller CREATOR = Paul Miller CREATOR.Illustrator = Dan Brickley DESCRIPTION.Abstract = This work describes work carried out by … SUBJECT.Keywords = Dublin Core; DC; Resource Description Framework; RDF; XML PUBLISHER = Dublin Core Metadata Initiative CONTRIBUTOR = Dublin Core Data Model Working Group DATE.Created = 1999-07-01 : ISO8601 DATE.Revised = 1999-11-10 : ISO8601 LANGUAGE = en : RFC1766 TYPE = Working Draft FORMAT.Medium = text/html : IMT MYELEMENT.Checksum = 123456 : XYZ LObecný úvod Identifikátory Metadata Interoperabilita 23 / 33 . . . . . . Metadata Kongresové knihovny MODS (Metadata Object Description Schema) navrženo odborníky z Kongresové knihovny (Library of Congres) a Marc Standard Office založen na jazyce XML (titleInfo, name, typeOfResource, genre, originInfo, language, physicalDescription, abstract, tableOfContents, targetAudience, note, subject, classification, relatedItem, identifier, location, accessCondition, part, extension, recordInfo) obsahuje 20 základních prvků dělí se na podprvky mohou obsahovat atributy LObecný úvod Identifikátory Metadata Interoperabilita 24 / 33 . . . . . . Metadata Kongresové knihovny LObecný úvod Identifikátory Metadata Interoperabilita 25 / 33 . . . . . . Reprezentace metadat HTML RDF Access Rights in Enterprise Full-text Search KASPRZAK, Jan Document-level security Full-text search INSTICC 2010 Text https://is.muni.cz/publication/890027 978-989-8425-04-1 LObecný úvod Identifikátory Metadata Interoperabilita 26 / 33 . . . . . . Interoperabilita 1 Obecný úvod 2 Identifikátory 3 Metadata 4 Interoperabilita LObecný úvod Identifikátory Metadata Interoperabilita 27 / 33 . . . . . . Stručný přehled Interoperabilita Schopnost vzájemně si rozumět, spolupracovat a dosáhnout součinnosti mezi nezávislými, technicky různorodými systémy. LObecný úvod Identifikátory Metadata Interoperabilita 28 / 33 . . . . . . Úroveň interoperability? federace (striktní použití standardů) sklízení metadat (digitální knihovny nabízejí základní metadata prostřednictvím jednoduchého protokolu) shromažďování dat (digitální knihovny nekooperují; informace se musí hledat explicitně pomocí služeb) vyhledávací middleware (zdroje vybavené metadaty jsou volně zapojovány do kooperace) LObecný úvod Identifikátory Metadata Interoperabilita 29 / 33 . . . . . . Protokol Z39.50 architektura klient/server stavový protokol komunikaci inicializuje klient, provede sekvenci interakcí a spojení uzavře Klient Z39.50 Databáze 1 Databáze 2 Databáze 3 Databáze 4 S1 S2 S3 S4 Uživateli je výsledek p ředkládán, jakoby pocházel z jednoho logického zdroje Virtuální katalog Jeden uživatel vyhledává pomocí n dotazů v n databázích LObecný úvod Identifikátory Metadata Interoperabilita 30 / 33 . . . . . . Open Archives Initiative (OAI) OAI-PMH (OAI Protocol for Metadata Harvesting) protokol pro hromadné sklízení metadat založen na základních otevřených standardech a protokolech (HTML, XML, HTTP) 6 příkazů kódovaných do URL Identify ListSets ListIdentifiers ListMetadataFormats GetRecord ListRecords příklad dotazu: http://memory.loc.gov/cgi- bin/oai2_0?verb=ListIdentifiers&set=gmd&metadataPrefix=oai_dc LObecný úvod Identifikátory Metadata Interoperabilita 31 / 33 . . . . . . Stanfordský InfoBus wrapper pro každý systém wrappery transformují zprávy z/do interního rozhraní (protokol DLIOP) LObecný úvod Identifikátory Metadata Interoperabilita 32 / 33 . . . . . . OpenURL a SFX Open URL standard pro kódování metadat o zdroji do jeho URL (ANSI norma Z39.88) http://resolver.example.edu/cgi?url_ver=Z39.88- 2004&rft_val_fmt=info:ofi/fmt:kev:mtx:book& rft.isbn=0836218310&rft.btitle=The+Far+Side+Gallery+3 SFX aplikační rámec nad OpenURL LObecný úvod Identifikátory Metadata Interoperabilita 33 / 33 . . . . . . Závěr Děkuji za pozornost.