F1. (meta)datům je přiřazen jedinečný a perzistentní identifikátor (např. DOI)
F2. data jsou popsána dostatečnými metadaty
F3. (meta)data jsou registrována nebo indexována v prohledávatelných zdrojích
F4. metadata specifikují identifikátor
Základním předpokladem pro možnost opakovaného použití výzkumných dat je, že jak lidé, tak stroje budou moci data najít. Významnou roli hrají perzistentní identifikátory (jako je např. DOI nebo handle pro digitální objekty, ORCID pro autory nebo ROR pro instituce) a strojově čitelná metadata.
Perzistentní (trvalý) identifikátor je prostředek sloužící k jednoznačné identifikaci jednotlivých objektů. Perzistentních identifikátory jsou:
Globálně unikátní
Perzistentní
Resolvovatelný
Perzistentní identifikátory mohou mít podobu webové adresy (např. ROR Univerzity Karlovy https://ror.org/024d6js02), je však důležité připomenout, že URL není perzistentní identifikátor. Pokud se obsah z webové stránky přesune, uživatel se pouze dozví, že webová stránka neexistuje nebo její obsah nebyl nalezen. V případě využití perzistentního identifikátoru je buď zajištěno přesměrování, nebo je uvedena informace, že daný obsah byl odstraněn a není již možné jej na internetu nalézt.
V akademickém prostředí se můžete setkat s perzistentními identifikátory například pro:
Osoby: ORCID, ResearcherID
Publikace a časopisy: DOI, ISSN, ISBN
Digitální objekty: DOI, handle
Organizace: ROR, Ringgold ID, ISNI
a další ...
Některé perzistentní identifikátory může autor získat sám – autor se může například zaregistrovat a získat pro sebe identifikátor ORCID nebo ResearcherID. Obecně je pro přidělení perzistentního identifikátoru potřeba služba, která má oprávnění identifikátory přidělovat – u vědeckých publikací jsou to typicky vydavatelé, u vědeckých dat tuto službu mohou poskytovat některé repozitáře. Když vybíráte vhodný repozitář pro svá data, zkontrolujte, zda vašim datům identifikátor přidělí.
Metadata jsou data popisující jiná data a obsahují například název datové sady, autora, klíčová slova, informace o licenci, popis vlastností a další údaje. Lidé i stroje typicky vyhledávají data podle metadatového záznamu, proto je důležité data důkladně popsat. Pokud není metadatový popis kvalitní, pak je velmi těžké data najít.
Při tvorbě metadat je vhodné používat standardizované formáty a ontologie (= řízené slovníky). Tím zajistíte, že vaši kolegové z oboru vašim datům snadno porozumí a zároveň zvýšíte jejich interoperabilitu, tedy možnost kombinovat datové sady z různých zdrojů. K vyhledání vhodných metadatových standardů můžete využít například platformu FAIRsharing, seznam oborových metadatových standardů na stránkách DCC, nebo české otevřené formální normy.
Pro snazší identifikaci popisovaných objektů a snazší strojové zpracování by metadata měla obsahovat další relevantní perzistentní identifikátory, např. identifikátor samotné datové sady, DOI související publikace, ORCID pro označení autora datové sady apod.
Sídlo, fakturační a korespondenční adresa:
Univerzita Karlova
Ústřední knihovna
Ovocný trh 560/5
116 36 Praha 1
Česká republika
Adresa pracoviště:
José Martího 2 (2. patro)
160 00 Praha 6
Telefonní kontakty: na této stránce
E-mail: openscience@cuni.cz
Web: openscience.cuni.cz