Otevřená výzkumná data

Vedle otevřeného přístupu k vědeckým publikacím je dnes diskutován a řešen také otevřený přístup k výzkumným datům (open research data, ORD). Důležitost otevřeně zveřejňovat nejen publikace, ale také data, si uvědomuje mj. Evropská komise, která od roku 2017 dává za povinnost ukládat a zveřejňovat výzkumná data příjemcům podpory z rámcového programu Horizont 2020 (Open Research Data Pilot). 


Otevřená výzkumná data jsou taková data, která jsou volně dostupná online komukoli a mohou být dále využívána, upravována a sdílena za jakýmkoli účelem. 


Navzdory rozšířeným představám, otevírání vědeckých dat neznamená, že všechna vaše data musí být volně přístupná. Ne všechna data lze totiž otevřeně sdílet. Přístup může být omezen obzvláště v případě, že je otevřené sdílení v rozporu s existujícími pravidly o ochraně osobních údajů, nebo je v rozporu s autorským právem. Obecně platí, že data by měla být otevřená co nejvíce je to možné a zároveň uzavřená, jak je to nutné

Stupně otevřenosti

Otevřená data: Otevřená data jsou ta, ke kterým má přístup kdokoli a lze je využívat, upravovat a sdílet za jakýmkoli účelem


Sdílená data: Sdílená data mohou být také široce přístupná, jako otevřená data, ale jejich užití může být omezeno nějakými podmínkami, jako například nekomerční využití. Někdy mohou být sdílená data přístupná pouze určitým skupinám uživatelů, například v rámci instituce. 


Uzavřená data: Některé typy dat, jako například osobní údaje nebo citlivá obchodní data, nelze sdílet vůbec. I v takovýchto případech je však vhodné sdílet alespoň metadatový popis dat. 

Jaká data sdílet?

Obecně by mělo být zpřístupněné vše, co je potřeba k replikaci vaší studie. Kromě dat samotných a souvisejících metadat to může být například software, nástroje k analýze dat nebo dokumentace v podobě laboratorního protokolu nebo číselníku. Navíc můžete sdílet jakákoli další data, o kterých se domníváte, že by mohla být pro ostatní užitečná.  

Kdo rozhoduje, zda-li svá data můžete sdílet?

Přestože vědci samotní hrají významnou roli při rozhodování, jestli data budou otevřená či nikoli, je důležité si uvědomit, že nejsou jediní, kdo může do procesu rozhodování vstoupit. Rozhodnutí o sdílení dat mohou ovlivnit například: 


Spolupracovníci: Pokud spolupracujete s dalšími vědci, vaši spolupracovníci musí se sdílením výzkumných dat také souhlasit. Toto rozhodnutí byste měli učinit na začátku výzkumného projektu, aby se zabránilo pozdějším konfliktům, a mělo by být zahrnuto ve vašem plánu managementu dat (DMP)


Účastníci výzkumu: Pokud váš výzkum zahrnuje lidské subjekty, pak musíte zajistit, že vám poskytnou informovaný souhlas se sdílením a ukládáním dat. Formulář informovaného souhlasu by měl obsahovat informace o vašich plánech týkajících se užívání, sdílení a dlouhodobého uchovávání jejich údajů. 


Poskytovatelé financí: Někteří poskytovatelé financí mají v podmínkách, že svá výzkumná data musíte otevřít, nebo poskytnout vysvětlení, proč data sdílet nelze.


Proč sdílet data?

Existuje mnoho důvodů, proč by vědecká data měla být co nejotevřenější – můžete z toho mít prospěch jak vy, tak širší vědecká komunita. 

  • Otevřením výzkumných dat zajistíte robustnost vašeho výzkumu, protože umožníte ostatním replikovat výsledky vaší studie 

  • Vylepšení reputace jakožto čestného a pečlivého vědce může zvýšit dopad vaší práce 

  • Vyšší citovanost – vaše data mohou být také citována! Výzkum navíc naznačuje, že zveřejnění dat může vést k vyšší citovanosti související publikace 

  • Splnění podmínek poskytovatelů financí nebo vydavatelů 

  • Efektivní využití zdrojů – stejná data se nemusí vytvářet opakovaně 

  • Sdílení dat může urychlit výzkumný proces 

  • Kombinování výzkumných dat z různých zdrojů může vést k novým poznatkům 

  • Podpora občanské vědy 

  • Omezení podvodů ve vědě


Jak sdílet data?

Obdobně jako publikace jsou otevřená výzkumná data zpřístupňována prostřednictvím digitálních repozitářů nebo datových časopisů.  


Pro vyhledání vhodného datového repozitáře k uložení vlastních dat nebo k dohledání datasetů k dalšímu využití je možné použít mezinárodní registr re3data.org (Registry of Research Data Repositories). Není-li k dispozici žádný vhodný oborový datový repozitář, je možné pro zpřístupnění vlastních dat využít sirotčí repozitář Zenodo. Než budete svá data sdílet, opatřete je vhodnou veřejnou licencí, aby uživatelé věděli, co s vašimi daty mohou a nemohou dělat. 


Více k repozitářům a datovým časopisům naleznete v sekci Repozitáře a datové časopisy


FAIR data

Chcete-li zvýšit opětovnou využitelnost svých výzkumných dat, měli byste zajistit, aby vaše data byla tzv. FAIR. V roce 2016 byl v časopise Scientific Data publikován článek The FAIR Guiding Principles for scientific data management and stewardship, jehož cílem je optimalizovat sdílení a opětovné využívání dat nejen lidmi, ale také počítači. Principy FAIR popisují, jak by data měla být zpracována, aby byla lépe vyhledatelná (Findable), dostupná (Accessible), interoperabilní (Interoperable) a opětovně využitelná (Reusable), a jsou podporovány některými významnými poskytovateli financí, například Evropskou Komisí


Autoři v článku formulovali 15 principů FAIR dat

1. Vyhledatelnost (to be Findable)

Chcete-li, aby vaše data byla opětovně využitelná, pak je třeba zajistit, že je jak lidé, tak stroje budou moci najít. Pro tento účel jsou klíčová strojově čitelná metadata

F1.

(meta)datům je přiřazen jedinečný a perzistentní identifikátor (např. DOI) 

F2.

data jsou popsána dostatečnými metadaty 

F3.

(meta)data jsou registrována nebo indexována ve prohledávatelných zdrojích  

F4.

metadata specifikují identifikátor

2. Dostupnost (to be Accessible)

K datům by měl být zajištěn otevřený přístup, ideálně prostřednictvím repozitáře. Pokud je k datům přístup omezený, pak by měla být volně přístupná alespoň metadata. 

A1.

(meta)data lze získat pomocí jejich identifikátorů při využití standardních komunikačních protokolů 

A1.1

protokol je otevřený, zdarma k dispozici a univerzálně použitelný

A1.2

protokol umožňuje v případě potřeby autentizaci a autorizaci 

A2.

metadata jsou dostupná i v případě, že data samotná již nejsou k dispozici

3. Interoperabilita (to be Interoperable)

Chcete-li, aby bylo možné vaše data integrovat s jinými datasety, pak je vhodné použít standardizované výrazy k popisu dat. 

I1.

(meta)data používají pro reprezentaci znalostí formální, dostupný, sdílený a široce aplikovatelný jazyk

I2.

(meta)data používají slovníky, které se řídí zásadami FAIR

I3.

(meta)data obsahují reference na další (meta)data

4. Opětovná využitelnost (to be Reusable)

Hlavním cílem FAIR principů je zvýšit znovuvyužitelnost vědeckých dat.  K dosažení tohoto cíle je důležité, aby byla data dostatečně popsaná a sdílená pod co nejméně restriktivní licencí, aby uživatelé dat věděli, jak data vznikla, co popisují a jak s nimi mohou nakládat. 

R1.

meta(data) mají množství přesných a relevantních atributů

R1.1

(meta)data jsou zveřejněna s jasnou a dostupnou licencí 

R1.2

(meta)data jsou spojena se svým původem

R1.3

(meta)data splňují standardy vědecké komunity pro daný obor

Jak FAIR jsou vaše výzkumná data?

K posouzení, jak moc jsou vaše data FAIR můžete využít FAIR self-assessment tool vyvinutý australskou iniciativou ANDS-Nectar-RDS, nebo tento checklist, který vytvořila Sarah Jones a Marjan Grootveld pro letní školu EUDAT (do češtiny přeložila D. Hanzlíková).  


Užitečné zdroje

Stránky iniciativy GO FAIR 


OpenAIRE Guide for Researchers: How to make your data FAIR 


OpenAIRE Personal data and the Open Research Data Pilot factsheet 


ANDS, Nectar, RDS: FAIR self-assessment tool  


Hanzlíková, Dagmar. Jak FAIR jsou vaše výzkumná data? Zenodo. http://doi.org/10.5281/zenodo.3739188  


Rygelová, Pavla & Tereza Simandlová. Osobní údaje a politika otevřených výzkumných dat EK: Jak může pomoci OpenAIRE?: informační materiál pro výzkumníky, administrátory a koordinátory projektů: prosinec 2016. 2016. Dostupné také z: http://hdl.handle.net/10084/116555  


Open Data Institute: Open Data Essentials - e-learning course 


Drachen, T.M., Ellegaard, O., Larsen, A.V. and Dorch, S.B.F., 2016. Sharing data increases citations. LIBER Quarterly, 26(2), pp.67–82. http://doi.org/10.18352/lq.10149 


Piwowar HA, Day RS, Fridsma DB. 2007. Sharing Detailed Research Data Is Associated with Increased Citation Rate. PLoS ONE 2(3): e308. https://doi.org/10.1371/journal.pone.0000308  


Poslední změna: 8. březen 2021 13:23 
Sdílet na:  
Napište nám
Kontakty

Sídlo, fakturační a korespondenční adresa:

Univerzita Karlova

Ústřední knihovna

Ovocný trh 560/5

116 36 Praha 1

Česká republika


Adresa pracoviště:

José Martího 2 (2. patro)

160 00 Praha 6


Telefon: +420 224 491 839, 172

E-mail: openscience@cuni.cz

Web: openscience.cuni.cz
Jak k nám