Jak sdílet výzkumná data

Výzkumná data je možné sdílet mnoha různými způsoby. Častou, avšak nepříliš vhodnou metodou sdílení výzkumných dat je jejich zasílání e-mailem na vyžádání. Tento postup jednak komplikuje přístup k datům pro uživatele a jednak zatěžuje samotného autora dat, který musí žádosti o poskytnutí dat individuálně vyřizovat. Kromě toho hrozí také riziko, že vědec o svá data přijde například v důsledku selhání hardwaru, kde jsou data uchovávána, či vlivem lidské chyby, nebo v případě, že od doby publikace článku uplynula delší doba, nebude schopen přesně určit, který soubor byl pro analýzu dat použitý. Sdílení výzkumných dat prostřednictvím e-mailu také neumožňuje uživateli data řádně citovat. Proto je vhodnější zvolit jiný způsob sdílení.


Následující část se věnuje třem možným metodám sdílení výzkumných dat:


  1. Doplňující materiály k publikovanému článku (Supplementary Material)

  2. Prostřednictvím datového repozitáře 

  3. Publikace v datovém časopise 

Doplňující materiály k vědeckému článku

Některá vydavatelství nabízí možnost přiložit k článku doplňující materiály (Supplementary Materials). Autoři takto mohou k článku přiložit například podkladová data nebo skript, který použili ke zpracování dat, a vydavatel tyto materiály následně publikuje online a k článku přidá odkaz. Rozhodnete-li pro tuto možnost, mějte na paměti, že pokud se nejedná o open access publikaci, pak v takovém případě většinou mohou majetková práva přejít na vydavatele. Další nevýhodou tohoto modelu je, že čtenáři nebudou moci data dále využít a nebude možné dataset citovat nezávisle na publikaci. 


Tento způsob zveřejňování dat může být vhodný například pokud se jedná o rozsáhlejší tabulku s naměřenými hodnotami, která by byla součástí článku, ale je příliš rozměrná, než aby se vešla na stránku časopisu. Pro jiný typ dat je vhodnější publikování prostřednictvím datového repozitáře a přiložení odkazu na datovou sadu k článku.

Datové repozitáře

Nejvhodnějším způsobem, jak uchovat svá data – ať už se rozhodnete je otevřít či nikoli – je jejich uložení do datového repozitáře


Abyste zvýšili pravděpodobnost, že vědci z oboru vaše data najdou, je vhodné uložit svá data do oborového repozitáře. Výhodou oborových repozitářů je, že sdružují výzkumné pracovníky konkrétního vědního oboru, kteří mezi sebou svá data sdílejí, a také, že se snáze přizpůsobí potřebám daného oboru, například pokud se jedná o typ dat, která se v daném oboru produkují. Příkladem oborového repozitáře je LINDAT/CLARIAH-CZ pro lingvistická data a nástroje, který je provozovaný na Ústavu formální a aplikované lingvistiky na MFF UK.  


Při výběru vhodného oborového repozitáře je dobré dbát oborových zvyklostí – můžete se zeptat svých kolegů, kam data ukládají, nebo využít mezinárodní registr datových repozitářů re3data.org (Registry of Research Data Repositories). 


Pokud se vám nepodaří najít vhodný oborový repozitář, můžete využít obecné repozitáře (také tzv. sirotčí), které ukládají data bez ohledu na oborové zaměření. Mezi nejpoužívanější obecné repozitáře patří Zenodo, Figshare nebo Dryad. Pro porovnání obecných repozitářů můžete využít tuto srovnávací tabulku.


Při výběru vhodného repozitáře si také zjistěte následující: 

  • Přidělí repozitář vašim datům perzistentní identifikátor (např. DOI)? Díky perzistentním identifikátorům jsou vaše data snáze vyhledatelná a citovatelná. 

  • Je repozitář důvěryhodný/certifikovaný? U certifikovaných repozitářů máte větší jistotu, že je o vaše data dobře postaráno. 

  • Poskytuje vybraný repozitář otevřený přístup k uloženým datům? Pokud chcete svá data sdílet otevřeně, pak je toto klíčová informace. 

  • Opatří repozitář vaše data licencí? Uvádí jasné podmínky, za jakých lze data uložená v repozitáři využívat? Je důležité, aby uživatelé vašich dat věděli, jak s nimi mohou nakládat. 

  • Poskytne repozitář pro vaše data úvodní stránku s metadaty? Metadata pomohou ostatním data najít, zjistit, co je to za data, a také jak je citovat. 

  • Umožňuje repozitář verzování? Pokud svůj dataset aktualizujete, můžete jej nahrát jako novou verzi k původnímu datasetu. Nový dataset dostane přidělený svůj vlastní identifikátor a uživatelé snadno zjistí, jaká je nejnovější verze nebo jaká verze byla použita v původní studii.  


Na portálu re3data.org můžete některé z těchto informací snadno ověřit. U každého záznamu najdete v pravém horním rohu sérii piktogramů, které vám prozradí například, zdali repozitář používá perzistentní identifikátory, je otevřený, nebo zdali je certifikovaný. Bližší informace pak najdete po rozkliknutí záznamu nebo přímo na stránkách daného repozitáře. 


Ukázka popisu repozitáře LINDAT/CLARIN v re3data
Ukázka popisu repozitáře LINDAT/CLARIN v re3data


Tento způsob zveřejňování dat je vhodný jak pro samostatné datové sady, tak pro sdílení podkladových dat k publikovaným článkům. Publikujete-li podkladová data k článku, nezapomeňte k němu připojit odkaz na tato data, nejlépe formou persistentního (trvalého) identifikátoru (např. DOI).

Datové časopisy

Datové časopisy odráží model klasického vědeckého publikování prostřednictvím článku a kombinují sdílení dat v repozitáři s publikováním datového článku (také tzv. data paper, data descriptor, data note). Datový článek je analogický s tradičními vědeckými publikacemi, lze jej citovat a také je možné jej vykázat v OBD (systém pro vykazování tvůrčí činnosti na UK).


Datové články mohou mít různou strukturu dle požadavků jednotlivých časopisů, avšak základním rysem je, že popisují určitý online dostupný dataset, nikoli analýzu na něm provedenou. Článek by měl poskytovat informace o tom, co je to za data, kdy, kde a jakým způsobem vznikla atd., a také by měl obsahovat odkaz na daný dataset (nejlépe prostřednictvím trvalého identifikátoru jako je DOI). Obecně by vydavatelé neměli data samotná uchovávat, ta by měla být uložena v důvěryhodném otevřeném datovém repozitáři tak, aby data byla k dispozici i tehdy, je-li k článku omezený přístup.


Tak jako u klasických publikací, i datové časopisy provádí standardní recenzní řízení, ale mohou se lišit tím, co od recenzentů vyžadují a zda je recenzní řízení otevřené, či nikoli.


Níže naleznete několik příkladů datových časopisů, další můžete najít např. zde

Užitečné zdroje:

Chavan, Vishwas & Lyubomir Penev. 2011. The data paper: a mechanism to incentivize data publishing in biodiversity science. BMC Bioinformatics 12, S2. https://doi.org/10.1186/1471-2105-12-S15-S2


Gould, Julie. 2014. How to publish your data in a data journal. Naturejobs Blog. Dostupné z: http://blogs.nature.com/naturejobs/2014/12/04/how-to-publish-your-data-in-a-data-journal/


Stall, Shelley, Maryann E. Martone, et al. 2020. Generalist repository comparison chart. Zenodo. http://doi.org/10.5281/zenodo.3946720




Poslední změna: 21. listopad 2022 13:06 
Sdílet na: Facebook Sdílet na: Twitter
Sdílet na:  
Napište nám
Kontakty

Sídlo, fakturační a korespondenční adresa:

Univerzita Karlova

Ústřední knihovna

Ovocný trh 560/5

116 36 Praha 1

Česká republika


Adresa pracoviště:

José Martího 2 (2. patro)

160 00 Praha 6


Telefonní kontakty: na této stránce

E-mail: openscience@cuni.cz

Web: openscience.cuni.cz


Jak k nám