Data Management Plan
Kvalitní management výzkumných dat se týká celého životního cyklu dat a jeho součástí by měl být plán (Data Management Plan, DMP), s jakými daty bude výzkumník pracovat, jak je bude sbírat, zpracovávat, organizovat, analyzovat, uchovávat, sdílet a znovu využívat. DMP je „živý“ dokument, který je nutné průběžně aktualizovat tak, aby reflektoval, co se s daty skutečně dělo a děje. Od roku 2022 je v České republice DMP stanoven zákonem jako povinný dokument, který doplňuje průběžné a výroční zprávy vědeckých projektů financovaných z veřejných prostředků (novela zákona č. 130/2002 Sb. § 12a Přístup k výzkumným datům). Přípravu a následnou realizaci DMP tedy v současné době vyžadují také poskytovatelé financí a stává se běžnou součástí výzkumných projektů.
Obsah DMP
Kvalitní DMP předpokládá, že vědci mají dobře rozmyšleno, jak budou postupovat ve svém výzkumu. DMP totiž obsahuje informace o primárních i sekundárních datech, která budou ve výzkumu využita, popisuje, jak budou data získána, jak budou chráněna, jak a kde budou uložena a za jakých podmínek budou zpřístupněna pro další využití.
Zákon nepředepisuje, jak konkrétně má DMP vypadat. Záleží tedy na požadavcích poskytovatele financí, na konkrétním projektu a také na vědním oboru, protože výzkumná data a jejich správa se u jednotlivých oborů poměrně výrazně liší (např. citlivá data v oblasti medicíny nebo sociologie vyžadují specifickou ochranu, data v oblasti fyziky nebo biologie jsou z důvodu velkého objemu náročná na ukládání a zálohování).
Obecně by DMP měl obsahovat:
- Administrativní data
Uveďte základní informace, které poskytnou kontext k danému DMP — základní informace o výzkumu (např. název projektu, jméno, kontaktní údaje a ID hlavního řešitele, poskytovatel financí, partneři projektu), krátký popis výzkumu, ke kterému se data vztahují (abstrakt), nařízení, opatření nebo směrnice, které upravují uchovávání dat.
- Popis dat
Definujte, jaká data budou sbírána nebo vytvářena a jakým způsobem — typ a odhadovaný objem dat, využití již existujících dat, v jakých formátech budou data uložena.
- Dokumentace a metadata
Poskytněte informace, které jsou potřeba pro čtení a interpretaci dat v budoucnosti — jaká metadata budou použita k popisu dat, jaké standardy budou dodržovány pro formátování a dokumentaci dat, použité perzistentní identifikátory (např. DOI), jak bude zajištěna kontrola kvality dat (metody pro ověřování přesnosti, úplnosti a konzistence dat).
- Etické a právní otázky
Zvažte etické a právní záležitosti — zda je nutný souhlas pro uchovávání a sdílení dat, jak budou chráněna citlivá a osobní data, jak budou data chráněna před neoprávněným přístupem, ztrátou nebo zneužitím (anonymizace/pseudonymizace dat apod.).
- Ukládání a zálohování dat
Zvažte, kde budou data ukládána a jak budou zálohována, včetně přístupu k nim a zajištění bezpečnosti — dostatek místa pro ukládání dat (datový repozitář), náklady na úložné prostory, objem dat, určení zodpovědnosti za zálohování a obnovení dat, potenciální riziko pro zabezpečení dat včetně řešení, bezpečný přístup spoluřešitelů k datům.
- Archivace a dlouhodobé uchovávání
Určete, která data jsou vhodná pro dlouhodobou ochranu a jak je nejlépe uchovat — existující smluvní/právní podmínky pro uchování dat, výběr dat pro dlouhodobé uchování, časové a finanční náklady na přípravu dat pro jejich dlouhodobé uchování a sdílení.
- Sdílení a dostupnost dat
Rozmyslete, která data budete sdílet, jakým způsobem je budete sdílet (např. otevřené repozitáře), s kým je budete sdílet a za jakých podmínek (licence), kdy budou data dostupná, a jak se o datech dozví potenciální uživatelé.
- Role a odpovědnosti
Určete role a odpovědnosti pro všechny aktivity s daty v rámci výzkumu — kdo bude odpovědný za správu dat a realizaci DMP, jak bude odpovědnost rozdělena mezi členy projektu apod.
- Financování a náklady
Rozmyslete, jaké budou náklady spojené s ukládáním, zálohováním, sdílením a archivací dat (vybavení, expertíza, použití software a hardware, další finanční a lidské zdroje) a jak budou tyto náklady financovány (např. grantové prostředky, institucionální podpora apod.).
Příklady zveřejněných DMP pro inspiraci:
Nástroje pro tvorbu DMP
DMP může mít podobu sdíleného dokumentu nebo je možné využít online nástroje, které pomáhají DMP vytvořit a prostřednictvím relevantních otázek vědce nasměrovat ke konkrétním odpovědím, z nichž pak požadovaný dokument vygenerují. Mezi tyto nástroje patří specializovaný software jako například DMPonline nebo Data Stewardship Wizard. Jejich výhodou je také to, že podporují nejen tvorbu DMP dokumentu a jeho průběžnou aktualizaci, ale také samotný proces správy výzkumných dat a spolupráci mezi vědci. Forma plánu může být v těchto online nástrojích přizpůsobena požadavkům jednotlivých projektů nebo institucionálním a oborovým specifikům.
Sdílený dokument
- Google Docs, Office 365 Word, Overleaf, atd.
Specializovaný software
- ARGOS (Open AIRE)
- DMPTool (University od California)
- DMPOnline (Digital Curation Centre)
- Data Stewardship Wizard (ELIXIR)
- FAIR Wizard
DMPOnline
DMPOnline umožňuje vytvoření DMP za použití šablon připravených pro požadavky konkrétních poskytovatelů financí, podporuje spolupráci s kolegy a veřejné sdílení vytvořeného plánu. Pokud uživatel nepřipravuje DMP pro konkrétního poskytovatele financí, může si zvolit obecnou šablonu Digital Curation Centre. Kromě přednastavené šablony obsahuje také nápovědu, která uživateli s vyplněním jednotlivých sekcí pomůže. Vytvořený plán je pak možné stáhnout v různých formátech (např. csv, html, docx, pdf nebo json).
Data Stewardship Wizard
Volně dostupný webový nástroj, který pomocí návodných otázek intuitivně vede autora při tvorbě DMP. Zobrazují se mu jednotlivé sekce spravovaných výzkumných dat a díky formě znalostních modelů (stromových dotazníků) tento nástroj zobrazuje jen relevantní otázky na základě předešlých odpovědí. Výhodou tohoto nástroje je také integrace procesu tvorby DMP s principy FAIR, čímž umožňuje zpracovávat data v souladu s Open Science. DS-Wizard poskytuje rovněž odkazy na nápovědu a podporuje spolupráci a sdílení týmových projektů. Finální DMP je možné exportovat ve více dostupných šablonách (Machine-Actionable DMP, Horizon 2020, Horizon Europe, Science Europe) a formátech (např. pdf, docx, html, LaTeX a json).
Návody na práci s DSW a vytvoření DMP:
GAČR – Scientific Data Management Training
Jak na data management plan (nejen) pro GAČR
MENDELU – Jak na tvorbu Data management plánu
MENDELU – Návod pro vytvoření Data management plánu v nástroji Data Stewardship Wizard
Nabídka sekce: Výzkumná data