Výzkumná data
Výzkumná data zahrnují informace a fakta, která byla shromážděna, vytvořena nebo analyzována v průběhu vědeckého výzkumu. Slouží jako základ ke zkoumání nových jevů, ověřování hypotéz, formulování závěrů, tvorbu publikací, vývoji nových technologií nebo ke sdílení a replikaci výsledků mezi vědci. Výzkumná data mají řadu forem v závislosti na oblasti výzkumu a metodách sběru.
Příklady výzkumných dat:
- Číselná data: naměřené hodnoty, tabulky, statistiky (např. výsledky experimentů, průzkumy, fyzikální měření).
- Textová data: záznamy rozhovorů, poznámky z terénního výzkumu, dokumenty, laboratorní deníky.
- Obrazová data: fotografie, mikroskopické snímky, mapy, videozáznamy.
- Zvuková data: nahrávky rozhovorů, zvukové signály, hudba.
- Kódy a modely: algoritmy, simulační modely, softwarové kódy.
- Experimentální vzorky: biologické vzorky, chemické látky, archeologické artefakty.
FAIR data
Výzkumná data by dle principů Open Science měla být tzv. FAIR:
- Findable – nalezitelná (data jsou popsána dostatečně podrobnými metadaty a je jim přidělen perzistentní identifikátor – např. DOI)
- Accessible – dostupná (data nebo alespoň metadata jsou volně přístupná, ideálně uložená v důvěryhodném repozitáři)
- Interoperable – interoperabilní (data jsou popsána standardizovanými výrazy a je možné je integrovat s jinými datasety)
- Reusable – znovu využitelná (data jsou dostatečně popsaná a sdílená pod co nejméně restriktivní licencí, aby bylo jasné, jak vznikla, co popisují a jak s nimi mohou další uživatelé nakládat).
Open data
Výzkumná data by měla být otevřená, ale ne vždy je to možné vzhledem k řadě specifik, kterými se vyznačují:
- Nelze požadovat okamžitý přístup (právo prvního využití).
- Data nelze vždy otevřít, protože obsahují citlivé osobní nebo komerční údaje.
- Data mají často velký rozsah (tisíce až miliony souborů v jednom datasetu, rychlý růst v čase).
- Data mají velkou variabilitu formátů a forem (často netextové).
- Existují velké rozdíly mezi obory – různé standardy.
- Existují různé kategorie dat – surová data, zpracovaná data, analyzovaná data (kterou z kategorií sdílet?).
- Zpřístupnění dat někomu jinému je spojeno s velkou pracností (uspořádání, popis, přenos, řízení přístupu).
- Atd.
Proto pro otevírání výzkumných dat platí následující pravidlo:
„As Open as Possible, as Closed as Necessary“.
Nabídka sekce: Oddělení pro Open Science