Výzkumná data

Výzkumná data zahrnují informace a fakta, která byla shromážděna, vytvořena nebo analyzována v průběhu vědeckého výzkumu. Slouží jako základ ke zkoumání nových jevů, ověřování hypotéz, formulování závěrů, tvorbu publikací, vývoji nových technologií nebo ke sdílení a replikaci výsledků mezi vědci. Výzkumná data mají řadu forem v závislosti na oblasti výzkumu a metodách sběru.

Příklady výzkumných dat: 

  • Číselná data: naměřené hodnoty, tabulky, statistiky (např. výsledky experimentů, průzkumy, fyzikální měření). 
  • Textová data: záznamy rozhovorů, poznámky z terénního výzkumu, dokumenty, laboratorní deníky. 
  • Obrazová data: fotografie, mikroskopické snímky, mapy, videozáznamy. 
  • Zvuková data: nahrávky rozhovorů, zvukové signály, hudba. 
  • Kódy a modely: algoritmy, simulační modely, softwarové kódy. 
  • Experimentální vzorky: biologické vzorky, chemické látky, archeologické artefakty. 

FAIR data  

Výzkumná data by dle principů Open Science měla být tzv. FAIR:  

  • Findable – nalezitelná (data jsou popsána dostatečně podrobnými metadaty a je jim přidělen perzistentní identifikátor – např. DOI) 
  • Accessible – dostupná (data nebo alespoň metadata jsou volně přístupná, ideálně uložená v důvěryhodném repozitáři) 
  • Interoperable – interoperabilní (data jsou popsána standardizovanými výrazy a je možné je integrovat s jinými datasety) 
  • Reusable – znovu využitelná (data jsou dostatečně popsaná a sdílená pod co nejméně restriktivní licencí, aby bylo jasné, jak vznikla, co popisují a jak s nimi mohou další uživatelé nakládat). 

f.a.i.r.

Open data 

Výzkumná data by měla být otevřená, ale ne vždy je to možné vzhledem k řadě specifik, kterými se vyznačují: 

  • Nelze požadovat okamžitý přístup (právo prvního využití). 
  • Data nelze vždy otevřít, protože obsahují citlivé osobní nebo komerční údaje. 
  • Data mají často velký rozsah (tisíce až miliony souborů v jednom datasetu, rychlý růst v čase). 
  • Data mají velkou variabilitu formátů a forem (často netextové). 
  • Existují velké rozdíly mezi obory – různé standardy.  
  • Existují různé kategorie dat – surová data, zpracovaná data, analyzovaná data (kterou z kategorií sdílet?). 
  • Zpřístupnění dat někomu jinému je spojeno s velkou pracností (uspořádání, popis, přenos, řízení přístupu). 
  • Atd. 

 Proto pro otevírání výzkumných dat platí následující pravidlo:  

„As Open as Possible, as Closed as Necessary“.  

Data