Управління даними досліджень

 

Управління даними досліджень (Research Data Management, RDM) є важливою складовою організації процесу наукового дослідження.

Дані дослідження можуть бути представлені у вигляді тексту, вимірювань експериментів, статистичних таблиць, мультимедіа (аудіо, відео, фото), геопросторових записів, програмного коду.

Управління даними включає планування і розробку дослідницького проекту; збір, аналіз, зберігання даних; документування, архівування, організація доступу; повторне використання даних.

 

Розробка плану управління даними (Data Management Plan, DMP) є вимогою більшості організацій, що надають гранти на проведення наукових досліджень.

Інструменти для укладання DMP відрізняються залежно від країни походження та вимог грантодавця, наприклад: DMP Assistant (Канада), DMP Tool (США), DMPOnline (Великобританія, ЄС), Guidelines on FAIR Data Management in Horizon 2020 (ЄС).

Ефективна робота з даними передбачає структуризацію файлів, документування процесу дослідження та метаданих. 

Структуризація файлів потребує створення папки проекту і окремих підпапок з джерелами публікації, статистичними (експериментальними) даними, результатами досліджень (програмний код, таблиці аналізу даних, текст роботи) та README-файлом.

Документування метаданих, методології аналізу і трансформації даних забезпечує розуміння даних та процесу дослідження усіма зацікавленими сторонами. 

Метадані – інформація про оригінальні дані – описують дані та допомагають їх класифікувати, упорядковувати і характеризувати.

Ключовими елементами метаданих є визначення та позначення показників, одиниць їх виміру, короткий опис методології оцінювання та джерел даних.

Назви файлів мають бути унікальні, змістовні, не дуже довгі. Бажано використовувати стандартизовану форму для різних версій документів. 

Рекомендовані елементи для назви файлів: 

 ➠  назва проекту або ім'я дослідник

 ➠  вид роботи або дата створення файлу (YYYYMMDD)

 ➠  версія документу (напр., V1, V1_2, V2)

 ➠  використання символів з наборів A-Z, a-z, 0-9, дефіс, підкреслення і крапка

Приклади: MultivariteAnalysis_Part2_20190221.docx, Protsiuk_Thesis_V1.pdf, UkrStat _2000-2019.xlsx

Для забезпечення машинного читання файлів використовують такі формати даних

➠  Табличні дані – CSV замість XLSX

➠  Текстові дані – TXT або PDF замість DOC

➠  Бази даних – XML або SQLITE замість MDB,  DBF, SQL

➠  Візуальні –  PDF, TIFF, JPEG2000,  MPEG-4, WAVE, AIFF

 

 

 

Для збереження даних і їх відтворення на випадок пошкодження використовують резервне копіювання інформації.

Правила резервного копіювання 3-2-1:

  • 3 копії (1 оригінал READ ONLY, 2 копії)
  • 2 різні типи сховищ (жорсткий диск, USB, хмара)
  • 1 копія на фізичному носії, 1 копія на е-диску

Спеціальні програми для управління проектами та версіями файлів: GIT: GitHub, GitLab, BitBucket, Trello.

Платформи для зберігання та обміну файлами: Open Science Framework, Google Drive, Dropbox, Box.

Для організації спільного, необмеженого або часткового використання даних, можна скористатися відкритими ліцензіями Creative Commons. Користувачі здобувають можливість вільно використовувати цифровий контент за згодою авторів та інших суб’єктів авторських прав.

Види ліцензій Creative Commons.

Як обрати машиночитну ліцензію Creative Commons.

Пошук контенту з ліцензією Creative Commons:

➠  за допомогою creativecommons.org

➠  за допомогою Розширеного пошуку Google / Додаткові налаштування / Права на використання

Бібліотека Сумського державного університету
вул. Римського-Корсакова, 2,
м. Суми, Україна, 40007

  +38 (0542) 33-10-39
  info@library.sumdu.edu.ua

У разі використання матеріалів із сайту Бібліотеки СумДУ посилання на ресурс обов’язкове!

library.sumdu.edu.ua