Аналіз даних – це робота з даними з метою їх правильного впорядкування, інтерпретування за допомогою аналітичних та статистичних інструментів, пошуку корисної інформації для прийняття раціональних рішень.

Існує багато універсальних та спеціалізованих мов програмування, програмних пакетів, веб сервісів для аналізу та візуалізації даних. 

Ми підібрали для вас добірку доступних відкритих інструментів для аналізу даних:

 

Ліцензійне програмне забезпечення СумДУ в межах пакета Microsoft Office 365:

Excel – один з найдоступніших інструментів аналізу та візуалізації даних. Дозволяє швидко сортувати, фільтрувати, аналізувати дані. 

Power BI – комплексне програмне забезпечення бізнес-аналізу (Business Intelligence), яке дозволяє очищувати, консолідувати дані, перетворювати їх у зручний для аналізу формат, моделювати результат різних варіантів дій та відстежувати результати прийняття рішень.

 

Комерційні програмні продукти, що пропонують безкоштовні пакети:

Datawrapper – безкоштовний вебсервіс з відкритим кодом для створення дизайнерських діаграм, карт, таблиць, інфографіки, є адаптивним для різних пристроїв, операційних систем. 

Tableau Public – інструмент для аналізу даних, який пропонує інформацію за допомогою візуалізації даних без застосування програмування. Візуалізації, опубліковані в Tableau Public, можна вбудовувати в блоги, вебсторінки та обмінюватися електронною поштою чи соціальними мережами. Спільний вміст можна зробити доступним для завантаження.

 

Програмне забезпечення відкритого коду та ліцензії: 

Jupyter – веб додаток, дозволяє користувачу писати коди та текстові елементи різноманітної форми (абзаци, рівняння, заголовки, посилання, фігури). Інструмент дозволяє ділитися інтерактивними алгоритмами зі своєю аудиторією, зосереджуючись на навчанні.

Python – мова програмування, що дозволяє проводити обробку даних, аналіз, створювати візуалізацію, прогнози та збереження даних, що полегшує користувачеві реалізацію рішень, дотримуючись стандартів необхідних алгоритмів.

R – мова програмування і програмне середовище для статистичних обчислень, аналізу та зображення даних в графічному вигляді.

RStudio IDE – інтегроване середовище розробки для R, мови програмування обчислювальної статистики та візуалізації даних.

Open Refine – потужний інструмент для очищення, трансформації, аналізу, візуалізації даних.

 

Хмарні сервіси для аналізу даних та машинного навчання:

Google Colaboratory – хмарний сервіс, спрямований на спрощення досліджень в області машинного і глибокого навчання. Використовуючи Colaboratory, можна отримати віддалений доступ до ПК з під'єднаною відеокартою абсолютно безкоштовно. 

KDnuggets – відкрита платформа для пошуку програмного забезпечення для різних задач аналітики даних та машинного навчання.

Kaggle (Google LLC) – відкрита платформа з машинного навчання та аналізу даних.

Консультанти:

Бібліотека Сумського державного університету
вул. Харківська, 116,
м. Суми, Україна, 40007

  +38 (0542) 68-79-29
  [email protected]

У разі використання матеріалів із сайту Бібліотеки СумДУ посилання на ресурс обов’язкове!

library.sumdu.edu.ua