BIG DATA - data science (Poziom Intermediate)

Analiza danych i budowanie modeli predykcyjnych przy pomocy algorytmów uczenia maszynowego (ang. machine learning) z wykorzystaniem języka R.

Czas trwania

3 dni

cena szkolenia netto

netto za 1os.

Kod szkolenia

IT-BD-02

Agenda

Dzień 1

  • Analiza danych, w tym oczyszczenie, filtrowanie, uzupełnianie braków danych, szukanie wartości odstających - pod kątem przygotowaniu zbioru danych pod budowę modelu;
  • Tworzenie bardziej zaawansowanych wizualizacji danych.

 

Dzień 2

  • Wprowadzenie do najczęściej wykorzystywanych metod statystycznych, w tym zarówno zapoznanie z popularnymi algorytmami nadzorowanymi (supervised) jak i nienadzorowanymi (unsupervised);
  • Na podstawie przedstawionej teorii budowanie modeli statystycznych oraz dokonywanie prognoz;
  • Case study.

 

Dzień 3

  • Krótkie przypomnienie Shiny;
  • Tworzenie interaktywnych aplikacji (bardziej zaawansowanych niż na poziomie podstawowym);
  • Case study.

Korzyści

Nauczysz się jak przygotować dane pod budowę modelu statystycznego – jest to najważniejszy proces i zajmuje zdecydowanie więcej czasu niż zbudowanie samego modelu i wykonanie prognoz. Zrozumiesz w jaki sposób wizualizować dane, aby ‘wyciągnąć’ z nich jak najwięcej przydatnych informacji. Nauczysz się również w jaki sposób budować modele oraz jak dokonywać prognoz przy ich użyciu – w oparciu o prawdziwe dane! Na koniec, stworzysz samemu interaktywny raport, który z pewnością spodoba się Twojemu szefowi :)

Wymagane przygotowanie uczestników

Należy znać język R na poziomie co najmniej podstawowym. Uczestnik powinien posiadać podstawy z analizy danych, bądź statystyki.

Zapisz się