Apache Spark MLlib – uczenie maszynowe na dużą skalę

Opis

Szkolenie zapewnia dogłębne zrozumienie biblioteki Apache Spark MLlib w kontekście uczenia maszynowego na dużych zbiorach danych. Program obejmuje zarówno teoretyczne podstawy algorytmów, jak i praktyczne aspekty ich implementacji w środowisku rozproszonym. Uczestnicy poznają zaawansowane techniki optymalizacji i skalowania modeli ML oraz najlepsze praktyki w zakresie wdrażania rozwiązań produkcyjnych.

Profil uczestnika

  • Data Scientists pracujący z dużymi zbiorami danych
  • Inżynierowie ML implementujący rozwiązania skalowalne
  • Architekci rozwiązań AI/ML
  • Deweloperzy aplikacji analitycznych
  • Specjaliści Big Data zainteresowani ML
  • Analitycy danych rozwijający się w kierunku ML

Agenda

  1. Podstawy MLlib i distributed ML
    • Architektura MLlib
    • Przygotowanie danych do uczenia
    • Podstawowe algoritmy ML
    • Distributed Computing w ML
  2. Zaawansowane algorytmy i modele
    • Klasyfikacja i regresja
    • Clustering i redukcja wymiarowości
    • Systemy rekomendacyjne
    • Przetwarzanie tekstu i NLP
  3. Optymalizacja i strojenie modeli
    • Walidacja krzyżowa
    • Strojenie hiperparametrów
    • Ocena jakości modeli
    • Pipeline optimization
  4. Wdrażanie i utrzymanie
    • Deployment modeli ML
    • Monitoring i aktualizacja modeli
    • Zarządzanie wersjami
    • ML Pipeline Management

Korzyści

Nabycie zaawansowanej wiedzy w zakresie implementacji uczenia maszynowego na dużą skalę. Zdobycie praktycznych umiejętności w projektowaniu i optymalizacji modeli ML. Poznanie technik efektywnego wdrażania rozwiązań ML w środowisku produkcyjnym. Przyswojenie metod monitorowania i aktualizacji modeli uczenia maszynowego. Opanowanie najlepszych praktyk w zarządzaniu pipelinami ML. Rozwój umiejętności w zakresie distributed computing dla ML.

Wymagane przygotowanie uczestników

  • Znajomość podstaw uczenia maszynowego
  • Doświadczenie w programowaniu Python lub Scala
  • Podstawowa znajomość Apache Spark
  • Wiedza z zakresu statystyki i matematyki

Zagadnienia

  • Architektura MLlib
  • Distributed Machine Learning
  • Algorytmy klasyfikacji i regresji
  • Techniki clusteringu
  • Systemy rekomendacyjne
  • Przetwarzanie tekstu
  • Optymalizacja modeli
  • Pipeline Management
  • Model Deployment
  • Monitoring i aktualizacja modeli

Poznaj naszą firmę

INFORMACJA CENOWA:
od 6350 zł netto za jedną osobę

CZAS TRWANIA (dni): 5

KOD SZKOLENIA: IT-AI-11

?
?
Zapoznałem/łam się i akceptuję politykę prywatności. *