Apache Spark MLlib – uczenie maszynowe na dużą skalę
Opis
Szkolenie zapewnia dogłębne zrozumienie biblioteki Apache Spark MLlib w kontekście uczenia maszynowego na dużych zbiorach danych. Program obejmuje zarówno teoretyczne podstawy algorytmów, jak i praktyczne aspekty ich implementacji w środowisku rozproszonym. Uczestnicy poznają zaawansowane techniki optymalizacji i skalowania modeli ML oraz najlepsze praktyki w zakresie wdrażania rozwiązań produkcyjnych.
Profil uczestnika
- Data Scientists pracujący z dużymi zbiorami danych
- Inżynierowie ML implementujący rozwiązania skalowalne
- Architekci rozwiązań AI/ML
- Deweloperzy aplikacji analitycznych
- Specjaliści Big Data zainteresowani ML
- Analitycy danych rozwijający się w kierunku ML
Agenda
- Podstawy MLlib i distributed ML
- Architektura MLlib
- Przygotowanie danych do uczenia
- Podstawowe algoritmy ML
- Distributed Computing w ML
- Zaawansowane algorytmy i modele
- Klasyfikacja i regresja
- Clustering i redukcja wymiarowości
- Systemy rekomendacyjne
- Przetwarzanie tekstu i NLP
- Optymalizacja i strojenie modeli
- Walidacja krzyżowa
- Strojenie hiperparametrów
- Ocena jakości modeli
- Pipeline optimization
- Wdrażanie i utrzymanie
- Deployment modeli ML
- Monitoring i aktualizacja modeli
- Zarządzanie wersjami
- ML Pipeline Management
Korzyści
Nabycie zaawansowanej wiedzy w zakresie implementacji uczenia maszynowego na dużą skalę. Zdobycie praktycznych umiejętności w projektowaniu i optymalizacji modeli ML. Poznanie technik efektywnego wdrażania rozwiązań ML w środowisku produkcyjnym. Przyswojenie metod monitorowania i aktualizacji modeli uczenia maszynowego. Opanowanie najlepszych praktyk w zarządzaniu pipelinami ML. Rozwój umiejętności w zakresie distributed computing dla ML.
Wymagane przygotowanie uczestników
- Znajomość podstaw uczenia maszynowego
- Doświadczenie w programowaniu Python lub Scala
- Podstawowa znajomość Apache Spark
- Wiedza z zakresu statystyki i matematyki
Zagadnienia
- Architektura MLlib
- Distributed Machine Learning
- Algorytmy klasyfikacji i regresji
- Techniki clusteringu
- Systemy rekomendacyjne
- Przetwarzanie tekstu
- Optymalizacja modeli
- Pipeline Management
- Model Deployment
- Monitoring i aktualizacja modeli
Poznaj naszą firmę
INFORMACJA CENOWA:
od 6350 zł netto za jedną osobę
CZAS TRWANIA (dni): 5
KOD SZKOLENIA: IT-AI-11
MASZ PYTANIA?
Skontaktuj się z nami, aby uzyskać więcej informacji o naszych szkoleniach, programach oraz współpracy. Chętnie odpowiemy na wszystkie Twoje zapytania!