Szkolenie Skalowanie analizy danych z Python i Dask
Praktyczne informacje o szkoleniu
- KATEGORIA: Technologie
- PODKATEGORIA: Big Data
- KOD SZKOLENIA: IT-BD-115
- CZAS TRWANIA: 2 dni
- INFORMACJA CENOWA od: 2450 zł netto za jedną osobę
- RODZAJ SZKOLENIA: szkolenie zamknięte
- JĘZYK SZKOLENIA: polski
- FORMA REALIZACJI: stacjonarna, online
Opis szkolenia
Szkolenie poświęcone jest praktycznemu wykorzystaniu biblioteki Dask do skalowania analiz danych w Pythonie. Program warsztatów został zaprojektowany tak, aby uczestnicy mogli przejść od standardowych analiz do przetwarzania rozproszonego na dużych zbiorach danych. Podczas zajęć uczestnicy poznają nie tylko teoretyczne podstawy przetwarzania równoległego, ale przede wszystkim nauczą się przekształcać istniejące analizy Pandas i NumPy na wydajne rozwiązania wykorzystujące możliwości Dask. Warsztaty praktyczne, stanowiące 70% czasu szkolenia, opierają się na rzeczywistych scenariuszach i problemach spotykanych w codziennej pracy analityka danych.
Profil uczestnika
- Analitycy danych pracujący z dużymi zbiorami danych
- Programiści Python specjalizujący się w analizie danych
- Data Scientists poszukujący rozwiązań wydajnościowych
- Inżynierowie danych odpowiedzialni za optymalizację procesów
- Architekci rozwiązań analitycznych
- Specjaliści Machine Learning pracujący z dużymi zbiorami
- Deweloperzy aplikacji analitycznych
Agenda
- Wprowadzenie do przetwarzania rozproszonego
- Architektura i zasady działania Dask
- Porównanie z tradycyjnymi narzędziami Pythona
- Konfiguracja środowiska rozproszonego
- Podstawowe struktury danych w Dask
- Transformacja analiz do środowiska rozproszonego
- Migracja kodu Pandas do Dask DataFrame
- Optymalizacja operacji grupowania i agregacji
- Przetwarzanie strumieni danych
- Zarządzanie pamięcią
- Zaawansowane techniki przetwarzania
- Obliczenia macierzowe z Dask Array
- Równoległe przetwarzanie zadań
- Optymalizacja grafów obliczeniowych
- Debugowanie i profilowanie
- Wdrażanie rozwiązań produkcyjnych
- Konfiguracja klastra Dask
- Monitorowanie i diagnostyka
- Integracja z ekosystemem Big Data
- Strategie skalowania
Korzyści
- Umiejętność przekształcania analiz do środowiska rozproszonego
- Praktyczna znajomość biblioteki Dask
- Zdolność optymalizacji wydajności analiz
- Umiejętność zarządzania pamięcią w dużych obliczeniach
- Znajomość technik debugowania kodu rozproszonego
- Doświadczenie w konfiguracji środowiska produkcyjnego
- Zrozumienie zasad przetwarzania równoległego
Wymagane przygotowanie uczestników
- Zaawansowana znajomość Pythona
- Doświadczenie w pracy z Pandas i NumPy
- Rozumienie podstaw przetwarzania danych
- Znajomość koncepcji programowania równoległego
Zagadnienia
- Architektura Dask
- Struktury danych rozproszone
- Optymalizacja wydajności
- Przetwarzanie równoległe
- Zarządzanie pamięcią
- Grafy obliczeniowe
- Monitorowanie wykonania
- Debugowanie rozproszone
- Skalowanie horyzontalne
- Integracja z Pandas
- Przetwarzanie strumieni
- Konfiguracja klastrów
Masz pytania?
Zapraszamy do kontaktu
Klaudia Janecka
+48 539 064 686
klaudia.janecka@eitt.pl
ul. Ząbkowska 3103-736 Warszawa
Organizacja szkolenia
- Minimalna liczba uczestników: 4 osób
- Maksymalna liczba uczestników: 12 osób
- Miejsce: siedziba klienta lub wskazana lokalizacja
- Czas trwania każdego dnia: 8 godzin zegarowych (9:00-17:00)
Formy realizacji szkolenia
Szkolenie stacjonarne
- Szkolenie w siedzibie klienta lub wskazanej lokalizacji
- Sala szkoleniowa wyposażona w niezbędny sprzęt
- Materiały szkoleniowe w formie elektronicznej
- Przerwy kawowe i lunch
- Bezpośrednia interakcja z trenerem
- Networking w grupie
- Ćwiczenia warsztatowe w zespołach
Szkolenie zdalne
- Wirtualne środowisko szkoleniowe
- Materiały w formie elektronicznej
- Interaktywne ćwiczenia online
- Breakout rooms do pracy w grupach
- Wsparcie techniczne podczas szkolenia
- Nagrania sesji (opcjonalnie)
Możliwość dofinansowania
Szkolenie może zostać sfinansowane ze środków publicznych w ramach:
- Krajowego Funduszu Szkoleniowego (KFS)
- Bazy Usług Rozwojowych (BUR)
- Projektów unijnych realizowanych przez PARP
- Programu Akademia HR (PARP)
- Regionalnych programów operacyjnych
W przypadku zainteresowania dofinansowaniem, nasz zespół pomoże w przygotowaniu wymaganej dokumentacji.
MASZ PYTANIA?
Skontaktuj się z nami, aby uzyskać więcej informacji o naszych szkoleniach, programach oraz współpracy. Chętnie odpowiemy na wszystkie Twoje zapytania!
Zaufali nam
Poznaj naszą firmę

Masz pytania?
Zapraszamy do kontaktu
Klaudia Janecka
+48 539 064 686
klaudia.janecka@eitt.pl
ul. Ząbkowska 3103-736 Warszawa
FAQ — Często zadawana pytania
- Zaproszenie w formie one-pager’a z terminami
- Kick-off projektu
- Strategiczne przywództwo i myślenie
- Komunikacja i współpraca. Zarządzanie konfliktem
- Motywowanie, angażowanie i trudne decyzje w biznesie
- Zarządzanie zmianą i innowacjami. Przywództwo w kryzysie
- Budowa organizacji przyszłości
- Warsztat dobrych praktyk – retrospektywa; stworzenie spójnego programu dla średniego i niższego szczebla zarządzania