Samza – przetwarzanie strumieni danych
Opis
Szkolenie koncentruje się na praktycznym wykorzystaniu Apache Samza w przetwarzaniu strumieni danych w czasie rzeczywistym. Uczestnicy poprzez warsztaty praktyczne poznają architekturę i komponenty systemu Samza oraz zdobędą umiejętności projektowania i implementacji rozwiązań do przetwarzania strumieni. Zajęcia prowadzone są w formie warsztatowej, gdzie 70% czasu poświęcone jest na ćwiczenia praktyczne.
Profil uczestnika
- Programiści Java zainteresowani przetwarzaniem strumieni danych
- Architekci systemów Big Data
- Inżynierowie danych pracujący z systemami strumieniowymi
- Deweloperzy systemów rozproszonych
- Specjaliści ds. integracji danych
- Administratorzy platform Big Data
- Analitycy danych poszukujący wiedzy o przetwarzaniu strumieniowym
Agenda
- Wprowadzenie do Apache Samza
- Architektura i komponenty systemu
- Model przetwarzania strumieni
- Integracja z ekosystemem Hadoop
- Porównanie z innymi systemami strumieniowymi
- Podstawy przetwarzania strumieni w Samza
- Konfiguracja środowiska
- Tworzenie zadań strumieniowych
- Zarządzanie stanami w aplikacji
- Obsługa zdarzeń i komunikatów
- Zaawansowane techniki przetwarzania
- Implementacja własnych procesorów
- Zarządzanie przepływem danych
- Mechanizmy buforowania
- Optymalizacja wydajności
- Produkcyjne wdrożenie aplikacji
- Monitorowanie i debugowanie
- Skalowanie aplikacji
- Zabezpieczanie strumieni danych
- Najlepsze praktyki operacyjne
Korzyści
Uczestnik będzie potrafił samodzielnie projektować i implementować rozwiązania do przetwarzania strumieni danych w Apache Samza. Zdobędzie praktyczne umiejętności w zakresie optymalizacji i monitorowania wydajności aplikacji strumieniowych. Rozwinie kompetencje w obszarze integracji Samza z innymi narzędziami ekosystemu Big Data. Nauczy się efektywnie zarządzać stanami w aplikacjach strumieniowych i wdrażać rozwiązania w środowisku produkcyjnym. Zdobędzie wiedzę o najlepszych praktykach w projektowaniu architektury systemów przetwarzania strumieni. Pozna zaawansowane techniki debugowania i rozwiązywania problemów w aplikacjach Samza.
Wymagane przygotowanie uczestników
- Praktyczna znajomość języka Java
- Podstawowa wiedza z zakresu systemów rozproszonych
- Doświadczenie w pracy z systemami kolejkowania wiadomości
- Znajomość podstaw architektury systemów Big Data
Zagadnienia
- Architektura i komponenty Apache Samza
- Modele przetwarzania strumieni danych
- Zarządzanie stanami w aplikacjach strumieniowych
- Integracja z ekosystemem Hadoop
- Mechanizmy buforowania i kolejkowania
- Techniki optymalizacji wydajności
- Monitorowanie i debugowanie aplikacji
- Skalowanie systemów strumieniowych
- Zabezpieczanie przepływów danych
- Wzorce projektowe w przetwarzaniu strumieni
- Obsługa błędów i mechanizmy recovery
- Testowanie aplikacji strumieniowych
Poznaj naszą firmę
INFORMACJA CENOWA:
od 2450 zł netto za jedną osobę
CZAS TRWANIA (dni): 2
KOD SZKOLENIA: IT-BD-62
MASZ PYTANIA?
Skontaktuj się z nami, aby uzyskać więcej informacji o naszych szkoleniach, programach oraz współpracy. Chętnie odpowiemy na wszystkie Twoje zapytania!