Apache Drill – SQL na dużych zbiorach danych
Opis
Szkolenie zapewnia praktyczne wprowadzenie do Apache Drill, systemu zapytań SQL dla różnorodnych źródeł danych big data. Uczestnicy poznają zaawansowane techniki analizy danych z wykorzystaniem znajomej składni SQL na heterogenicznych źródłach danych. Program łączy teorię z intensywnymi warsztatami, gdzie uczestnicy uczą się projektować i optymalizować zapytania dla systemów rozproszonych, pracując na rzeczywistych scenariuszach użycia.
Profil uczestnika
- Architekci rozwiązań Big Data
- Analitycy danych pracujący z rozproszonymi źródłami
- Deweloperzy SQL zainteresowani Big Data
- Administratorzy baz danych
- Inżynierowie danych
- Specjaliści Business Intelligence
- Architekci rozwiązań analitycznych
Agenda
- Architektura Apache Drill
- Podstawy przetwarzania rozproszonego
- Modele wykonywania zapytań
- Integracja ze źródłami danych
- Mechanizmy optymalizacji
- Projektowanie zapytań SQL
- Praca z różnorodnymi formatami danych
- Zapytania na danych zagnieżdżonych
- Optymalizacja wydajności
- Funkcje analityczne
- Integracja i wdrożenie
- Konfiguracja klastra
- Zarządzanie źródłami danych
- Bezpieczeństwo i kontrola dostępu
- Monitoring wydajności
- Zaawansowane techniki
- Przetwarzanie danych strumieniowych
- Customowe funkcje użytkownika
- Integracja z narzędziami BI
- Rozwiązywanie problemów wydajnościowych
Korzyści
- Umiejętność projektowania wydajnych zapytań SQL dla Big Data
- Znajomość architektury Apache Drill
- Zdolność integracji różnorodnych źródeł danych
- Praktyczne doświadczenie w optymalizacji zapytań
- Umiejętność wdrażania rozwiązań produkcyjnych
- Znajomość technik debugowania i profilowania
- Zrozumienie mechanizmów przetwarzania rozproszonego
Wymagane przygotowanie uczestników
- Zaawansowana znajomość SQL
- Podstawowa wiedza o architekturze Big Data
- Doświadczenie w analizie danych
- Rozumienie koncepcji baz danych
Zagadnienia
- Architektura rozproszona
- Optymalizacja zapytań SQL
- Formaty danych w Big Data
- Przetwarzanie strumieniowe
- Bezpieczeństwo danych
- Integracja źródeł danych
- Zaawansowane funkcje SQL
- Monitorowanie wydajności
- Zarządzanie klastrami
- Debugowanie zapytań
- Customowe rozszerzenia
- Wzorce projektowe
Poznaj naszą firmę
INFORMACJA CENOWA:
od 3750 zł netto za jedną osobę
CZAS TRWANIA (dni): 3
KOD SZKOLENIA: IT-BD-110
MASZ PYTANIA?
Skontaktuj się z nami, aby uzyskać więcej informacji o naszych szkoleniach, programach oraz współpracy. Chętnie odpowiemy na wszystkie Twoje zapytania!