Apache Drill – SQL na dużych zbiorach danych

Opis

Szkolenie zapewnia praktyczne wprowadzenie do Apache Drill, systemu zapytań SQL dla różnorodnych źródeł danych big data. Uczestnicy poznają zaawansowane techniki analizy danych z wykorzystaniem znajomej składni SQL na heterogenicznych źródłach danych. Program łączy teorię z intensywnymi warsztatami, gdzie uczestnicy uczą się projektować i optymalizować zapytania dla systemów rozproszonych, pracując na rzeczywistych scenariuszach użycia.

Profil uczestnika

  • Architekci rozwiązań Big Data
  • Analitycy danych pracujący z rozproszonymi źródłami
  • Deweloperzy SQL zainteresowani Big Data
  • Administratorzy baz danych
  • Inżynierowie danych
  • Specjaliści Business Intelligence
  • Architekci rozwiązań analitycznych

Agenda

  1. Architektura Apache Drill
    • Podstawy przetwarzania rozproszonego
    • Modele wykonywania zapytań
    • Integracja ze źródłami danych
    • Mechanizmy optymalizacji
  2. Projektowanie zapytań SQL
    • Praca z różnorodnymi formatami danych
    • Zapytania na danych zagnieżdżonych
    • Optymalizacja wydajności
    • Funkcje analityczne
  3. Integracja i wdrożenie
    • Konfiguracja klastra
    • Zarządzanie źródłami danych
    • Bezpieczeństwo i kontrola dostępu
    • Monitoring wydajności
  4. Zaawansowane techniki
    • Przetwarzanie danych strumieniowych
    • Customowe funkcje użytkownika
    • Integracja z narzędziami BI
    • Rozwiązywanie problemów wydajnościowych

Korzyści

  • Umiejętność projektowania wydajnych zapytań SQL dla Big Data
  • Znajomość architektury Apache Drill
  • Zdolność integracji różnorodnych źródeł danych
  • Praktyczne doświadczenie w optymalizacji zapytań
  • Umiejętność wdrażania rozwiązań produkcyjnych
  • Znajomość technik debugowania i profilowania
  • Zrozumienie mechanizmów przetwarzania rozproszonego

Wymagane przygotowanie uczestników

  • Zaawansowana znajomość SQL
  • Podstawowa wiedza o architekturze Big Data
  • Doświadczenie w analizie danych
  • Rozumienie koncepcji baz danych

Zagadnienia

  • Architektura rozproszona
  • Optymalizacja zapytań SQL
  • Formaty danych w Big Data
  • Przetwarzanie strumieniowe
  • Bezpieczeństwo danych
  • Integracja źródeł danych
  • Zaawansowane funkcje SQL
  • Monitorowanie wydajności
  • Zarządzanie klastrami
  • Debugowanie zapytań
  • Customowe rozszerzenia
  • Wzorce projektowe

Poznaj naszą firmę

INFORMACJA CENOWA:
od 3750 zł netto za jedną osobę

CZAS TRWANIA (dni): 3

KOD SZKOLENIA: IT-BD-110

Udostępnij swoim znajomym