Szkolenie IBM InfoSphere QualityStage Essentials v11.5
Ten kurs uczy, jak budować równoległe zadania QualityStage, które badają, standaryzują, dopasowują i konsolidują rekordy danych. Studenci zdobędą doświadczenie, budując aplikację, która łączy dane klientów z trzech systemów źródłowych w jeden główny rekord klienta.
Profil uczestnika
• Analitycy danych odpowiedzialni za jakość danych przy użyciu QualityStage
• Deweloperzy oczyszczania danych
• Architekci jakości danych
Agenda
1. Problemy z jakością danych
• Wypisanie typowych zanieczyszczeń jakości danych
• Opisanie procesów jakości danych
2. Przegląd QualityStage
• Opisanie architektury QualityStage
• Opisanie klientów QualityStage i ich funkcji
3. Tworzenie z QualityStage
• Importowanie metadanych
• Tworzenie zadań DataStage/QualityStage
• Uruchamianie zadań
• Przeglądanie wyników
4. Badanie
• Tworzenie zadań Investigate
• Używanie Character Discrete, Concatenate i Word Investigations do analizowania pól danych
• Przeglądanie wyników
5. Standaryzacja
• Opisanie etapu standaryzacji
• Identyfikowanie zestawów reguł
• Tworzenie zadań przy użyciu etapu standaryzacji
• Interpretowanie wyników standaryzacji
• Badanie nieobsługiwanych danych i wzorców
6. Dopasowywanie
• Tworzenie zadania QualityStage w celu zidentyfikowania pasujących rekordów
• Stosowanie wielu przebiegów dopasowania w celu zwiększenia wydajności
• Interpretowanie i ulepszanie wyników dopasowania
7. Przetrwanie
• Tworzenie zadania przetrwania QualityStage który skonsoliduje dopasowane rekordy w jeden rekord główny
8. Dopasowanie dwóch źródeł
• Tworzenie zadania QualityStage w celu dopasowania danych przy użyciu dopasowania referencyjnego
Wymagane przygotowanie uczestników
• Znajomość systemu operacyjnego Windows
• Znajomość edytora tekstu
Przydatna, ale nie wymagana, byłaby pewna znajomość podstawowych zasad statystyki, takich jak średnie ważone i prawdopodobieństwo.
Zagadnienia
•Wymień typowe zanieczyszczenia jakości danych
•Opisywanie każdego z poniższych procesów:
§Badanie
§Standaryzacja
§Dopasowanie
§Przetrwanie
•Opisywanie architektury QualityStage
•Opisywanie klientów QualityStage i ich funkcji
•Importowanie metadanych
•Tworzenie i uruchamianie zadań DataStage/QualityStage, przeglądanie wyników
•Tworzenie zadań Investigate
•Używanie funkcji Character Discrete, Concatenate i Word Investigations do analizowania pól danych
•Opisywanie etapu Standaryzacji
•Identyfikacja zestawów reguł
•Tworzenie zadań przy użyciu etapu Standaryzacji
•Interpretowanie wyników standaryzacji
•Badanie nieobsługiwanych danych i wzorców
•Tworzenie zadania QualityStage w celu zidentyfikowania pasujących rekordów
•Zastosowanie wielu przebiegów dopasowania w celu zwiększenia wydajności
•Interpretowanie i ulepszanie wyników dopasowania
•Tworzenie zadania QualityStage Survive, które skonsoliduje dopasowane rekordy w jeden rekord główny
•Tworzenie pojedyncze zadanie dopasowywania danych przy użyciu dopasowania z dwóch źródeł
Poznaj naszą firmę
INFORMACJA CENOWA:
od 10000 zł netto za jedną osobę
CZAS TRWANIA (dni): 4
KOD SZKOLENIA: KM213G
MASZ PYTANIA?
Skontaktuj się z nami, aby uzyskać więcej informacji o naszych szkoleniach, programach oraz współpracy. Chętnie odpowiemy na wszystkie Twoje zapytania!