Jak uniknąć błędów zaczynając przygodę z IBM Db2 BLU

Cel prezentacji:
Przedstawienie uczestnikom konferencji podstawowych błędów i zagadnień związanych z rozpoczęciem korzystania i implementacji Db2 BLU w systemach typu OLAP/Warehouse oraz podstawowych błędów popełnianych w trakcie tworzenia i użytkowania Db2 BLU.

W trakcie prezentacji przedstawię podstawowe zagadnienia związane z użytkowaniem Db2 BLU w systemach analitycznych. Wskażę doświadczenia w kwestii poszukiwania błędów na wszystkich etapach przejmowania aktualnie istniejących systemów analitycznych i naprawiania błędów odziedziczonych po twórcach systemu.

Etapy prezentacji:
I.      Wstęp:
1.      Powitanie i przedstawienie prezentera oraz dotychczasowego doświadczenia z Db2.
2.      Opis środowiska na którym działa Db2 BLU i na podstawie którego powstała prezentacja.
II.     Podstawowa teoria:
1.      Krótkie wprowadzenie do systemów typu Warehouse
Czym charakteryzują się systemy typu OLAP, czym różnią się od OLTP i jakie jest ich przeznaczenie.
2.      Krótkie wprowadzenie do Db2 BLU i tabel kolumnowych
Czym są tabele kolumnowe, czym różnią się od tabel wierszowych i krótka charakterystyka Db2 BLU.
III.    Część główna:
1.      Intra-Parallel – czy jest i na jakim poziomie jest definiowany. Jak weryfikować gdy wygląda, że go nie ma.
2.      Kompresja – jak działa, czy naprawdę jest i jak weryfikować jej skuteczność, co robić aby ją poprawić.
3.      Sortowanie danych – dlaczego warto to robić.
4.      Null vs not null –  wpływ na performance definicji kolumn dopuszczających null.
5.      Tabele kolumnowe i wierszowe – dlaczego nie wszystko warto wrzucać w tabele kolumnowe – update/insert w BLU (upsert).
6.      Tablespace – dlaczego nie warto trzymać wszystkich tabel w jednym tablespace
7.      Ograniczenia tabel kolumnowych – zwłaszcza w zarządzaniu i operacje jakich już nie możemy na nich robić.
8.      Automatyczne Reorgi i runstaty – dlaczego nie warto ich wyłączać i parę słów o profilach statystyk w BLU.
9.      Tabele tymczasowe – dlaczego dobrze pamiętać o CGTT.
10.     Wersja Db2 – dlaczego aktualizacje Db2 są ważne – paralel insert i jego wpływ na funkcjonowanie bazy BLU.
11.     ETL – dlaczego warto część operacji na danych wykonać poza bazą – weryfikacja jakości danych oraz usuwania znaków narodowych.
12.     Użycie Truncate zamiast delete
13.     Użycie Load zamiast insert
14.     Rozdzielenie workload wg typu – dlaczego jest ważne.
15.     Indeksy – czy warto je stosować w tabelach kolumnowych?
IV.     Zakończenie
Podsumowanie i lista „best practice” wynikająca z prezentacji.
V.      Questions and answers
VI.     Bibligrafia

Languages :  Polski Session Category :  Warszawa 2019