Jak uniknąć błędów zaczynając przygodę z IBM Db2 BLU

Cel prezentacji:
Przedstawienie uczestnikom konferencji podstawowych błędów i zagadnień związanych z rozpoczęciem korzystania i implementacji Db2 BLU w systemach typu OLAP/Warehouse oraz podstawowych błędów popełnianych w trakcie tworzenia i użytkowania Db2 BLU.

W trakcie prezentacji przedstawię podstawowe zagadnienia związane z użytkowaniem Db2 BLU w systemach analitycznych. Wskażę doświadczenia w kwestii poszukiwania błędów na wszystkich etapach przejmowania aktualnie istniejących systemów analitycznych i naprawiania błędów odziedziczonych po twórcach systemu.

Etapy prezentacji:
I.      Wstęp:
1.      Powitanie i przedstawienie prezentera oraz dotychczasowego doświadczenia z Db2.
2.      Opis środowiska na którym działa Db2 BLU i na podstawie którego powstała prezentacja.
II.     Podstawowa teoria:
1.      Krótkie wprowadzenie do systemów typu Warehouse
Czym charakteryzują się systemy typu OLAP, czym różnią się od OLTP i jakie jest ich przeznaczenie.
2.      Krótkie wprowadzenie do Db2 BLU i tabel kolumnowych
Czym są tabele kolumnowe, czym różnią się od tabel wierszowych i krótka charakterystyka Db2 BLU.
III.    Część główna:
1.      Intra-Parallel – czy jest i na jakim poziomie jest definiowany. Jak weryfikować gdy wygląda, że go nie ma.
2.      Kompresja – jak działa, czy naprawdę jest i jak weryfikować jej skuteczność, co robić aby ją poprawić.
3.      Sortowanie danych – dlaczego warto to robić.
4.      Null vs not null –  wpływ na performance definicji kolumn dopuszczających null.
5.      Tabele kolumnowe i wierszowe – dlaczego nie wszystko warto wrzucać w tabele kolumnowe – update/insert w BLU (upsert).
6.      Tablespace – dlaczego nie warto trzymać wszystkich tabel w jednym tablespace
7.      Ograniczenia tabel kolumnowych – zwłaszcza w zarządzaniu i operacje jakich już nie możemy na nich robić.
8.      Automatyczne Reorgi i runstaty – dlaczego nie warto ich wyłączać i parę słów o profilach statystyk w BLU.
9.      Tabele tymczasowe – dlaczego dobrze pamiętać o CGTT.
10.     Wersja Db2 – dlaczego aktualizacje Db2 są ważne – paralel insert i jego wpływ na funkcjonowanie bazy BLU.
11.     ETL – dlaczego warto część operacji na danych wykonać poza bazą – weryfikacja jakości danych oraz usuwania znaków narodowych.
12.     Użycie Truncate zamiast delete
13.     Użycie Load zamiast insert
14.     Rozdzielenie workload wg typu – dlaczego jest ważne.
15.     Indeksy – czy warto je stosować w tabelach kolumnowych?
IV.     Zakończenie
Podsumowanie i lista „best practice” wynikająca z prezentacji.
V.      Questions and answers
VI.     Bibligrafia

Languages :  Polski Session Category :  Warszawa 2019 

By continuing to use the site, you agree to the use of cookies. więcej informacji

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Zamknij