Snowflake - poziom średniozaawansowany
kod szkolenia: SNOWFLAKE_02 / PL AA 2d
Szkolenie ma formę warsztatów z dużą liczbą praktycznych przykładów i scenariuszy biznesowych, które pomagają uczestnikom rozwijać umiejętność budowy nowoczesnych rozwiązań analitycznych w chmurze.
Cel: Pogłębienie wiedzy, zaawansowane operacje SQL, optymalizacja, automatyzacja, integracje.
Szkolenie skierowane jest do osób posiadających podstawową znajomość Snowflake i języka SQL, które chcą pogłębić swoje umiejętności w pracy z tą platformą i poznać bardziej zaawansowane możliwości Snowflake w zakresie modelowania danych, optymalizacji zapytań, automatyzacji oraz przetwarzania danych półstrukturalnych (np. JSON).
Uczestnicy dowiedzą się m.in.:
- jak tworzyć złożone zapytania SQL z użyciem CTE, funkcji okienkowych i PIVOT,
- jak przechowywać i analizować dane w formacie JSON z wykorzystaniem typów VARIANT, ARRAY i OBJECT,
- jak optymalizować zapytania dzięki analizie Query Profile i stosowaniu clustering keys,
- jak używać tasków, procedur i streamów do budowania automatycznych przetwarzań danych,
- jak integrować Snowflake z zewnętrznymi źródłami danych,
- jak wykorzystać widoki materializowane, warstwy modelu danych i praktyki DataOps w pracy analityka lub inżyniera danych.
Dzień 1: Zaawansowane aspekty SQL i modelowania danych
Moduł 1: Zaawansowane zapytania SQL
- CTE (Common Table Expressions)
- Window Functions
Moduł 2: Praca z danymi półstrukturalnymi
- Wprowadzenie do formatu JSON w Snowflake
- FLATTEN, LATERAL, OBJECT_KEYS
- Operacje na VARIANT, ARRAY, OBJECT
Moduł 3: Tworzenie widoków materializowanych
- Różnice między zwykłymi a materializowanymi widokami
- Use case'y i ograniczenia
- Zarządzanie aktualizacjami
Moduł 4: Modelowanie danych w Snowflake
- Podejście typu star schema vs snowflake schema
- Tworzenie perspektyw analitycznych
- Tworzenie logicznych warstw danych (raw → curated → consumption)
Dzień 2: Integracje, automatyzacja i optymalizacja
Moduł 5: Optymalizacja zapytań i monitorowanie
- Query Profile i analiza planów zapytań
- Clustering keys – kiedy i jak używać
- Partition pruning, result caching
Moduł 6: Taski, procedury i streamy
- Tworzenie i zarządzanie taskami (oraz cron syntax)
- Wprowadzenie do proceduralnego SQL (Python-based)
- Streamy – detekcja zmian
Moduł 7: Integracje i zewnętrzne źródła danych
- External stages (S3, Azure Blob)
- Snowpipe – automatyczne ładowanie danych
Moduł 8: Praktyczne warsztaty i case study
- Budowa małego pipeline’u ETL
- Automatyczne przetwarzanie danych JSON
- Podsumowanie i best practices
- SWOBODNE posługiwanie się językiem SQL
Szkolenie skierowane jest do osób posiadających podstawową znajomość Snowflake i języka SQL, które chcą pogłębić swoje umiejętności w pracy z tą platformą i poznać bardziej zaawansowane możliwości Snowflake w zakresie modelowania danych, optymalizacji zapytań, automatyzacji oraz przetwarzania danych półstrukturalnych (np. JSON).
Polski