Data Engineering w Snowflake

Opis

Nie jesteśmy powiązani ani rekomendowani przez firmę Snowflake, Inc.

Szkolenie „Snowflake Data Engineering” to intensywne, dwudniowe warsztaty skierowane do inżynierów danych, architektów danych, oraz specjalistów ETL/ELT, którzy chcą poznać lub udoskonalić swoje umiejętności działania z platformą Snowflake. Uczestnicy zdobędą kompleksową wiedzę na temat budowy pipelineów danych, róznych metod połączeń i integracji (m.in. z wykorzystaniem Pythona lub Kafki), efektywnego ładowania i transformacji danych, a także elementów administracji, architektury Snowflake, zarządzania hurtowniami danych (role i kontrola dostępu). Program obejmuje również zaawansowane techniki, takie jak Snowpipe, obsługa danych semi-structured, dynamiczne tabele i wykorzystanie narzędzi AI w działaniach Data Engineera.

Format

Głównie warsztaty

Czas trwania

2 dni

Wymagania wstępne

Podstawowa znajomość SQL
Zrozumienie kluczowych koncepcji i architektury inżynierii danych
Znajomość przetwarzania w chmurze
Podstawy tworzenia oprogramowania
Zainteresowanie ładowaniem i transformacją danych

Grupa docelowa

To szkolenie jest idealne dla:

Data Engineers chcących zwiększyć swoje umiejętności w zakresie Snowflake i platform danych opartych na chmurze
ETL/ELT Developers koncentrujących się na optymalizacji procesów pozyskiwania, transformacji i ładowania danych
Architektów Danych, których celem jest projektowanie solidnych potoków danych i infrastruktury dla Snowflake
Inżynierów chmury pracujących z rozwiązaniami danych w środowiskach chmurowych
Administratorów bazy danych zainteresowani zarządzaniem skalowalną infrastrukturą danych
Data Scientists chcących usprawnić dostęp do danych i integrację dla przepływów pracy AI/ML

Program szkolenia

Podstawy Snowflake i DWH
- Przegląd
- Architektura i komponenty Snowflake
- Snowsight
- Wirtualne hurtownie
- Obiekty Snowflake, bazy danych, schematy
- Typy danych
- Dane ustrukturyzowane i częściowo ustrukturyzowane
- Role i kontrola dostępu w Snowflake
Opcje połączeń
- Typy uwierzytelniania
- Connectors
- Snowflake Connector w Python
- SnowSQL
- Native Connectors w Snowflake
- Snowflake REST SQL API
- Snowflake Connector dla Kafki
Funkcje Snowflake do ładowania danych
- Storage
- Internal stages
- External stages
- Streams
- Tasks
- Serverless Tasks
Data ingestion
- ETL vs ELT
- Pull vs Push
- Bulk vs Continuous Data Load
- Change Data Capture
- Snowpipe
- Snowpipe Streaming
- Snowflake Connector for Kafka
- Snowflake Connector for Kafka with Streaming
Data Transformation
- Przenoszenie danych ze stage do tabel
- Transformacje podczas ładowania
- Polecenie COPY
- Transformacje Snowpipe
- Dynamic tables
- UDF & Procedury zapamiętane
Mechanizm schema detection and evolution
- Schema detection – INFER_SCHEMA
- Tworzenie obiektów w oparciu o metadane
- Mechanizm automatycznej ewolucji schematu
Sztuczna inteligencja w inżynierii danych
- Snowflake Cortex
- Copilot
- Data pipelines wzbogacone o sztuczną inteligencję
- Data pipelines generowane przez sztuczną inteligencję
- Wykrywanie anomalii
- Czyszczenie danych
- Anonimizacja danych
- Konwersja nieustrukturyzowanych danych na dane ustrukturyzowane lub częściowo ustrukturyzowane
- Analiza sentymentu
- Przegląd RAG (Retrivial-Augmented Generation)

Nabyte umiejętności

Dzięki uczestnictwu w warsztatach, uczestnicy nauczą się projektować i zarządzać skalowalnymi pipeline’ami danych, ładować dane z różnych źródeł na platformę Snowflake oraz automatyzować procesy przetwarzania danych. Zdobędą także umiejętności wzbogacania procesu ETL/ELT o zaawansowane funkcji AI, takich jak wykrywanie anomalii, anonimizacja danych, oraz ekstrakcji informacji z nieustrukturyzowanych danych. Warsztaty te są idealne dla osób, które chcą tworzyć lub optymalizować procesy ETL/ELT i wspierać zaawansowane analizy i raportowanie w środowiskach chmurowych.

SKONTAKTUJ SIĘ Z NAMI

+48 22 398 47 81

Napisz do nas