Pobierz kartę szkolenia

Building Batch Data Analytics Solutions on AWS

kod szkolenia: AWS-BUIL-DA-AN-SOL / PL AA 1d

Ten kurs jest przeznaczony dla:

Inżynierów platform danych
Architektów i operatorów, którzy projektują i zarządzają rurociągami analityki danych.

W tym kursie nauczysz się:

Porównywać cechy i korzyści z magazynów danych, jezior danych oraz nowoczesnych architektur danych
Projektować i wdrażać rozwiązania analityki danych w trybie batch
Identyfikować i stosować odpowiednie techniki, w tym kompresję, w celu optymalizacji przechowywania danych
Wybierać i wdrażać odpowiednie opcje do pozyskiwania, przekształcania i przechowywania danych
Wybierać odpowiednie instancje, typy węzłów, klastry, automatyczne skalowanie oraz topologię sieci w zależności od konkretnego przypadku biznesowego
Rozumieć, jak przechowywanie i przetwarzanie danych wpływają na mechanizmy analizy i wizualizacji niezbędne do uzyskania użytecznych informacji biznesowych
Zabezpieczać dane w spoczynku oraz w trakcie przesyłania
Monitorować obciążenia analityczne w celu identyfikacji i usuwania problemów
Stosować najlepsze praktyki zarządzania kosztami.

Moduł A: Przegląd analityki danych i pipeline'u danych

Przykłady zastosowań analityki danych
Wykorzystanie pipeline'u danych w analizach

Moduł 1: Wprowadzenie do Amazon EMR

Wykorzystanie Amazon EMR w rozwiązaniach analitycznych
Architektura klastra Amazon EMR
Interaktywna demonstracja 1: Uruchamianie klastra Amazon EMR
Strategie zarządzania kosztami

Moduł 2: Pipeline analityki danych z użyciem Amazon EMR: Ingestia i przechowywanie

Optymalizacja przechowywania danych z użyciem Amazon EMR
Techniki ingestii danych

Moduł 3: Wydajna analityka wsadowa z użyciem Apache Spark na Amazon EMR

Przykłady zastosowań Apache Spark na Amazon EMR
Dlaczego Apache Spark na Amazon EMR
Podstawowe pojęcia Spark
Interaktywna demonstracja 2: Łączenie z klastrem EMR i wykonywanie poleceń Scala za pomocą powłoki Spark
Transformacja, przetwarzanie i analityka
Korzystanie z notatników z Amazon EMR
Praktyczne laboratorium 1: Analityka danych o niskiej latencji z użyciem Apache Spark na Amazon EMR

Moduł 4: Przetwarzanie i analiza danych wsadowych z użyciem Amazon EMR i Apache Hive

Wykorzystanie Amazon EMR z Apache Hive do przetwarzania danych wsadowych
Transformacja, przetwarzanie i analityka
Praktyczne laboratorium 2: Przetwarzanie danych wsadowych z użyciem Amazon EMR i Apache Hive
Wprowadzenie do Apache HBase na Amazon EMR

Moduł 5: Przetwarzanie danych w trybie serverless

Serverless przetwarzanie danych, transformacja i analityka
Wykorzystanie AWS Glue z obciążeniami Amazon EMR
Praktyczne laboratorium 3: Orkiestracja przetwarzania danych w Spark z użyciem AWS Step Functions

Moduł 6: Bezpieczeństwo i monitoring klastrów Amazon EMR

Zabezpieczanie klastrów EMR
Interaktywna demonstracja 3: Szyfrowanie po stronie klienta z EMRFS
Monitoring i rozwiązywanie problemów z klastrami Amazon EMR
Demonstracja: Przeglądanie historii klastra Apache Spark

Moduł 7: Projektowanie rozwiązań analityki danych wsadowych

Przykłady zastosowań analityki danych wsadowych
Aktywność: Projektowanie workflow analityki danych wsadowych

Moduł B: Rozwój nowoczesnych architektur danych na AWS

Nowoczesne architektury danych

Studenci z co najmniej rocznym doświadczeniem w zarządzaniu frameworkami open-source do przetwarzania danych, takimi jak Apache Spark czy Apache Hadoop, będą czerpać największe korzyści z tego kursu.

Kurs obejmuje prezentacje, interaktywne pokazy, laboratoria praktyczne, dyskusje oraz ćwiczenia klasowe.

Szkolenie: polski
Materiały: angielski

Skontaktuj się z naszym doradcą

Imię i nazwisko*

Telefon kontaktowy*

Email*

Województwo*

Firma

Treść wiadomości*

Wyrażam zgodę na przetwarzanie moich danych osobowych podanych w formularzu w celu realizacji zgłoszenia (przygotowania odpowiedzi, oferty, kontaktu) przez Altkom Akademia S.A., ul. Chłodna 51, 00-867 Warszawa.

Wyrażam zgodę na przetwarzanie moich danych osobowych w celach marketingowych przez Altkom Akademia S.A., ul. Chłodna 51, 00-867 Warszawa.

Administratorem Państwa danych osobowych jest: Altkom Akademia S.A. 00-867 Warszawa ul. Chłodna 51, KRS: 0000859378, NIP: 527-267-43-24, REGON: 146032998. Dane kontaktowe Administratora: - adres do korespondencji: Chłodna 51, 00-867 Warszawa - adres e-mail: szkolenia@altkom.pl.3. Administrator powołał Inspektora Ochrony Danych Pana Mariusz Zajkiewicza z którym można się skontaktować przy pomocy poczty elektronicznej pisząc na adres email: iodo@altkom.pl. lub bezpośrednio na adres email: mariusz.zajkiewicz@altkom.pl Więcej o RODO na: https://www.altkomakademia.pl/polityka-prywatnosci/

Building Batch Data Analytics Solutions on AWS

Skontaktuj się z naszym doradcą

Creating Queries to databases on SQL server platform with SQL for analytics

Digital Marketing w B2B

Project Management – foundation level

Tworzenie profesjonalnych prezentacji i multimediów

Adobe Illustrator – Projektowanie graficzne na potrzeby DTP i WWW

Designing and Implementing Cloud Connectivity

CompTIA SecurityX (Formerly CASP+) (przygotowanie do egzaminu CAS-005) - szkolenie autoryzowane

PeopleCert Scrum Developer- akredytowane szkolenie z egzaminem

Warsztat przygotowujący do egzaminu Certified Kubernetes Security Specialist (CKS )

Business Processes in SAP S/4HANA Supply Chain Execution