Pobierz kartę szkolenia
Analiza danych w Pythonie – poziom podstawowy
kod szkolenia: PYTH_ANALIZA_PODST / PL AA 3d
Szkolenie wprowadza w podstawy analizy danych w języku Python, umożliwiając uczestnikom zdobycie wiedzy niezbędnej do pracy z danymi. Kurs obejmuje naukę podstawowych narzędzi i metod analizy danych, takich jak biblioteki NumPy i pandas, oraz zapoznaje z podstawami wizualizacji danych przy użyciu Matplotlib. Jest to doskonały początek dla osób chcących wkroczyć w świat analizy danych i eksploracji informacji.
Szkolenie jest skierowane do:
- Osób rozpoczynających pracę z analizą danych, które nie miały wcześniej doświadczenia w tej dziedzinie.
- Specjalistów, którzy chcą poszerzyć swoje umiejętności analityczne o wiedzę z zakresu programowania w Pythonie.
- Studentów i absolwentów, którzy chcą zdobyć kompetencje cenione na rynku pracy.
- Osób pracujących z dużymi zbiorami danych, które chcą zautomatyzować swoją pracę dzięki narzędziom Pythonowym.
- Każdego, kto chce zrozumieć podstawy analizy danych przed kontynuacją nauki na poziomie średniozaawansowanym.
- Opanowanie podstaw analizy danych – Uczestnicy poznają najważniejsze techniki analizy danych, niezbędne do dalszego rozwoju w tej dziedzinie.
- Znajomość kluczowych narzędzi – Szkolenie obejmuje pracę z popularnymi bibliotekami Pythonowymi, takimi jak NumPy i pandas, które są podstawą analizy danych.
- Umiejętność pracy z danymi – Kurs uczy, jak przygotować dane do modelowania, analizować brakujące wartości i rozwiązywać problemy z niespójnościami w danych.
- Podstawy wizualizacji danych – Uczestnicy nauczą się tworzyć wykresy i diagramy, co ułatwia przedstawianie wyników analizy w czytelny sposób.
- Praktyczne umiejętności – Uczestnicy zyskają umiejętność pracy w środowisku PyCharm i poznają praktyczne metody zarządzania danymi.
- Wprowadzenie
- Podstawowe statystyki
- Typy danych
- Problemy z danymi
- Tworzenie nowego projektu w środowisku PyCharm
- Import bibliotek
- Przegląd podstawowej funkcjonalności środowiska
- Podstawy NumPy
- Wektory, macierze, tensory
- Generowanie liczb pseudolosowych
- Tworzenie tablic
- Właściwości tablicy, konwersja typów
- Działania na indeksach
- Operacje arytmetyczne i logiczne na tablicach
- Zmiana rozmiaru i łączenie tablic
- Agregacja danych
- Płytkie i głębokie kopiowanie
- Wbudowane funkcje
- Sortowanie tablic
- Podstawy pandas
- Seria i ramka danych
- Indeksy i kolumny
- Tworzenie obiektów
- Import danych (excel, csv)
- Zapis danych
- Atrybuty ramki
- Dodawanie i usuwanie wierszy
- Indeksery
- Filtracja danych
- Operacje na ramce
- Grupowanie i agregacja
- Analiza eksploracyjna i przygotowanie danych
- Typy i rozmiar danych
- Statystyki
- Kodowanie danych
- Rodzaje braków danych
- Wykrywanie braków danych
- Podstawowe metody uzupełniania braków danych
- Niespójności w danych
- Wartości odstające
- Korelacja danych
- Standaryzacja i skalowanie
- Wizualizacja danych w pakiecie Matplotlib
- Konfiguracja wykresów
- Podwykresy
- Wykres liniowy
- Wykres rozrzutu
- Histogram
- Wykres słupkowy
- Diagram kołowy
- Heatmap
- Wyświetlanie obrazów
Ukończenie szkolenia Python na poziomie podstawowym lub równoważna wiedza.
- Szkolenie: polski