Du kannst nach dem Kurs erste Schritte mit Python in der Data Science machen und selbstständig weiterarbeiten. Du lernst, wie du neue Algorithmen und Methoden findest, um dein Wissen zu vertiefen. Du bekommst im Data Science mit Python Seminar einen Überblick über verschiedene Machine-Learning-Algorithmen, wie sie funktionieren und wie du sie in Python umsetzt. Mit Unterstützung deines Trainers kannst du das Gelernte direkt anwenden und übst an praktischen Beispielen. Du lernst die wichtigsten Bibliotheken wie pandas, seaborn und scikit-learn kennen und wendest sie in umfangreichen Übungen an.
Data Science mit Python Seminar
Data Science mit Python - Einführung in Python
Du erhältst in der Data Science mit Python Schulung den Einstieg, um mit Python anhand vom pandas Paket Daten zu analysieren, mit seaborn plots zu erzeugen, eigene Funktionen zu schreiben Machine Learning Algorithmen umsetzen zu können.
Python ist eine der weitverbreitetsten Programmiersprachen, welche im Data Science Bereich etabliert ist. Neben R ist sie derzeit die meist benutzte Data Science Programmiersprache.
Lernziele Data Science mit Python Seminar
Inhalte Data Science mit Python Seminar
Ziele und Erwartungen der Teilnehmenden des Seminars Data Science mit Python
- Klärung individueller Lernziele und Erwartungen für ein praxisnahes und relevantes Seminar
Einführung
- Kurzer Hintergrund zu Python und Anaconda
- Installieren von neuen Paketen
- Arbeiten mit Jupyter Lab
Einführung in das Data Science Paket pandas
- Elemente eines pandas data.frame
- Eine Zeile/Spalte ansprechen, hinzufügen, löschen und verändern
- Boolean indexing
- Ein leeres data.frame erstellen
- Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren
Grundlegende Statistiken mit pandas
- Überblick über Statistiken, die mit einem data.frame berechnen werden kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,…)
- Eine Kreuztabelle (Kontingenztafel) berechnen
- Analysen mit grouphy gruppieren
- Fehlende Werte ergänzen
Daten einlesen
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
- Python’s pickle modul zum Speichern von Python Objekten
- Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
Visualisierung mit matplotlib und seaborn
- Die Hauptelemente beim Plotten mit matplotlib
- Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
- Auswahl von Farben
- Erstellen von Scatterplot, Linienplot, Barplot, Boxplot mit seaborn
Control Flows
- Die range() Funktion
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen
- For Schleifen
- If-Else Bedingungen
- Logische Vergleichsoperatoren
- Zuweisungsoperatoren
Überblick über Machine Learning
- Was ist Machine Learning
- Die Einteilung von Algorithmen im Machine Learning (supervised Learning – unsupervised learning – reinforcement learning)
- Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
Machine Learning Algorithmen (Theorie und Praxis)
- Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum)
- Train-Test Split der Daten
- Umsetzung des Algorithmus in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
Optional: Weitere Machine Learning Algorithmen in Python
- Erklärung von Random Forest und K-means
- Umsetzung dieser Algorithmen in Python
- Validieren der Ergebnisse
- Cross-validation (Kreuzvalidierung)
Ende der Data Science mit Python Schulung
Data Science mit Python Zielgruppe: Data Science mit Python Seminar
Technisch interessierte Fachkräfte bzw. Projektleiter, welche einen Einstieg in die Programmiersprache Python wünschen, um eigenständig an Data Science Projekten mitzuarbeiten oder ein besseres Verständnis für Python Code zu erhalten. Die Teilnehmer benötigen keine Erfahrung mit Python, sollten aber schon grundlegende Erfahrung mit einer Programmiersprache gemacht haben, um das Grundkonzept einer Programmiersprache zu verstehen. Überdies ist ein Basiswissen von grundlegenden statistischen Begriffen hilfreich (wie Mittelwert, Median, Perzentil).
Data Science mit Python Voraussetzungen: Data Science mit Python Seminar
Die Teilnehmer benötigen keine Erfahrung mit Python, sollten aber schon grundlegende Erfahrung mit einer Programmiersprache gehabt haben, um das Grundkonzept einer Programmiersprache zu verstehen. Überdies ist ein Basiswissen von grundlegenden statistischen Begriffen hilfreich (wie Mittelwert, Median, Perzentil, lineare Regression).