SchulungenProgrammierungPythonData Science mit Python – Einführung in Python
Lade Schulungen
vollständiger Stern vollständiger Stern vollständiger Stern vollständiger Stern halber Stern
4.4
(109)

Data Science mit Python – Einführung in Python Seminar

Machine Learning Algorithmen mit Python umsetzen

Python ist eine der weitverbreitetsten Programmiersprachen, welche im Data Science Bereich etabliert ist. Neben R ist sie derzeit die meist benutze Data Science Programmiersprache. Du erhältst einen Einstieg, um mit Python Daten zu analysieren und Machine Learning Algorithmen umsetzen zu können.

Inhalte Python Machine Learning Seminar

Einführung

  • Kurzer Hintergrund zu Python und Anaconda
  • Installieren von neuen Paketen
  • Die Entwicklungsumgebung (IDE) Spyder
  • Lizenzinformationen
  • Aspekte von Python, die anders als in anderen Programmiersprachen sind

Datenstrukturen in Python

  • Unterschied Funktionen vs. Methoden
  • Datenstrukturen in Python (number, tuple, list, dictionary, string)
  • Überblick und wichtige Methoden zu den Datenstrukturen
  • Unterschied list vs. tuple
  • Die Besonderheit des Wertes NaN
  • Wann benutze ich welche Klammer [], (), {}?
  • Eine Sequenz von Zahlen erzeugen
  • List comprehension

Einführung in das Data Science Paket pandas

  • Elemente eines pandas data.frame
  • Eine Zeile ansprechen, hinzufügen und verändern
  • Eine Spalte ansprechen, hinzufügen und verändern
  • Boolean indexing
  • Ein leeres data.frame erstellen
  • Überblick über Methoden im data.frame, um einen Überblick der Daten zu erhalten.

Grundlegende Statistiken mit pandas

  • Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,…)
  • Eine Kreuztabelle (Kontingenztafel) berechnen
  • Fehlende Werte ergänzen
  • Variablen standardisieren
  • Logische Operatoren

Daten einlesen

  • Das Arbeitsverzeichnis in Python setzen
  • Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
  • Eine Excel Datei einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
  • Python’s pickle modul zum Speichern von Python Objekten
  • Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)

Data handling mit Pandas

  • Löschen einer Zeile und Spalte
  • Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
  • Pivotieren eines data.frame: Umwandeln zwischen long und wide Format (gestapelt und ungestapelte Daten)

Visualisierung mit matplotlib und pandas

  • Die Hauptelemente beim Plotten mit matplotlib
  • Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
  • Auswahl von Farben
  • Subplots erstellen
  • Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot

Control Flows

  • Die range() Funktion
  • Eine eigene Funktion schreiben
  • Default Parameter in einer Funktion setzen
  • For Schleifen
  • If-Else Bedingungen
  • While Schleife
  • Logische Vergleichsoperatoren
  • Zuweisungsoperatoren

Algorithmen im Data Science (theoretischer Überblick)

  • Big Data und die vier Vs von Big data
  • Was ist Machine Learning
  • Die Einteilung von Algorithmen im Machine Learning (supervised Learning – unsupervised learning – reinforcement learning)
  • Einführung in wichtige Algorithmen: Lineare Regression, Logistische Regression, Entscheidungsbäume, Random Forest, Support Vector Machine (SVM), K-means, Kerndichteschätzer
  • Overfitten und wie ich es entdecken und vermeiden kann
  • Kreuzvalidierung, confusion matrix, ROC Kurve

Algorithmen im Data Science (in der Praxis)

  • Die Schritte beim Modellieren (Aufteilung der Daten in Test-Train, Model erstellen, Model validieren)
  • Praktische Umsetzung der theoretisch behandelten Algorithmen mit dem Paket scikit-learn
  • Trainieren und Validieren von Modellen

Finaler use case zur Wiederholung des Gelernten

  • Abgeschlossenes Projekt, indem die wichtigsten Schritte wiederholt werden können vom Daten Einlesen, Daten handling, über Visualisierung und Erstellen und Vergleich von Machine Learning Algorithmen

Wir schulen auch bei dir vor Ort!

Diese Python Machine Learning Schulung führen wir auch bei dir im Unternehmen als individualisierte Python Machine Learning-Firmenschulung durch.

Zielgruppe Python Machine Learning Seminar

Technisch interessierte Fachkräfte bzw. Projektleiter, welche einen Einstieg in die Programmiersprache Python wünschen, um eigenständig an Data Science Projekten mitzuarbeiten oder ein besseres Verständnis für Python Code zu erhalten.

Voraussetzungen Python Machine Learning Seminar

Die Teilnehmer benötigen keine Erfahrung mit Python, sollten aber schon grundlegende Erfahrung mit einer Programmiersprache gehabt haben, um das Grundkonzept einer Programmiersprache zu verstehen. Überdies ist ein Basiswissen von grundlegenden statistischen Begriffen hilfreich (wie Mittelwert, Median, Perzentil, lineare Regression).