- Einrichten des HDFS
- Verwendung von YARN
- Einrichtung Apache Spark
- Konfiguration Apache Spark
- Strukturierte Abfragen mit Spark SQL
- Machine Learning mit MLlib
- Python-Schnittstelle zu Spark (Pyspark)
- Zeppelin-Notebooks
- Queries
- Visualisierung der Ergebnisse
Big Data Hands-on Schulung
Anwendungen in der Praxis
Im Zeitalter immer höherem Datenaufkommens und einer Vielzahl an Datenquellen ist der Einsatz von Big Data Technologien unabdingbar. In diesem praxisnahen Kurs wird ein System zum verteilten Ablegen und Verarbeiten von Daten Schritt für Schritt aufgesetzt. Hierbei kommen unter anderem HDFS, Hadoop und Apache Spark zum Einsatz. Darauf aufbauend wird ein Hadoop beziehungsweise Apache Spark Ökosystem aufgebaut. Basierend auf diesem System, werden verteilt abgelegte Daten mit Hilfe der vereinheitlichten SQL abgefragt, analysiert und visualisiert.
Inhalte Big Data Praxis Schulung
Entscheidungshelfer Big Data Praxis Schulung
Zielgruppe
Der Kurs richtet sich an all diejenigen, die Big-Data-Lösungen in der Praxis implementieren möchten.
Voraussetzung
Grundbegriffe und -prinzipien aus dem Big Data Bereich sollten geläufig sein. Diese können zum Beispiel im Kurs Big Data – Das Business von morgen erworben werden. Zudem solltest du ein Grundinteresse oder erste Erfahrungen mit Unix-basierten Systemen mitbringen.