Lernen Sie die Verwendung von Apache Spark zur Verarbeitung grosser Datenmengen.
Daten sind Wissen und Wissen ist Macht. Aber die effiziente Verarbeitung von Daten kann eine Herausforderung sein, wenn die Datenmenge wächst. Diese Schulung befasst sich eingehend mit einem der beliebtesten und skalierbarsten Tools auf dem Markt für die Transformation grosser Datenmengen: Apache Spark!
Inhalt
- Die Grundlagen von Apache Spark
- Laden von Daten aus verschiedenen Formaten
- Grundlegende und erweiterte Datenframe-Operationen
- Window- und benutzerdefinierte Funktionen
- Unit-Tests
- Analysieren von umfangreichen Logs, um Trendthemen zu finden
Zielgruppe
Ingenieure für Daten und maschinelles Lernen, die sich mit der Umwandlung grosser Datenmengen befassen.
Voraussetzung
Grundlegende Erfahrung mit Python ist erforderlich. Wenn Sie noch nicht so weit sind, empfehlen wir den Kurs Python for Data Engineers als Vorbereitung auf diese Schulung.
Für die Teilnahme am Kurs wird ein eigener Laptop benötigt.
Über allfällige technische Voraussetzungen und Vorinstallationen werden die Kursteilnehmenden spätestens eine Woche vor dem Kurs informiert.
Durchführung
Der Kurs wird an diversen Terminen gemäss öffentliche Ausschreibung angeboten, gerne führen wir ihn auch firmenintern für Ihr Team durch. Kontaktieren Sie uns für eine unverbindliche Offerte.
Über Xebia Schweiz
Entdecke die Welt der Datenwissenschaft mit Xebia Academy Schweiz! Erweitere deine Fähigkeiten in Data Science Kursen in Zürich, Bern sowie in virtuellen Live-Kursen. Kompakte Weiterbildung durch praxisnahe Referenten und persönlicher Betreuung – werde zum Experten in Data Science!