Kurs

Data Processing at Scale

Dauer: 2 Tage
Sprache: EN

Lernen Sie die Verwendung von Apache Spark zur Verarbeitung grosser Datenmengen.

Daten sind Wissen und Wissen ist Macht. Aber die effiziente Verarbeitung von Daten kann eine Herausforderung sein, wenn die Datenmenge wächst. Diese Schulung befasst sich eingehend mit einem der beliebtesten und skalierbarsten Tools auf dem Markt für die Transformation grosser Datenmengen: Apache Spark!

Inhalt

  • Die Grundlagen von Apache Spark
  • Laden von Daten aus verschiedenen Formaten
  • Grundlegende und erweiterte Datenframe-Operationen
  • Window- und benutzerdefinierte Funktionen
  • Unit-Tests
  • Analysieren von umfangreichen Logs, um Trendthemen zu finden

Zielgruppe

Ingenieure für Daten und maschinelles Lernen, die sich mit der Umwandlung grosser Datenmengen befassen.

Voraussetzung

Grundlegende Erfahrung mit Python ist erforderlich. Wenn Sie noch nicht so weit sind, empfehlen wir den Kurs Python for Data Engineers als Vorbereitung auf diese Schulung.

Für die Teilnahme am Kurs wird ein eigener Laptop benötigt.

Über allfällige technische Voraussetzungen und Vorinstallationen werden die Kursteilnehmenden spätestens eine Woche vor dem Kurs informiert.