Bestellung
Wenn Sie an diesem Seminar teilnehmen wollen, füllen Sie folgendes Formular aus.Die mit * gekennzeichneten Felder müssen ausgefüllt werden.
In diesem Kurs für Fortgeschrittene lernen Sie, robuste Batch-Datenpipelines auf Google Cloud zu entwerfen, zu erstellen und zu optimieren. Über die grundlegende Datenverarbeitung hinaus lernen Sie umfangreiche Datentransformationen und eine effiziente Workflow-Orchestrierung kennen, die für zeitnahe Business Intelligence und kritische Berichte unerlässlich sind.
Sie erhalten praktische Übungen zur Implementierung von Dataflow für Apache Beam und Serverless für Apache Spark (Dataproc Serverless) und befassen sich mit wichtigen Überlegungen zur Datenqualität, Überwachung und Alarmierung, um die Zuverlässigkeit der Pipeline und die operative Exzellenz sicherzustellen. Grundlegende Kenntnisse in Data Warehousing, ETL/ELT, SQL, Python und Google Cloud-Konzepten werden empfohlen.
- Bestimmen Sie, ob Batch-Datenpipelines die richtige Wahl für Ihren geschäftlichen Anwendungsfall sind.
- Entwerfen und Erstellen skalierbarer Batch-Datenpipelines für die Aufnahme und Transformation großer Datenmengen.
- Implementierung von Datenqualitätskontrollen in Batch-Pipelines zur Gewährleistung der Datenintegrität.
- Orchestrierung, Verwaltung und Überwachung von Batch-Datenpipeline-Workflows, Implementierung von Fehlerbehandlung und Beobachtbarkeit mit Hilfe von Protokollierungs- und Überwachungstools.