0

Building Batch Data Analytics Solutions on AWS (BBDAS) Kurssprache: Deutsch

Ihre Termine

Datum Ort Preis
10.03.2026 Virtuelles Live Training 865,13 €* Buchen
23.06.2026 Virtuelles Live Training 847,28 €* Buchen
13.10.2026 Virtuelles Live Training 847,28 €* Buchen

* Preise inkl. der gesetzlichen Mehrwertsteuer

Beschreibung

In diesem Kurs lernen Sie die Erstellung von Batch-Datenanalyselösungen mit Amazon EMR, einem verwalteten Apache Spark- und Apache Hadoop-Service der Enterprise-Klasse. Sie lernen, wie Amazon EMR mit Open-Source-Projekten wie Apache Hive, Hue und HBase und mit AWS-Services wie AWS Glue und AWS Lake Formation integriert wird. Der Kurs behandelt die Komponenten Datenerfassung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung im Kontext von Spark und Hadoop. Sie lernen die Verwendung von EMR Notebooks zur Unterstützung von Analyse- und Machine Learning-Arbeitslasten. Sie werden auch lernen, die besten Praktiken für Sicherheit, Leistung und Kostenmanagement auf den Betrieb von Amazon EMR anzuwenden.

Inhalte

In diesem Kurs werden Sie lernen:

  • Vergleichen Sie die Funktionen und Vorteile von Data Warehouses, Data Lakes und modernen Datenarchitekturen
  • Entwurf und Implementierung einer Lösung für die Batch-Datenanalyse
  • Identifizierung und Anwendung geeigneter Techniken, einschließlich Komprimierung, zur Optimierung der Datenspeicherung
  • Auswahl und Einsatz geeigneter Optionen zur Aufnahme, Umwandlung und Speicherung von Daten
  • Auswahl der geeigneten Instanz- und Knotentypen, Cluster, der automatischen Skalierung und der Netzwerktopologie für einen bestimmten geschäftlichen Anwendungsfall
  • Verstehen, wie sich Datenspeicherung und -verarbeitung auf die Analyse- und Visualisierungsmechanismen auswirken, die für die Gewinnung verwertbarer Geschäftseinblicke erforderlich sind
  • Sichere Daten im Ruhezustand und bei der Übertragung
  • Überwachen von Analyse-Workloads, um Probleme zu erkennen und zu beheben
  • Anwendung bewährter Kostenmanagementverfahren

Voraussetzungen

Teilnehmer mit mindestens einem Jahr Erfahrung im Umgang mit Open-Source-Datenframeworks wie Apache Spark oder Apache Hadoop profitieren von diesem Kurs.

Zielgruppe

Dieser Kurs richtet sich an:

  • Ingenieure für Datenplattformen
  • Architekten und Betreiber, die Datenanalyse-Pipelines aufbauen und verwalten