0

Anmeldung zum Seminar

Wenn Sie an diesem Seminar teilnehmen wollen, füllen Sie folgendes Formular aus.
Die mit * gekennzeichneten Felder müssen ausgefüllt werden.

Zunächst lernen die Teilnehmer die wichtigsten Rechen- und Speichertechnologien kennen, die zum Aufbau einer analytischen Lösung verwendet werden. Die Teilnehmer lernen, wie sie Daten, die in Dateien in einem Data Lake gespeichert sind, interaktiv untersuchen können. Sie lernen die verschiedenen Ingestion-Techniken kennen, die zum Laden von Daten mit der Apache Spark-Funktion in Azure Synapse Analytics oder Azure Databricks verwendet werden können, oder wie man mit Azure Data Factory oder Azure Synapse Pipelines Ingests durchführt.

Die Teilnehmer lernen auch die verschiedenen Möglichkeiten kennen, wie sie die Daten mit denselben Technologien umwandeln können, die für den Dateningest verwendet werden. Sie werden verstehen, wie wichtig es ist, Sicherheit zu implementieren, um sicherzustellen, dass die Daten im Ruhezustand oder bei der Übertragung geschützt sind. Anschließend wird gezeigt, wie man ein Echtzeit-Analysesystem erstellt, um Echtzeit-Analyselösungen zu entwickeln.

Examen: Das Seminar dient zur Vorbereitung auf die Prüfung DP-203, nach bestandenem Examen erhalten Sie folgenden Titel: Microsoft Certified: Azure Data Engineer Associate.

Die Prüfungsgebühr für das Examen DP-203 ist in der Kursgebühr NICHT enthalten.

Modul 1: Untersuchen von Rechen- und Speicheroptionen für Daten-Engineering-Workloads

Dieses Modul bietet einen Überblick über die Optionen der Azure-Computer- und Speichertechnologie, die Dateningenieuren zur Verfügung stehen, die analytische Workloads erstellen.In diesem Modul erfahren Sie, wie man das Datenmeer strukturiert und die Dateien für Explorations-, Streaming- und Batch-Workloads optimieren kann.Die Teilnehmer lernen, wie man das Datenmeer in Ebenen der Datenverfeinerung organisiert, während Dateien durch Stapel- und Stream-Verarbeitung transformiert werden. Anschließend lernen sie, wie man Indizes für ihre Datensets wie CSV-, JSON- und Parkettdateien erstellen und diese für eine mögliche Beschleunigung von Abfragen und Workloads verwenden kann.

Lektionen:

  • Einführung in Azure Synapse Analytics
  • Beschreiben von Azure Databricks
  • Einführung in den Azure Datenmeer-Speicher
  • Die Architektur des Datenmeeres beschreiben
  • Arbeiten mit Datenströmen, mit Hilfe von Azure Stream Analytics
  • Lab: Erkunden Sie die Rechen- und Speicheroptionen für Daten-Engineering-Workloads

    • Kombinieren Sie Streaming und Stapelverarbeitung mit einer einzigen Pipeline
    • Organisieren Sie das Datenmeer in Dateitransformationsebenen
    • Indizieren Sie den Datenmeer-Speicher für Abfrage- und Workload-Beschleunigung

    Nach Abschluss dieses Moduls sind die Teilnehmer in der Lage:

    • Azure Synapse Analytics zu beschreiben
    • Azure Databricks zu beschreiben
    • Azure Datenmeer-Speichers zu beschreiben
    • die Architektur des Datenmeeres zu beschreiben
    • Azure Stream Analytics zu beschreiben

Modul 2: Entwerfen und Implementieren der Ausgabeebenen.

In diesem Modul erfahren Sie, wie man Datenspeicher in einem modernen Daten-Warehouse entwerfen und implementieren kann, um analytische Workloads zu optimieren.Die Teilnehmer lernen, wie man ein mehrdimensionales Schema zum Speichern von Fakten- und Dimensionsdaten entwirft. Anschließend lernen die Teilnehmer, wie sich langsam ändernde Dimensionen durch inkrementelles Laden von Daten aus Azure Data Factory gefüllt werden.

Lektionen:

  • Entwerfen eines mehrdimensionales Schemas, um analytische Workloads zu optimieren
  • Codefreie Transformation im Maßstab mit Azure Data Factory
  • Sich langsam ändernde Dimensionen in Azure Synapse Analytics-Pipelines füllen

Lab: Entwerfen und Implementieren der Ausgabeebene

  • Entwerfen eines Sternschema für analytische Workloads
  • Sich langsam ändernde Dimensionen mit Azure Data Factory anfüllen und Datenflüsse zuordnen

Nach Abschluss dieses Moduls sind die Teilnehmer in der Lage:

  • ein Sternschema für analytische Workloads zu entwerfen
  • sich langsam ändernde Dimensionen mit Azure Data Factory zu füllen und Datenflüsse zuzuordnen

Modul 3: Überlegungen zum Daten-Engineering für Quelldateien

In diesem Modul werden Überlegungen zum Daten- Engineering erläutert, die beim Laden von Daten in ein modernes Daten-Warehouse häufig vorkommen, das analytisch aus in einem Azure Datenmeer gespeicherten Dateien geladen wird, und Grundlagen zu Sicherheitsaspekten beim Speichern von im Datenmeer gespeicherten Dateien vermittelt.

Lektionen:

  • Entwerfen Sie ein modernes Daten-Warehouse mit Azure Synapse Analytics
  • Sichern Sie ein Daten-Warehouse in Azure Synapse Analytics
  • Lab: Überlegungen zum Daten-Engineering

    • Verwalten von Dateien in einem Azure-Datenmeer
    • Sichern von Dateien, die in einem Azure-Datenmeer gespeichert sind

    Nach Abschluss dieses Moduls sind die Teilnehmer in der Lage:

    • ein modernes Daten-Warehouse mit Azure Synapse Analytics zu entwerfen
    • ein Daten Warehouse in Azure Synapse Analytics zu sichern

Modul 4: Führen Sie interaktive Abfragen mit serverlosen SQL-Pools von Azure Synapse Analytics aus

In diesem Modul lernen die Teilnehmer anhand von T-SQL-Anweisungen, die von einem serverlosen SQL-Pool in Azure Synapse Analytics ausgeführt werden, wie man mit Dateien arbeitet, die im Datenmeer und in externen Dateiquellen gespeichert sind. Die Teilnehmer fragen Parkettdateien ab, die in einem Datenmeer gespeichert sind, sowie CSV-Dateien, die in einem externen Datenspeicher gespeichert sind. Als Nächstes erstellen sie Azure Active Directory-Sicherheitsgruppen und erzwingen den Zugriff auf Dateien im Datenmeer über die rollenbasierte Zugriffssteuerung (RBAC) und Zugriffssteuerungslisten (ACLs).

Lektionen:

  • Erkunden Sie die Funktionen der serverlosen SQL-Pools von Azure Synapse
  • Abfragen von Daten im Meer mit Hilfe von serverlosen SQL-Pools von Azure Synapse
  • Erstellen Sie Metadatenobjekte in serverlosen SQL-Pools von Azure Synapse
  • Sichern Sie Daten und verwalten Sie Benutzer in serverlosen SQL-Pools von Azure Synapse
  • Lab: Führen Sie interaktive Abfragen mit serverlosen SQL-Pools aus

    • Abfragen von Parkettdaten mit serverlosen SQL-Pools
    • Erstellen externer Tabellen für Parkett- und CSV-Dateien
    • Erstellen von Ansichten mit serverlosen SQL-Pools
    • Zugriff auf Daten in einem Datensee bei Verwendung von serverlosen SQL-Pools sichern
    • Konfigurieren von Datenmeer-Sicherheit mit Hilfe rollenbasierter Zugriffssteuerung (RBAC) und der Zugriffssteuerungsliste

    Nach Abschluss dieses Moduls sind die Teilnehmer in der Lage:

    • Funktionen der serverlosen SQL-Pools von Azure Synapse zu verstehen
    • Daten im Datenmeer mit Hilfe von serverlosen SQL-Pools von Azure Synapse abzufragen
    • Metadatenobjekte in serverlosen SQL-Pools von Azure Synapse zu erstellen
    • Daten zu sichern und Benutzer in serverlosen SQL-Pools von Azure Synapse zu verwalten

Modul 5: Durchsuchen, Transformieren und Laden von Daten in das Daten-Warehouse mit Apache Spark

In diesem Modul erfahren Sie, wie man in einem Datenmeer gespeicherte Daten untersucht, die Daten transformiert und Daten in einen relationalen Datenspeicher lädt. Die Teilnehmer werden Parkett- und JSON-Dateien untersuchen und Techniken verwenden, um JSON-Dateien mit hierarchischen Strukturen abzufragen und zu transformieren. Anschließend verwenden die Teilnehmer Apache Spark, um Daten in das Daten-Warehouse zu laden und Parkettdaten im Datenmeer mit Daten im dedizierten SQL-Pool zu verknüpfen.

Lektionen:

  • Grundlegendes zum Engineering großer Datenmengen mit Apache Spark in Azure Synapse Analytics
  • Daten mit Apache Spark-Notebooks in Azure Synapse Analytics aufnehmen
  • Daten mit Data Frames in Apache Spark-Pools in Azure Synapse Analytics transformieren
  • SQL- und Apache Spark-Pools in Azure Synapse Analytics integrieren
  • Lab: Durchsuchen, transformieren und laden Sie Daten mit Apache Spark in das Daten-Warehouse

    • Führen Sie eine Datenexploration in Synapse Studio durch
    • Daten mit Spark-Notebooks in Azure Synapse Studio aufnehmen
    • Transformieren Sie Daten mit Data Frames in Spark-Pools in Azure Synapse Analytics
    • Integrieren Sie SQL- und Spark-Pools in Azure Synapse Analytics

    Nach Abschluss dieses Moduls sind die Teilnehmer in der Lage:

    • Engineering großer Datenmengen mit Apache Spark in Azure Synapse Analytics zu beschreiben
    • Daten mit Apache Spark-Notebooks in Azure Synapse Analytics aufzunehmen
    • Daten mit Data Frames in Apache Spark-Pools in Azure Synapse Analytics zu transformieren
    • SQL- und Apache Spark-Pools in Azure Synapse Analytics zu integrieren

Modul 6: Datenexploration und -transformation in Azure Databricks

In diesem Mod


Seminar DP-203 Data Engineering on Microsoft Azure
Version
Geben Sie hier bitte an, mit welcher Version Sie arbeiten!
(nur bei An­wender-Semi­naren)
Ort Frankfurt a. Main
Termin 03.11.2025 - 06.11.2025
Preis
2.376,00 € exkl. MwSt.
(2.827,44 € inkl. MwSt.)

Ansprechpartner Bestellung

Firma oder Privat*
Bestellnummer
Abteilung
Anrede*
Titel
Vorname*
Name*
Straße*
PLZ*
Ort*
Telefon*
E-Mail-Adresse*
Abweichende Rechnungsadresse

Teilnehmer*innen

Anrede* Vorname* Name* E-Mail-Adresse*
Zum Schutz gegen Spam kann das Formular erst nach 15 Sekunden abgesendet werden.
Bitte warten Sie, bis der Absende-Button aktiv wird!