{"id":6646,"date":"2024-09-03T12:01:55","date_gmt":"2024-09-03T12:01:55","guid":{"rendered":"https:\/\/ultratendencyaca-urouz8wsum.live-website.com\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/"},"modified":"2024-09-03T12:09:21","modified_gmt":"2024-09-03T12:09:21","slug":"entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake","status":"publish","type":"post","link":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/","title":{"rendered":"Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1216.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:1.92%;--awb-margin-bottom-large:0px;--awb-spacing-left-large:1.92%;--awb-width-medium:100%;--awb-spacing-right-medium:1.92%;--awb-spacing-left-medium:1.92%;--awb-width-small:100%;--awb-spacing-right-small:1.92%;--awb-spacing-left-small:1.92%;\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-1\"><h2><strong>Einf\u00fchrung<\/strong><\/h2>\n<p> In der sich schnell entwickelnden Welt des Datenmanagements stellt Delta Lake einen transformativen Fortschritt dar, der die Handhabung und Verarbeitung gro\u00dfer Datenmengen mit Apache Spark optimiert. Als Open-Source-Speicherschicht, die von den Sch\u00f6pfern von Spark entwickelt wurde, verbessert Delta Lake die Zuverl\u00e4ssigkeit, Leistung und Verwaltung von Daten und macht Data Lakes in Unternehmen einfacher und robuster. Die Verwaltung komplexer Datenpipelines mit herk\u00f6mmlichem Spark kann aufgrund ineffizienter Upserts, komplexer Zeitreisen und Schema-Inkonsistenzen eine Herausforderung darstellen. Delta Lake l\u00f6st diese Probleme mit Funktionen, die den Betrieb rationalisieren und eine hohe Datenqualit\u00e4t gew\u00e4hrleisten. Seine Medaillon-Architektur wirkt wie eine Reihe von Toren, die sicherstellen, dass nur saubere Daten die Rohdaten-, Kuratierungs- und Serving-Ebenen durchlaufen. Die Durchsetzung von Schemata verhindert, dass unsaubere Daten Ihre Pipeline verunreinigen, w\u00e4hrend die eingebaute Versionierung wie eine Zeitmaschine funktioniert, die eine einfache Pr\u00fcfung und ein Rollback zu fr\u00fcheren Datenzust\u00e4nden erm\u00f6glicht. Delta Lake bietet au\u00dferdem effiziente Merge-Operationen, die die Datenintegration vereinfachen und die Komplexit\u00e4t und den Zeitaufwand f\u00fcr Upserts reduzieren. Leistungsverbesserungen wie Z-Ordering optimieren die Speicherung, beschleunigen Abfragen und senken die Kosten. Die Verwaltung von Metadaten strukturiert Informationen effektiv, und der Vakuum-Befehl hilft dabei, Daten zu organisieren und relevant zu halten. Durch die Integration von Delta Lake mit Apache Spark k\u00f6nnen Dateningenieure skalierbare, zuverl\u00e4ssige und effiziente Datenpipelines erstellen. Diese Integration sorgt f\u00fcr eine h\u00f6here Datenqualit\u00e4t, optimierte Speicherung, geringere Betriebskosten und eine agilere Dateninfrastruktur und macht Spark zu einem leistungsf\u00e4higeren Werkzeug f\u00fcr moderne Datenherausforderungen.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1216.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:1.92%;--awb-margin-bottom-large:0px;--awb-spacing-left-large:1.92%;--awb-width-medium:100%;--awb-spacing-right-medium:1.92%;--awb-spacing-left-medium:1.92%;--awb-width-small:100%;--awb-spacing-right-small:1.92%;--awb-spacing-left-small:1.92%;\"><div class=\"fusion-column-wrapper fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-2\"><h1><strong>Einf\u00fchrung in Delta Lake<\/strong><\/h1>\n<p> Delta Lake, eine Open-Source-Speicherschicht von Databricks, wurde Anfang 2019 eingef\u00fchrt. Sie wurde entwickelt, um die Zuverl\u00e4ssigkeit und Leistung von Data Lakes zu verbessern und l\u00e4sst sich nahtlos mit Apache Spark integrieren.<\/p>\n<\/div><div class=\"fusion-image-element awb-imageframe-style awb-imageframe-style-below awb-imageframe-style-1\" style=\"--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--body_typography-font-family);--awb-caption-title-font-weight:var(--body_typography-font-weight);--awb-caption-title-font-style:var(--body_typography-font-style);--awb-caption-title-size:var(--body_typography-font-size);--awb-caption-title-transform:var(--body_typography-text-transform);--awb-caption-title-line-height:var(--body_typography-line-height);--awb-caption-title-letter-spacing:var(--body_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><a class=\"fusion-no-lightbox\" href=\"https:\/\/learn.microsoft.com\/en-us\/answers\/questions\/533548\/delta-lake-with-databricks-and-synapse\" target=\"_self\" aria-label=\"delta_lake_1\"><img decoding=\"async\" width=\"2008\" height=\"896\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/delta_lake_1.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/delta_lake_1.png\" alt class=\"lazyload img-responsive wp-image-6589\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272008%27%20height%3D%27896%27%20viewBox%3D%270%200%202008%20896%27%3E%3Crect%20width%3D%272008%27%20height%3D%27896%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/delta_lake_1-200x89.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/delta_lake_1-400x178.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/delta_lake_1-600x268.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/delta_lake_1-800x357.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/delta_lake_1-1200x535.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/delta_lake_1.png 2008w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/a><\/span><div class=\"awb-imageframe-caption-container\" style=\"text-align:center;\"><div class=\"awb-imageframe-caption\"><div class=\"awb-imageframe-caption-title\">Quelle: https:\/\/learn.microsoft.com\/en-us\/answers\/questions\/533548\/delta-lake-with-databricks-and-synapse<\/div><\/div><\/div><\/div><div class=\"fusion-text fusion-text-3\"><h3><strong>Warum Delta Lake verwenden?<\/strong><\/h3>\n<p> Delta Lake l\u00f6st mehrere g\u00e4ngige Probleme bei der Datenverwaltung und -verarbeitung: <\/p>\n<ul>\n<li><strong>Open Source<\/strong>: Angetrieben von Beitr\u00e4gen der Community und unterst\u00fctzt von Databricks mit offenen Standards und Protokollen.<\/li>\n<li><strong>ACID-Transaktionen<\/strong>: Sorgt f\u00fcr zuverl\u00e4ssige und konsistente Datenoperationen mit starker Isolierung.<\/li>\n<li><strong>Zeitreise<\/strong>: Erm\u00f6glicht die Abfrage von fr\u00fcheren Datenversionen f\u00fcr Audits und Rollbacks.<\/li>\n<li><strong>Schema-Entwicklung<\/strong>: Unterst\u00fctzt Schema\u00e4nderungen ohne Unterbrechung des laufenden Betriebs.<\/li>\n<li><strong>Gleichzeitige Schreibvorg\u00e4nge<\/strong>: Erm\u00f6glicht das gleichzeitige Schreiben von Daten, was f\u00fcr umfangreiche Anwendungen entscheidend ist.<\/li>\n<li><strong>Optimierung der Leistung<\/strong>: Funktionen wie Z-Ordering und das \u00dcberspringen von Daten verbessern die Abfragegeschwindigkeit.<\/li>\n<li><strong>Skalierbare Metadaten<\/strong>: Verwalten Sie umfangreiche Datens\u00e4tze mit Milliarden von Partitionen und Dateien.<\/li>\n<li><strong>Vereinheitlichtes Batch\/Streaming<\/strong>: Erm\u00f6glicht eine Exact-once-Semantik f\u00fcr Batch- und Streaming-Daten.<\/li>\n<li><strong>Audit-Verlauf<\/strong>: Bietet einen vollst\u00e4ndigen Pr\u00fcfpfad mit detaillierten Protokollen aller Daten\u00e4nderungen.<\/li>\n<li><strong>DML-Operationen<\/strong>: Bietet flexible APIs (SQL, Scala\/Java, Python) f\u00fcr Datenmanipulationsaufgaben.<\/li>\n<\/ul>\n<\/div><div class=\"fusion-text fusion-text-4\"><h1><strong>Einf\u00fchrung in Apache Spark<\/strong><\/h1>\n<p> Apache Spark ist eine einheitliche Analyse-Engine f\u00fcr die Verarbeitung gro\u00dfer Datenmengen mit integrierten Modulen f\u00fcr Streaming, SQL, maschinelles Lernen und Graphverarbeitung. Die verteilten Rechenfunktionen von Spark machen es zu einem leistungsstarken Werkzeug f\u00fcr die schnelle und effiziente Verarbeitung gro\u00dfer Datenmengen. Zu den wichtigsten Funktionen von Spark geh\u00f6ren die In-Memory-Datenverarbeitung, die erweiterte Abfrageoptimierung und die Unterst\u00fctzung verschiedener Datenquellen und -formate. <strong>Spark Core<\/strong>: Verwaltet die Planung von Aufgaben und die Speicherverwaltung.   <\/p>\n<ul>\n<li><strong>Spark SQL<\/strong>: Bietet Funktionen zur Datenabfrage.<\/li>\n<li><strong>Spark Streaming<\/strong>: Verarbeitet Daten in Echtzeit.<\/li>\n<li><strong>MLlib<\/strong>: F\u00fcr maschinelles Lernen.<\/li>\n<li><strong>GraphX<\/strong>: F\u00fcr die Verarbeitung von Graphen.<\/li>\n<\/ul>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"1667\" height=\"473\" title=\"apache_spark_1\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/apache_spark_1.jpg\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/apache_spark_1.jpg\" alt class=\"lazyload img-responsive wp-image-6591\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271667%27%20height%3D%27473%27%20viewBox%3D%270%200%201667%20473%27%3E%3Crect%20width%3D%271667%27%20height%3D%27473%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/apache_spark_1-200x57.jpg 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/apache_spark_1-400x113.jpg 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/apache_spark_1-600x170.jpg 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/apache_spark_1-800x227.jpg 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/apache_spark_1-1200x340.jpg 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/apache_spark_1.jpg 1667w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-5\"><h1><strong>Verbesserung von Spark mit Delta Lake<\/strong><\/h1>\n<p> Delta Lake erweitert Apache Spark durch die Integration einer leistungsstarken Schicht, die die Datenverwaltung und -verarbeitung verbessert. Urspr\u00fcnglich exklusiv f\u00fcr Databricks, ist es jetzt Open Source unter der Apache License V2. Delta Lake l\u00e4sst sich nahtlos in bestehende Speichersysteme integrieren und bietet eine einheitliche Plattform f\u00fcr die Batch- und Streaming-Datenverarbeitung, die Datenkonsistenz, eine einfache Schemaverwaltung und die M\u00f6glichkeit zur Abfrage historischer Datenversionen gew\u00e4hrleistet. Im Folgenden finden Sie einen kurzen \u00dcberblick dar\u00fcber, wie Delta Lake Spark erweitert und wie der Datenfluss und die Interaktionspunkte aussehen:    <\/p>\n<ol>\n<li><strong>Daten-Ingestion<\/strong>:\n<ul>\n<li><strong>Quellen<\/strong>: Delta Lake erm\u00f6glicht die nahtlose Aufnahme von Daten aus verschiedenen Quellen, einschlie\u00dflich Cloud Object Stores, Datenbanken und Streaming-Plattformen.<\/li>\n<li><strong>Integration<\/strong>: Die Daten werden in Delta Lake-Tabellen eingelesen, die sowohl f\u00fcr Batch- als auch f\u00fcr Streaming-Operationen optimiert sind. Diese Integration unterst\u00fctzt die Aufnahme von Daten mit hohem Durchsatz und minimaler Latenz. <\/li>\n<\/ul>\n<\/li>\n<li><strong>Datenverarbeitung<\/strong>:\n<ul>\n<li><strong>Spark-Integration<\/strong>: Sobald sich die Daten in Delta Lake-Tabellen befinden, verarbeitet Spark sie effizient mit seinen verteilten Rechenfunktionen.<\/li>\n<li><strong>ACID-Transaktionen<\/strong>: Delta Lake bietet ACID-Transaktionen, um die Datenkonsistenz w\u00e4hrend der Verarbeitung sicherzustellen. Dies garantiert, dass alle Vorg\u00e4nge korrekt abgeschlossen werden und im Falle von Fehlern Rollback-Funktionen zur Verf\u00fcgung stehen. <\/li>\n<\/ul>\n<\/li>\n<li><strong>Datenverwaltung<\/strong>:\n<ul>\n<li><strong>Schema-Entwicklung<\/strong>: Delta Lake vereinfacht die Schemaverwaltung, indem es Schema\u00e4nderungen ohne Unterbrechung des laufenden Betriebs erm\u00f6glicht. Diese Flexibilit\u00e4t ist entscheidend f\u00fcr die Anpassung an sich entwickelnde Datenstrukturen. <\/li>\n<li><strong>Zeitreise<\/strong>: Erm\u00f6glicht Benutzern den Zugriff auf und die Abfrage von fr\u00fcheren Datenversionen und erleichtert so Audits, Rollbacks und die Analyse historischer Daten.<\/li>\n<\/ul>\n<\/li>\n<li><strong>Daten abfragen<\/strong>:\n<ul>\n<li><strong>Spark SQL<\/strong>: Benutzer k\u00f6nnen Spark SQL nutzen, um komplexe Abfragen auf Delta Lake-Tabellen auszuf\u00fchren. Die Optimierungen von Delta Lake, wie z.B. das \u00dcberspringen von Daten und Z-Ordering, verbessern die Abfrageleistung und reduzieren die Ausf\u00fchrungszeiten. <\/li>\n<\/ul>\n<\/li>\n<\/ol>\n<p> Delta Lake erweitert die F\u00e4higkeiten von Apache Spark, indem es ein robustes Framework f\u00fcr die Datenverwaltung bietet. Seine Funktionen &#8211; ACID-Transaktionen, Schema-Evolution und Zeitreisen &#8211; verbessern die Leistung, Datenzuverl\u00e4ssigkeit und Flexibilit\u00e4t von Spark. Diese Integration stellt sicher, dass Spark-Anwender von einer verbesserten Datenkonsistenz, optimierten Schemaanpassungen und leistungsstarken Abfragefunktionen profitieren.<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-3 hover-type-none\"><img decoding=\"async\" width=\"875\" height=\"489\" title=\"spark_delta_lake\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_lake.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/spark_delta_lake.png\" alt class=\"lazyload img-responsive wp-image-6593\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27875%27%20height%3D%27489%27%20viewBox%3D%270%200%20875%20489%27%3E%3Crect%20width%3D%27875%27%20height%3D%27489%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_lake-200x112.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_lake-400x224.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_lake-600x335.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_lake-800x447.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_lake.png 875w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 875px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-6\"><h1><strong>Praktisches Beispiel: Delta Lake mit Apache Spark<\/strong><\/h1>\n<p> Dieser Abschnitt enth\u00e4lt ein praktisches Beispiel f\u00fcr die Verwendung von Delta Lake mit Apache Spark. Detaillierte Anweisungen zur Einrichtung und weitere Informationen finden Sie in der <a href=\"https:\/\/delta.io\/learn\/getting-started\/\">Delta Lake-Dokumentation<\/a>. Der Einfachheit halber werden wir Python verwenden und anhand von Notebook-Zellen demonstrieren, wie Sie die Funktionen von Delta Lake nutzen k\u00f6nnen.   <\/p>\n<h3><strong>Einrichtung und Initialisierung<\/strong><\/h3>\n<p> Um Delta Lake mit Apache Spark zu integrieren, haben Sie mehrere flexible M\u00f6glichkeiten: <\/p>\n<ul>\n<li><strong>Interactive Shell:<\/strong> Verwenden Sie PySpark oder die Spark Scala-Shell f\u00fcr die direkte Interaktion. Sie k\u00f6nnen PySpark mit Delta Lake mit pip oder die Scala-Shell mit bin\/spark-shell von Spark einrichten, beide mit Delta Lake-Abh\u00e4ngigkeiten und -Konfigurationen. <\/li>\n<li><strong>Projekt einrichten:<\/strong> Erstellen Sie ein Projekt mit Delta Lake unter Verwendung von Maven oder SBT f\u00fcr Scala\/Java, oder konfigurieren Sie Python-Projekte mit pip und delta-spark. Dieses Setup erm\u00f6glicht eine skalierbare Entwicklung und Integration in gr\u00f6\u00dfere Anwendungen. <\/li>\n<\/ul>\n<h3><strong>Installation der Bibliothek f\u00fcr die Demo<\/strong><\/h3>\n<p> F\u00fcr die Demo haben wir uns entschieden, den Code in einer lokalen Jupyter Notebook-Umgebung auszuf\u00fchren. Bitte installieren Sie die erforderlichen Bibliotheken mit Python, um die Demo einzurichten: !pip install pyspark delta-spark Vergewissern Sie sich, dass das Jupyter-Notebook lokal installiert ist und geben Sie dann im Terminal ein: jupyter notebook Dieser Befehl richtet PySpark und Delta Lake f\u00fcr die interaktive Nutzung ein und stellt sicher, dass Sie die f\u00fcr die Datenverarbeitung und -verwaltung erforderlichen Tools in Ihrer Umgebung haben. <strong>4.3 Einrichten von Spark mit Delta Lake<\/strong> Um Delta Lake mit Apache Spark in Ihrer Python-Umgebung zu verwenden, m\u00fcssen Sie zun\u00e4chst eine SparkSession mit den erforderlichen Delta Lake-Konfigurationen initialisieren. Diese Einrichtung erm\u00f6glicht es Ihnen, die Funktionen von Delta Lake wie ACID-Transaktionen und Schemaentwicklung in Ihren Spark-Anwendungen zu nutzen. Hier erfahren Sie, wie Sie Spark mit Delta Lake konfigurieren k\u00f6nnen:<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-4 hover-type-none\"><img decoding=\"async\" width=\"2232\" height=\"1309\" title=\"settingup_1 (1)\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_1-1.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/settingup_1-1.png\" alt class=\"lazyload img-responsive wp-image-6595\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272232%27%20height%3D%271309%27%20viewBox%3D%270%200%202232%201309%27%3E%3Crect%20width%3D%272232%27%20height%3D%271309%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_1-1-200x117.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_1-1-400x235.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_1-1-600x352.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_1-1-800x469.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_1-1-1200x704.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_1-1.png 2232w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-7\"><h3><strong>Laden von Beispieldaten<\/strong><\/h3>\n<p> Dieses Codeschnipsel liest eine CSV-Datei in einen Spark DataFrame ein, wobei das Schema abgeleitet und die Kopfzeilen einbezogen werden. Anschlie\u00dfend zeigt er die ersten 5 Zeilen des DataFrame an und liefert eine Zusammenfassung der Statistiken des Datensatzes.<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-5 hover-type-none\"><img decoding=\"async\" width=\"2253\" height=\"783\" title=\"settingup_2 (1)\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_2-1-1.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/settingup_2-1-1.png\" alt class=\"lazyload img-responsive wp-image-6609\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272253%27%20height%3D%27783%27%20viewBox%3D%270%200%202253%20783%27%3E%3Crect%20width%3D%272253%27%20height%3D%27783%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_2-1-1-200x70.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_2-1-1-400x139.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_2-1-1-600x209.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_2-1-1-800x278.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_2-1-1-1200x417.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_2-1-1.png 2253w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-8\"><h3><strong>Schreiben und Lesen von Daten mit Delta Lake<\/strong><\/h3>\n<p> In diesem Abschnitt wird gezeigt, wie Sie Daten in eine Delta Lake-Tabelle schreiben und dann wieder zur\u00fccklesen. Der Code speichert den DataFrame in einer Delta Lake-Tabelle unter dem angegebenen Pfad und liest ihn dann in einen neuen DataFrame zur\u00fcck und zeigt die Ergebnisse an.<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-6 hover-type-none\"><img decoding=\"async\" width=\"2226\" height=\"792\" title=\"settingup_3 (1)\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_3-1.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/settingup_3-1.png\" alt class=\"lazyload img-responsive wp-image-6601\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272226%27%20height%3D%27792%27%20viewBox%3D%270%200%202226%20792%27%3E%3Crect%20width%3D%272226%27%20height%3D%27792%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_3-1-200x71.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_3-1-400x142.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_3-1-600x213.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_3-1-800x285.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_3-1-1200x427.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_3-1.png 2226w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-9\"><h3><strong>Hinzuf\u00fcgen und Lesen neuer Daten mit der Schemaverwaltung<\/strong><\/h3>\n<p> In diesem Abschnitt wird gezeigt, wie Sie neue Daten zu einer Delta Lake-Tabelle hinzuf\u00fcgen und Schema\u00e4nderungen handhaben k\u00f6nnen. Das folgende Codeschnipsel zeigt, wie Sie neue Daten zu einer Delta Lake-Tabelle hinzuf\u00fcgen und gleichzeitig die Schemaentwicklung verwalten k\u00f6nnen. Es f\u00fcgt neue Datens\u00e4tze an die Tabelle an und stellt die Konsistenz sicher, indem es die aktualisierten Daten nach jeder Transaktion anzeigt.<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-7 hover-type-none\"><img decoding=\"async\" width=\"2193\" height=\"1374\" title=\"settingup_4 (1)\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_4-1.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/settingup_4-1.png\" alt class=\"lazyload img-responsive wp-image-6599\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272193%27%20height%3D%271374%27%20viewBox%3D%270%200%202193%201374%27%3E%3Crect%20width%3D%272193%27%20height%3D%271374%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_4-1-200x125.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_4-1-400x251.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_4-1-600x376.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_4-1-800x501.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_4-1-1200x752.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_4-1.png 2193w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-8 hover-type-none\"><img decoding=\"async\" width=\"1386\" height=\"777\" title=\"settingup_5 (1)\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_5-1.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/settingup_5-1.png\" alt class=\"lazyload img-responsive wp-image-6603\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271386%27%20height%3D%27777%27%20viewBox%3D%270%200%201386%20777%27%3E%3Crect%20width%3D%271386%27%20height%3D%27777%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_5-1-200x112.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_5-1-400x224.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_5-1-600x336.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_5-1-800x448.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_5-1-1200x673.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_5-1.png 1386w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-10\"><h3><strong>Hinzuf\u00fcgen neuer Spalten und Schemaentwicklung<\/strong><\/h3>\n<p> In diesem Abschnitt wird erl\u00e4utert, wie Sie einer bestehenden Delta Lake-Tabelle neue Spalten hinzuf\u00fcgen und ihr Schema aktualisieren. Mit der Option mergeSchema wird das Schema nahtlos weiterentwickelt, so dass neue Spalten integriert werden k\u00f6nnen, ohne die vorhandenen Daten zu beeintr\u00e4chtigen.<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-9 hover-type-none\"><img decoding=\"async\" width=\"2235\" height=\"762\" title=\"settingup_6\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_6.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/settingup_6.png\" alt class=\"lazyload img-responsive wp-image-6611\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272235%27%20height%3D%27762%27%20viewBox%3D%270%200%202235%20762%27%3E%3Crect%20width%3D%272235%27%20height%3D%27762%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_6-200x68.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_6-400x136.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_6-600x205.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_6-800x273.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_6-1200x409.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_6.png 2235w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-11\"><h3><strong>Zeitreise und Versionswiederherstellung<\/strong><\/h3>\n<p> Dieser Abschnitt demonstriert die Zeitreisefunktion von Delta Lake. Durch die Angabe von versionAsOf oder timestampAsOf k\u00f6nnen Sie fr\u00fchere Versionen der Tabelle abfragen und wiederherstellen und so sicherstellen, dass Daten aus fr\u00fcheren Zust\u00e4nden wiederhergestellt oder gepr\u00fcft werden k\u00f6nnen.<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-10 hover-type-none\"><img decoding=\"async\" width=\"2233\" height=\"1095\" title=\"settingup_7 (1)\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_7-1.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/settingup_7-1.png\" alt class=\"lazyload img-responsive wp-image-6605\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272233%27%20height%3D%271095%27%20viewBox%3D%270%200%202233%201095%27%3E%3Crect%20width%3D%272233%27%20height%3D%271095%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_7-1-200x98.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_7-1-400x196.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_7-1-600x294.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_7-1-800x392.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_7-1-1200x588.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/settingup_7-1.png 2233w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-11 hover-type-none\"><img decoding=\"async\" width=\"636\" height=\"149\" title=\"dataframe\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataframe.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/dataframe.png\" alt class=\"lazyload img-responsive wp-image-6642\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27636%27%20height%3D%27149%27%20viewBox%3D%270%200%20636%20149%27%3E%3Crect%20width%3D%27636%27%20height%3D%27149%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataframe-200x47.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataframe-400x94.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataframe-600x141.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataframe.png 636w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 636px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-12\"><h3><strong>Optimieren mit Z-Ordering<\/strong><\/h3>\n<p> In diesem Abschnitt verwenden wir Z-Ordering zur Optimierung der Delta-Tabelle. Z-Ordering ist eine Technik in Delta Lake, die die Abfrageleistung verbessert, indem zusammengeh\u00f6rige Daten im Speicher zusammengelegt werden. Der Befehl optimize().executeZOrderBy(&#8222;PickupZip&#8220;) reorganisiert die Datendateien, um die Zugriffsmuster f\u00fcr Abfragen zu optimieren, die nach PickupZip filtern. Eine visuelle Erkl\u00e4rung der Z-Ordnung und ihrer Auswirkungen auf die Abfrageeffizienz finden Sie in der nebenstehenden Abbildung.<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--body_typography-font-family);--awb-caption-title-font-weight:var(--body_typography-font-weight);--awb-caption-title-font-style:var(--body_typography-font-style);--awb-caption-title-size:var(--body_typography-font-size);--awb-caption-title-transform:var(--body_typography-text-transform);--awb-caption-title-line-height:var(--body_typography-line-height);--awb-caption-title-letter-spacing:var(--body_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-12 hover-type-none\"><a class=\"fusion-no-lightbox\" href=\"https:\/\/www.linuxfoundation.org\/blog\/ai-ml-data-analytics\/delta-2-0-foundation-data-lakehouse-open\" target=\"_self\" aria-label=\"z-order\"><img decoding=\"async\" width=\"600\" height=\"381\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/z-order.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/z-order.png\" alt class=\"lazyload img-responsive wp-image-6613\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27600%27%20height%3D%27381%27%20viewBox%3D%270%200%20600%20381%27%3E%3Crect%20width%3D%27600%27%20height%3D%27381%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/z-order-200x127.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/z-order-400x254.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/z-order.png 600w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 600px\" \/><\/a><\/span><\/div><div class=\"fusion-text fusion-text-13\"><p>Nachfolgend finden Sie dieses Codeschnipsel:<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-13 hover-type-none\"><img decoding=\"async\" width=\"2247\" height=\"692\" title=\"optimizing_1\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/optimizing_1.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/optimizing_1.png\" alt class=\"lazyload img-responsive wp-image-6615\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272247%27%20height%3D%27692%27%20viewBox%3D%270%200%202247%20692%27%3E%3Crect%20width%3D%272247%27%20height%3D%27692%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/optimizing_1-200x62.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/optimizing_1-400x123.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/optimizing_1-600x185.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/optimizing_1-800x246.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/optimizing_1-1200x370.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/optimizing_1.png 2247w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-14\"><h3><strong>Streaming-Daten und Upsert-Operationen<\/strong><\/h3>\n<p><strong> <\/strong>In diesem Abschnitt zeigen wir Ihnen, wie Sie mit Delta Lake Streaming-Daten verarbeiten und Upsert-Operationen durchf\u00fchren k\u00f6nnen. <\/p>\n<ol>\n<li><strong>Streaming-Datenquelle:<\/strong> Wir richten eine Streaming-Quelle mit spark.readStream.format(&#8222;rate&#8220;).load() ein, die einen Datenstrom simuliert. Diese Daten werden dann in die Delta-Tabelle mit einem Checkpoint-Verzeichnis geschrieben, um Fehlertoleranz und Konsistenz zu gew\u00e4hrleisten.<\/li>\n<li><strong>Streaming-Daten lesen:<\/strong> Die Streaming-Daten werden aus der Delta-Tabelle gelesen und in der Konsole angezeigt. Diese Einstellung erm\u00f6glicht Aktualisierungen und \u00dcberwachung in Echtzeit. <\/li>\n<li><strong>Upsert Operation:<\/strong> Wir verwenden die Zusammenf\u00fchrungsfunktion von Delta Lake, um eine Upsert-Operation durchzuf\u00fchren, die bestehende Datens\u00e4tze aktualisiert oder neue Datens\u00e4tze auf der Grundlage einer passenden Bedingung einf\u00fcgt. Dieser Vorgang ist wichtig, um aktuelle und genaue Daten in Echtzeitszenarien zu erhalten. <\/li>\n<li><strong>Datenl\u00f6schung und -verdichtung:<\/strong> Wir demonstrieren die Datenl\u00f6schung und Dateikompaktierung mit deltaTable.delete() und deltaTable.vacuum(), die zur Verwaltung der Datengr\u00f6\u00dfe und Leistung beitragen.<\/li>\n<\/ol>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-14 hover-type-none\"><img decoding=\"async\" width=\"1591\" height=\"395\" title=\"dataflow_1\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataflow_1.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/dataflow_1.png\" alt class=\"lazyload img-responsive wp-image-6620\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271591%27%20height%3D%27395%27%20viewBox%3D%270%200%201591%20395%27%3E%3Crect%20width%3D%271591%27%20height%3D%27395%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataflow_1-200x50.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataflow_1-400x99.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataflow_1-600x149.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataflow_1-800x199.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataflow_1-1200x298.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/dataflow_1.png 1591w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-15\"><p>Um ein vollst\u00e4ndiges Verst\u00e4ndnis zu erhalten, sehen Sie sich das mitgelieferte Diagramm an, das den Datenfluss und die Interaktion zwischen Streaming-Datenquellen und Delta Lake veranschaulicht.<\/p>\n<\/div><div class=\"fusion-image-element awb-imageframe-style awb-imageframe-style-below awb-imageframe-style-15\" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-15 hover-type-none\"><a class=\"fusion-no-lightbox\" href=\"https:\/\/learn.microsoft.com\/en-us\/answers\/questions\/533548\/delta-lake-with-databricks-and-synapse\" target=\"_self\" aria-label=\"spark_delta_1\"><img decoding=\"async\" width=\"2232\" height=\"1250\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_1.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/spark_delta_1.png\" alt class=\"lazyload img-responsive wp-image-6622\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272232%27%20height%3D%271250%27%20viewBox%3D%270%200%202232%201250%27%3E%3Crect%20width%3D%272232%27%20height%3D%271250%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_1-200x112.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_1-400x224.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_1-600x336.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_1-800x448.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_1-1200x672.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_1.png 2232w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/a><\/span><div class=\"awb-imageframe-caption-container\"><div class=\"awb-imageframe-caption\"><h2 class=\"awb-imageframe-caption-title\">spark_delta_1<\/h2><\/div><\/div><\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-16 hover-type-none\"><a class=\"fusion-no-lightbox\" href=\"https:\/\/learn.microsoft.com\/en-us\/answers\/questions\/533548\/delta-lake-with-databricks-and-synapse\" target=\"_self\" aria-label=\"spark_delta_2\"><img decoding=\"async\" width=\"2209\" height=\"965\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_2.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/spark_delta_2.png\" alt class=\"lazyload img-responsive wp-image-6632\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272209%27%20height%3D%27965%27%20viewBox%3D%270%200%202209%20965%27%3E%3Crect%20width%3D%272209%27%20height%3D%27965%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_2-200x87.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_2-400x175.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_2-600x262.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_2-800x349.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_2-1200x524.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_2.png 2209w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/a><\/span><\/div><div class=\"fusion-text fusion-text-16\"><p>Der Upsert-Vorgang war erfolgreich, wie die aktualisierte erste Zeile der Daten zeigt. Au\u00dferdem wurden die veralteten Dateien durch die Vakuumoperation effektiv bereinigt.<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-17 hover-type-none\"><img decoding=\"async\" width=\"689\" height=\"187\" title=\"spark_delta_3\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_3.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/spark_delta_3.png\" alt class=\"lazyload img-responsive wp-image-6636\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27689%27%20height%3D%27187%27%20viewBox%3D%270%200%20689%20187%27%3E%3Crect%20width%3D%27689%27%20height%3D%27187%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_3-200x54.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_3-400x109.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_3-600x163.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_3.png 689w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 689px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-17\"><p>Wir k\u00f6nnen nun den L\u00f6schvorgang \u00fcberpr\u00fcfen, indem wir die Daten aus dem Stream abrufen und sicherstellen, dass die zuvor gel\u00f6schte erste Zeile nicht mehr erscheint.<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-18 hover-type-none\"><img decoding=\"async\" width=\"692\" height=\"187\" title=\"spark_delta_4\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_4.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/spark_delta_4.png\" alt class=\"lazyload img-responsive wp-image-6634\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27692%27%20height%3D%27187%27%20viewBox%3D%270%200%20692%20187%27%3E%3Crect%20width%3D%27692%27%20height%3D%27187%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_4-200x54.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_4-400x108.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_4-600x162.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_4.png 692w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 692px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-18\"><h3><strong>Deltatabelle anzeigen &#8211; Verlauf und Aufr\u00e4umen<\/strong><\/h3>\n<p> In diesem Abschnitt wird gezeigt, wie Sie die historischen \u00c4nderungen in einer Delta-Tabelle anzeigen und eine Datenbereinigung durchf\u00fchren k\u00f6nnen.<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-19 hover-type-none\"><img decoding=\"async\" width=\"2466\" height=\"1278\" title=\"spark_delta_5\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_5.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/spark_delta_5.png\" alt class=\"lazyload img-responsive wp-image-6630\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272466%27%20height%3D%271278%27%20viewBox%3D%270%200%202466%201278%27%3E%3Crect%20width%3D%272466%27%20height%3D%271278%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_5-200x104.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_5-400x207.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_5-600x311.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_5-800x415.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_5-1200x622.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_5.png 2466w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-19\"><p>Mit diesem Code k\u00f6nnen Sie die \u00c4nderungshistorie der Delta-Tabelle einsehen, was Ihnen hilft, \u00c4nderungen zu verfolgen und die Entwicklung Ihrer Daten zu verstehen. Die Vakuum-Operation wird verwendet, um alte, nicht mehr ben\u00f6tigte Datendateien zu bereinigen, wobei nur die Dateien der letzten angegebenen Anzahl von Stunden (168 Stunden = 7 Tage) erhalten bleiben. Wir werden untersuchen, wie Delta Lake Metadaten f\u00fcr Skalierbarkeit und Auditing handhabt. Delta Lake f\u00fchrt ein detailliertes Protokoll aller \u00c4nderungen an Ihren Daten, das als JSON-Dateien in einem Verzeichnis namens _delta_log gespeichert wird. In diesen Protokollen werden alle \u00c4nderungen, Hinzuf\u00fcgungen und L\u00f6schungen protokolliert, so dass Sie einen umfassenden \u00dcberblick \u00fcber alle Transaktionen erhalten. Anhand dieser Protokolle k\u00f6nnen Sie \u00fcberpr\u00fcfen, wie effizient Delta Lake Metadaten im gro\u00dfen Ma\u00dfstab verwaltet und dabei sowohl Skalierbarkeit als auch Nachvollziehbarkeit gew\u00e4hrleistet. Ich mache einen Screenshot, der das Verzeichnis und diese Protokolldateien zeigt, um zu veranschaulichen, wie Delta Lake die \u00c4nderungsdetails f\u00fcr eine robuste Datenverwaltung erfasst und organisiert.       <\/p>\n<h1><strong>Speicher Core Unit<\/strong><\/h1>\n<p> In Delta Lake ist eine Tabelle eine Sammlung von Daten, die in einem Schema und einer Verzeichnisstruktur organisiert sind. Sie stellt die grundlegende Einheit der Speicherung dar. Hier ist es die lokale Darstellung der Delta-Tabelle:<\/p>\n<\/div><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-20 hover-type-none\"><img decoding=\"async\" width=\"2905\" height=\"1064\" title=\"spark_delta_6\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_6.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/spark_delta_6.png\" alt class=\"lazyload img-responsive wp-image-6624\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272905%27%20height%3D%271064%27%20viewBox%3D%270%200%202905%201064%27%3E%3Crect%20width%3D%272905%27%20height%3D%271064%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_6-200x73.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_6-400x147.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_6-600x220.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_6-800x293.png 800w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_6-1200x440.png 1200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_6.png 2905w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 1200px\" \/><\/span><\/div><div class=\"fusion-image-element awb-imageframe-style awb-imageframe-style-below awb-imageframe-style-21\" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--body_typography-font-family);--awb-caption-title-font-weight:var(--body_typography-font-weight);--awb-caption-title-font-style:var(--body_typography-font-style);--awb-caption-title-size:var(--body_typography-font-size);--awb-caption-title-transform:var(--body_typography-text-transform);--awb-caption-title-line-height:var(--body_typography-line-height);--awb-caption-title-letter-spacing:var(--body_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-21 hover-type-none\"><a class=\"fusion-no-lightbox\" href=\"https:\/\/delta.io\/static\/a6f258ea3e07082e5b84603c162b3538\/52576\/image2.png\" target=\"_self\" aria-label=\"spark_delta_7\"><img decoding=\"async\" width=\"708\" height=\"475\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_7.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/spark_delta_7.png\" alt class=\"lazyload img-responsive wp-image-6626\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27708%27%20height%3D%27475%27%20viewBox%3D%270%200%20708%20475%27%3E%3Crect%20width%3D%27708%27%20height%3D%27475%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_7-200x134.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_7-400x268.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_7-600x403.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_7.png 708w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 708px\" \/><\/a><\/span><div class=\"awb-imageframe-caption-container\"><div class=\"awb-imageframe-caption\"><div class=\"awb-imageframe-caption-title\">spark_delta_7<\/div><\/div><\/div><\/div><i class=\"fb-icon-element-1 fb-icon-element fontawesome-icon fa-arrow-down fas circle-yes fusion-text-flow\" style=\"--awb-circlebordersize:1px;--awb-font-size:28.16px;--awb-width:56.32px;--awb-height:56.32px;--awb-line-height:54.32px;--awb-margin-right:16px;\"><\/i><div class=\"fusion-image-element \" style=\"text-align:center;--awb-margin-bottom:3%;--awb-caption-title-font-family:var(--body_typography-font-family);--awb-caption-title-font-weight:var(--body_typography-font-weight);--awb-caption-title-font-style:var(--body_typography-font-style);--awb-caption-title-size:var(--body_typography-font-size);--awb-caption-title-transform:var(--body_typography-text-transform);--awb-caption-title-line-height:var(--body_typography-line-height);--awb-caption-title-letter-spacing:var(--body_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-22 hover-type-none\"><a class=\"fusion-no-lightbox\" href=\"https:\/\/delta.io\/static\/a6f258ea3e07082e5b84603c162b3538\/52576\/image2.png\" target=\"_self\" aria-label=\"spark_delta_8\"><img decoding=\"async\" width=\"675\" height=\"555\" src=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_8.png\" data-orig-src=\"\/wp-content\/uploads\/2024\/09\/spark_delta_8.png\" alt class=\"lazyload img-responsive wp-image-6628\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27675%27%20height%3D%27555%27%20viewBox%3D%270%200%20675%20555%27%3E%3Crect%20width%3D%27675%27%20height%3D%27555%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_8-200x164.png 200w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_8-400x329.png 400w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_8-600x493.png 600w, https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/spark_delta_8.png 675w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 1024px) 100vw, (max-width: 640px) 100vw, 675px\" \/><\/a><\/span><\/div><div class=\"fusion-text fusion-text-20\"><h1><strong>Abschlie\u00dfende Zusammenfassung<\/strong><\/h1>\n<p> Der \u00dcbergang von Delta Lake zu Open Source ist ein wichtiger Meilenstein, der das Potenzial f\u00fcr eine breitere Integration und Innovation freisetzt. Durch die Unterst\u00fctzung verschiedener Speichersysteme wie S3 und ADLS und mehrerer Programmiersprachen, darunter Java, Python, Scala und SQL, erh\u00f6ht Delta Lake seine Vielseitigkeit. Seine Kompatibilit\u00e4t mit Hive Metastore und die F\u00e4higkeit, sowohl Batch- als auch Streaming-Daten zu verwalten, festigen seine Rolle in modernen Datenarchitekturen. Der Open-Source-Charakter von Delta Lake ebnet den Weg f\u00fcr neue Konnektoren, wie z.B. die mit Presto, und f\u00f6rdert so eine tiefere Integration mit verschiedenen Technologien. Dieser Schritt verst\u00e4rkt nicht nur das Engagement der Community, sondern beschleunigt auch die Entwicklung neuer Funktionen und Verbesserungen. Obwohl Delta Lake nicht f\u00fcr OLTP entwickelt wurde und einige Einschr\u00e4nkungen bei \u00e4lteren Spark-Versionen und bestimmten Dateiformaten aufweist, bieten die Fortschritte von Delta Lake bei der Durchsetzung von Schemata, der Konsistenz und der Isolierung eine robuste L\u00f6sung f\u00fcr Datenqualit\u00e4t und -management. Das wachsende \u00d6kosystem und die expandierende Community sorgen daf\u00fcr, dass Delta Lake sich st\u00e4ndig weiterentwickelt und verbesserte Funktionen bietet, was es zu einem unsch\u00e4tzbaren Vorteil f\u00fcr k\u00fcnftige Herausforderungen im Data Engineering macht.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1216.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><\/div><\/div><\/p>\n","protected":false},"excerpt":{"rendered":"","protected":false},"author":3,"featured_media":6645,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[42],"tags":[],"class_list":["post-6646","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-coding"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.3 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake - Ultra Tendency Academy<\/title>\n<meta name=\"description\" content=\"Sehen wir uns an, welche Dienste und Tools Google Cloud Platform (GCP) f\u00fcr das Data Engineering bieten kann:\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake - Ultra Tendency Academy\" \/>\n<meta property=\"og:description\" content=\"Sehen wir uns an, welche Dienste und Tools Google Cloud Platform (GCP) f\u00fcr das Data Engineering bieten kann:\" \/>\n<meta property=\"og:url\" content=\"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/\" \/>\n<meta property=\"og:site_name\" content=\"Ultra Tendency Academy\" \/>\n<meta property=\"article:published_time\" content=\"2024-09-03T12:01:55+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2024-09-03T12:09:21+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/UAA-Blog-1.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"750\" \/>\n\t<meta property=\"og:image:height\" content=\"500\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Sally Bo Hatter\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Sally Bo Hatter\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"54\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/\"},\"author\":{\"name\":\"Sally Bo Hatter\",\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/#\\\/schema\\\/person\\\/b417acb6e3e5e24ff1b0c5941e419ea9\"},\"headline\":\"Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake\",\"datePublished\":\"2024-09-03T12:01:55+00:00\",\"dateModified\":\"2024-09-03T12:09:21+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/\"},\"wordCount\":10817,\"commentCount\":0,\"image\":{\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/ultratendency.academy\\\/wp-content\\\/uploads\\\/2024\\\/09\\\/UAA-Blog-1.jpg\",\"articleSection\":[\"Coding\"],\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/\",\"url\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/\",\"name\":\"Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake - Ultra Tendency Academy\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/ultratendency.academy\\\/wp-content\\\/uploads\\\/2024\\\/09\\\/UAA-Blog-1.jpg\",\"datePublished\":\"2024-09-03T12:01:55+00:00\",\"dateModified\":\"2024-09-03T12:09:21+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/#\\\/schema\\\/person\\\/b417acb6e3e5e24ff1b0c5941e419ea9\"},\"description\":\"Sehen wir uns an, welche Dienste und Tools Google Cloud Platform (GCP) f\u00fcr das Data Engineering bieten kann:\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/#primaryimage\",\"url\":\"https:\\\/\\\/ultratendency.academy\\\/wp-content\\\/uploads\\\/2024\\\/09\\\/UAA-Blog-1.jpg\",\"contentUrl\":\"https:\\\/\\\/ultratendency.academy\\\/wp-content\\\/uploads\\\/2024\\\/09\\\/UAA-Blog-1.jpg\",\"width\":750,\"height\":500},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/2024\\\/09\\\/03\\\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Startseite\",\"item\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/#website\",\"url\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/\",\"name\":\"Ultra Tendency Academy\",\"description\":\"News &amp; Expertentipps aus der IT-Branche\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/#\\\/schema\\\/person\\\/b417acb6e3e5e24ff1b0c5941e419ea9\",\"name\":\"Sally Bo Hatter\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/6af8a92f6ae6021d8e0786d04c66cacfb1c012d43877d0715f99e0fb5a379d7a?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/6af8a92f6ae6021d8e0786d04c66cacfb1c012d43877d0715f99e0fb5a379d7a?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/6af8a92f6ae6021d8e0786d04c66cacfb1c012d43877d0715f99e0fb5a379d7a?s=96&d=mm&r=g\",\"caption\":\"Sally Bo Hatter\"},\"url\":\"https:\\\/\\\/ultratendency.academy\\\/de\\\/author\\\/sallybohattar\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake - Ultra Tendency Academy","description":"Sehen wir uns an, welche Dienste und Tools Google Cloud Platform (GCP) f\u00fcr das Data Engineering bieten kann:","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/","og_locale":"de_DE","og_type":"article","og_title":"Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake - Ultra Tendency Academy","og_description":"Sehen wir uns an, welche Dienste und Tools Google Cloud Platform (GCP) f\u00fcr das Data Engineering bieten kann:","og_url":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/","og_site_name":"Ultra Tendency Academy","article_published_time":"2024-09-03T12:01:55+00:00","article_modified_time":"2024-09-03T12:09:21+00:00","og_image":[{"width":750,"height":500,"url":"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/UAA-Blog-1.jpg","type":"image\/jpeg"}],"author":"Sally Bo Hatter","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Sally Bo Hatter","Gesch\u00e4tzte Lesezeit":"54\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/#article","isPartOf":{"@id":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/"},"author":{"name":"Sally Bo Hatter","@id":"https:\/\/ultratendency.academy\/de\/#\/schema\/person\/b417acb6e3e5e24ff1b0c5941e419ea9"},"headline":"Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake","datePublished":"2024-09-03T12:01:55+00:00","dateModified":"2024-09-03T12:09:21+00:00","mainEntityOfPage":{"@id":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/"},"wordCount":10817,"commentCount":0,"image":{"@id":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/#primaryimage"},"thumbnailUrl":"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/UAA-Blog-1.jpg","articleSection":["Coding"],"inLanguage":"de","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/","url":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/","name":"Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake - Ultra Tendency Academy","isPartOf":{"@id":"https:\/\/ultratendency.academy\/de\/#website"},"primaryImageOfPage":{"@id":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/#primaryimage"},"image":{"@id":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/#primaryimage"},"thumbnailUrl":"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/UAA-Blog-1.jpg","datePublished":"2024-09-03T12:01:55+00:00","dateModified":"2024-09-03T12:09:21+00:00","author":{"@id":"https:\/\/ultratendency.academy\/de\/#\/schema\/person\/b417acb6e3e5e24ff1b0c5941e419ea9"},"description":"Sehen wir uns an, welche Dienste und Tools Google Cloud Platform (GCP) f\u00fcr das Data Engineering bieten kann:","breadcrumb":{"@id":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/#primaryimage","url":"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/UAA-Blog-1.jpg","contentUrl":"https:\/\/ultratendency.academy\/wp-content\/uploads\/2024\/09\/UAA-Blog-1.jpg","width":750,"height":500},{"@type":"BreadcrumbList","@id":"https:\/\/ultratendency.academy\/de\/2024\/09\/03\/entfaltung-des-vollen-potenzials-von-apache-spark-mit-open-source-delta-lake\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Startseite","item":"https:\/\/ultratendency.academy\/de\/"},{"@type":"ListItem","position":2,"name":"Entfaltung des vollen Potenzials von Apache Spark mit Open-Source Delta Lake"}]},{"@type":"WebSite","@id":"https:\/\/ultratendency.academy\/de\/#website","url":"https:\/\/ultratendency.academy\/de\/","name":"Ultra Tendency Academy","description":"News &amp; Expertentipps aus der IT-Branche","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/ultratendency.academy\/de\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/ultratendency.academy\/de\/#\/schema\/person\/b417acb6e3e5e24ff1b0c5941e419ea9","name":"Sally Bo Hatter","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/secure.gravatar.com\/avatar\/6af8a92f6ae6021d8e0786d04c66cacfb1c012d43877d0715f99e0fb5a379d7a?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/6af8a92f6ae6021d8e0786d04c66cacfb1c012d43877d0715f99e0fb5a379d7a?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/6af8a92f6ae6021d8e0786d04c66cacfb1c012d43877d0715f99e0fb5a379d7a?s=96&d=mm&r=g","caption":"Sally Bo Hatter"},"url":"https:\/\/ultratendency.academy\/de\/author\/sallybohattar\/"}]}},"_links":{"self":[{"href":"https:\/\/ultratendency.academy\/de\/wp-json\/wp\/v2\/posts\/6646","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ultratendency.academy\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ultratendency.academy\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ultratendency.academy\/de\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/ultratendency.academy\/de\/wp-json\/wp\/v2\/comments?post=6646"}],"version-history":[{"count":0,"href":"https:\/\/ultratendency.academy\/de\/wp-json\/wp\/v2\/posts\/6646\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/ultratendency.academy\/de\/wp-json\/wp\/v2\/media\/6645"}],"wp:attachment":[{"href":"https:\/\/ultratendency.academy\/de\/wp-json\/wp\/v2\/media?parent=6646"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ultratendency.academy\/de\/wp-json\/wp\/v2\/categories?post=6646"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ultratendency.academy\/de\/wp-json\/wp\/v2\/tags?post=6646"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}