Microsoft Fabric und Azure Databricks erhalten bidirektionale OneLake-Interoperabilität
Microsoft Fabric und Azure Databricks erhalten bidirektionale OneLake-Interoperabilität
Zusammenfassung
Microsoft und Databricks haben eine weitreichende strategische Partnerships zur bidirektionalen Interoperabilität zwischen Microsoft Fabric und Azure Databricks über OneLake angekündigt. Daten im Delta Lake- und Parquet-Format können ohne Datenbewegung, Replikation oder komplexe ETL-Pipelines von beiden Plattformen genutzt werden. OneLake fungiert dabei als die einheitliche Datenbasis (SaaS-Datensee), was die Datenarchitektur vereinfacht und Datensilos in Unternehmen abbaut.
Was ist passiert?
Microsoft und Databricks schließen eine der größten Lücken in modernen Datenplattformen:
- Katalog-Föderation für OneLake: Azure Databricks kann über die Unity Catalog-Föderation direkt auf in Microsoft Fabric OneLake gespeicherte Tabellen zugreifen. Für die Compute-Engines von Databricks (SQL-Warehouses und Notebooks) erscheinen Fabric-Tabellen wie lokale Tabellen.
- Databricks Unity Catalog Mirroring: Umgekehrt können Tabellen aus dem Azure Databricks Unity Catalog nativ in Microsoft Fabric gespiegelt werden. Damit sind hochperformante Databricks-Tabellen sofort in allen Fabric-Workloads (wie Power BI, Data Factory oder Synapse Data Engineering) ohne Datenkopie abfragbar.
- Direkte Datenspeicherung in OneLake: Azure Databricks kann Unity Catalog-verwaltete Tabellen nun auch direkt in OneLake als primärem Speicherort ablegen.
- Pfadbasierter Zugriff: Entwickler können zudem über den OneLake ABFS-Treiber (Azure Blob Filesystem) mit standardmäßigen OAuth/Service-Principal-Methoden oder über die MSAL-Bibliothek direkt auf OneLake-Pfade zugreifen.
Warum es wichtig ist
Bisher mussten Unternehmen, die sowohl Azure Databricks (für datenintensive Data Science und Data Engineering) als auch Microsoft Fabric (für Power BI-Reporting und integrierte SaaS-Anwendungen) nutzten, Daten aufwendig duplizieren. Dies führte zu:
- Hohem administrativem Aufwand für Governance und Datensynchronisation.
- Unnötigen Speicherkosten und Egress-Gebühren.
- Inkonsistenten Berichten aufgrund veralteter Datenkopien. Die native OneLake-Interoperabilität etabliert OneLake als den gemeinsamen physischen Datenspeicher („Single Source of Truth“), während Unternehmen gleichzeitig die Vorteile beider Plattformen flexibel nutzen können.
Beweise
- Microsoft Fabric Community Updates Blog: Veröffentlichung der Ankündigung zur Freischaltung von OneLake für Azure Databricks-Kunden.
- Azure Databricks Release Notes (Juni 2026): Technische Dokumentation zur Integration und Unterstützung der OneLake-Katalogföderation.
- YouTube Tutorials & Demos: Veröffentlichung von „Better Together“-Präsentationen durch Produktteams, die Live-Demos der nahtlosen Abfragen zeigen.
Analyse
Dieser Schritt markiert eine Verschiebung hin zu offenen Speicherstandards wie Delta Lake. Während Microsoft mit Fabric eine All-in-One-Lösung anbietet, behauptet Databricks mit Unity Catalog seine Rolle in der Multi-Cloud-Governance. Die Integration zeigt, dass beide Anbieter erkennen, dass Unternehmenskunden eine Koexistenz beider Welten fordern. Die Interoperabilität schützt die Investitionen der Kunden in bestehende Databricks-Pipelines und ebnet gleichzeitig den Weg für eine einfache Power BI-Adoption über Fabric.
Praktische Erkenntnisse
- Kein ETL mehr für Power BI: Nutzen Sie Unity Catalog Mirroring, um bestehende Databricks-Modelle ohne ETL-Prozesse direkt für Power BI im Direct Lake-Modus bereitzustellen.
- OneLake als Speicherziel definieren: Prüfen Sie bei neuen Azure Databricks-Projekten, ob Tabellen direkt im OneLake-Pfad (
abfss://<workspace>@onelake.dfs.fabric.microsoft.com/...) angelegt werden können. - Governance konsolidieren: Definieren Sie klare Zugriffsberechtigungen über Unity Catalog oder die Fabric-Rechteverwaltung, da die Föderation Sicherheitsrichtlinien mitsynchronisiert.
Offene Fragen
- Kostenstruktur: Welche genauen internen Egress- oder Transaktionsgebühren fallen bei intensiven Abfragen über die Plattformgrenzen hinweg an?
- Performance-Overhead: Wie verhält sich die Latenz bei föderierten Abfragen über Unity Catalog im Vergleich zu nativem Speicherzugriff in großen Clustern?
- Globaler Rollout: Wann ist die Integration in allen Azure-Regionen vollumfänglich verfügbar?
Quellen
- Microsoft Fabric Community Blog: Unlocking Microsoft OneLake for Azure Databricks
- YouTube: Microsoft Fabric + Databricks Better Together
- Niracore: Microsoft Fabric vs. Databricks for Enterprises
- Microsoft Learn: Azure Databricks Product Release Notes (June 2026)
- Databricks Community: Why Alternatives Fall Short for Databricks