Azure Databricks Juni 2026 Upgrades: Lakeflow Ingestion und externer Datenzugriff
Azure Databricks Juni 2026 Upgrades: Lakeflow Ingestion und externer Datenzugriff
🔄 Update — 12. Juni 2026: Einführung von Lakebase Autoscaling und Upgrade-Phase
Azure Databricks führt Lakebase Autoscaling ein und startet ab Juni 2026 mit der automatischen Migration bestehender Provisioned-Instanzen auf die neue Plattform. Das Update bringt verbesserte Kostenkontrolle durch Scale-to-Zero sowie neue Entwickler-Features wie instantane Datenbank-Branching und Restore.
Was ist neu?
- Lakebase Autoscaling als Standard: Alle neu erstellten Instanzen nutzen standardmäßig die Autoscaling-Plattform mit Scale-to-Zero, automatischem Compute-Scaling und Instant Branching/Restore.
- Automatische Migration ab Juni 2026: Bestehende Legacy-Provisioned-Instanzen werden automatisch auf das flexiblere Autoscaling-Modell (2 GB RAM pro Compute Unit statt bisher 16 GB) migriert.
- Ressourcengrenzen und Caching-Priorisierung: Die Plattform führt ein Limit von 500 Rollen/Datenbanken pro Branch ein und optimiert die Latenz durch Caching-Fokus auf den Root-Branch.
Warum es den Artikel ergänzt
Diese Entwicklungen zeigen, wie Databricks seine integrierte OLTP-Datenbank Lakebase von einer statisch provisionierten Infrastruktur zu einem hochflexiblen, Cloud-nativen Dienst weiterentwickelt. Dies ergänzt das im Juni-Update gestärkte Unity-Catalog-Ökosystem um eine optimierte, kosteneffiziente transactional Data-Layer.
Zusammenfassung
Das Plattform-Update von Azure Databricks im Juni 2026 führt bedeutende Neuerungen für Datenintegration und -freigabe ein. Zu den wichtigsten Upgrades gehören die strukturierte Datei-Ingestion für den Lakeflow Connect SharePoint-Connector sowie der externe Datenzugriff auf Streaming-Tabellen und Materialisierte Sichten (Materialized Views) über die Unity Catalog- und Iceberg-APIs, ohne dass Daten dupliziert werden müssen. Zudem wurden Kostenkontrollen für Databricks Genie und Produktivitäts-Updates für Genie Code eingeführt.
Was ist passiert?
Im Rahmen des Release-Pakets vom Juni 2026 hat Azure Databricks mehrere zentrale Features bereitgestellt:
- SharePoint-Integration in Lakeflow Connect (Beta): Der verwaltete SharePoint-Connector unterstützt nun die strukturierte Datei-Ingestion (unterstützte Formate: CSV, JSON, XML, Excel, Parquet, Avro, ORC). Zudem stehen Metadaten-Ingestion, Dateifilter, Schema-Evolutionsmodi und Schema-Hints zur Verfügung.
- Externer Datenzugriff (Public Preview): Externe Delta- und Iceberg-Clients können Streaming-Tabellen und Materialisierte Sichten, die von einer Pipeline verwaltet werden, direkt über die REST-APIs von Unity Catalog und Iceberg abfragen, ohne die zugrunde liegenden Daten kopieren oder replizieren zu müssen.
- Genie-Budgetverwaltung: Ab dem 6. Juli 2026 wird Databricks Genie auf ein Pay-as-you-go-Modell umgestellt. Zur Vorbereitung können Administratoren ab sofort Budgets erstellen, um die Ausgaben für Genie zu überwachen und Grenzwerte pro Benutzer festlegen.
- Genie Code Auto-Approve (Beta): Ein neues Auto-Approve-Feature erlaubt die automatische Freigabe von Tool-Aktionen wie Codeausführung, bewertet durch einen KI-Klassifikator.
- Vollbild-Erfahrung für Genie Code (Beta): Ein neues Control-Center vereinfacht die Arbeit mit parallelen Threads, Notizbüchern und MCP-Servern.
- AI Search: Vector Search wurde in AI Search umbenannt und unterstützt nun die Erstellung von Volltextsuchindizes ohne die Notwendigkeit von Vektoren oder Embeddings.
Warum es wichtig ist
Bisher mussten Unternehmen, die strukturierte Daten aus SharePoint-Umgebungen in ihr Lakehouse laden wollten, oft komplexe, fehleranfällige und wartungsintensive Custom-Wrapper bauen. Die native SharePoint-Ingestion schließt diese Lücke. Noch bedeutender ist die Öffnung von Pipeline-Ergebnissen (Streaming-Tabellen und Materialisierte Sichten) für externe Iceberg- und Delta-Clients. Durch die Beseitigung der Notwendigkeit von Datenkopien können Organisationen heterogene BI- und Analytics-Systeme direkt an ihre Databricks-Pipelines anbinden. Dies senkt Speicher- sowie Transferkosten und stellt die Konsistenz der Daten sicher.
Beweise
Die Neuerungen wurden in den offiziellen Microsoft Learn Release Notes für Juni 2026 und den begleitenden Dokumentationen verifiziert. Praktiker und Community-Experten diskutieren die Updates bereits auf LinkedIn und YouTube als wichtigen Meilenstein zur Vereinfachung von Datensilos und proprietären ETL-Pipelines.
Analyse
Mit diesen Upgrades stärkt Databricks die Rolle von Unity Catalog als offene und zentrale Data-Governance-Schicht. Durch die Unterstützung der offenen REST-APIs von Iceberg und Delta positioniert sich Databricks als flexibler Lakehouse-Anbieter, der Interoperabilität fördert, anstatt Kunden in einem geschlossenen Ökosystem einzuschließen. Die Umstellung von Genie auf ein DBU-basiertes Abrechnungsmodell zeigt zudem, dass die generative KI-Schnittstelle von Databricks aus der reinen Testphase in den produktiven, kommerziellen Betrieb übergeht. Die Einführung granulare Budgetkontrollen ist hierbei ein notwendiger Schritt, um unkontrollierte Kosten (Shadow AI / Cloud Spend) in Unternehmen zu verhindern.
Praktische Erkenntnisse
- Migrationspfad für SharePoint-Ingestion planen: Unternehmen sollten bestehende Custom-Wrapper zur SharePoint-Extraktion evaluieren und auf die native Lakeflow Connect-Lösung migrieren.
- APIs für Drittsysteme testen: Prüfen Sie, ob externe Applikationen und Abfrage-Engines via Unity Catalog / Iceberg REST-APIs direkt an Ihre Streaming-Tabellen angebunden werden können.
- Kostenkontrolle für Genie einrichten: Administratoren sollten vor dem 6. Juli 2026 Budgets für Genie definieren, um unerwartete DBU-Abrechnungen zu vermeiden.
- Genie Code Auto-Approve mit Bedacht nutzen: Aktivieren Sie Auto-Approve nicht für sensible Produktionsumgebungen, da es sich um eine Produktivitätsfunktion und keine Sicherheitsgrenze handelt.
Offene Fragen
- Wie hoch ist der Performance-Overhead bei Abfragen über die externen Iceberg-REST-APIs unter hoher Last?
- Welche konkreten Auswirkungen wird das neue Pay-as-you-go-Modell von Genie auf das Budget von mittelständischen Unternehmen ab Juli 2026 haben?