Databricks Zerobus: Die Lakehouse-Alternative zu Apache Kafka?
Zusammenfassung
Databricks steht kurz davor, den Bereich Daten-Streaming mit “Zerobus” zu revolutionieren. Dabei handelt es sich um einen neuen Dienst, der gRPC, Delta Lake und die Lakehouse-Architektur kombiniert, um eine einfachere Alternative zu Apache Kafka für Echtzeit-Datenpipelines zu bieten. Ziel ist es, die operative Komplexität und den Overhead im Platform Engineering drastisch zu reduzieren.
Was ist passiert?
In der Fachwelt, insbesondere durch Berichte im “Data Engineering Central”-Newsletter und Diskussionen auf LinkedIn, sind Details zu Databricks Zerobus aufgetaucht. Zerobus nutzt gRPC-Schnittstellen, um Daten direkt in Delta Lake zu streamen, ohne dass separate, komplexe Message-Broker-Cluster wie Kafka verwaltet werden müssen. Zudem wurde bekannt, dass Databricks ab Juni 2026 alle Lakebase Provisioned-Instanzen auf Lakebase Autoscaling umstellt, was die Plattformreife unterstreicht.
Warum es wichtig ist
Streaming ist traditionell eine der komplexesten Disziplinen im Data Engineering. Kafka-Cluster erfordern signifikanten Wartungsaufwand. Zerobus verspricht eine “Lakehouse-native” Erfahrung, bei der Streaming und Speicher eng verzahnt sind. Dies signalisiert Databricks’ Absicht, direkt in den Markt für Streaming-Infrastruktur einzusteigen und die Barriere für Echtzeit-Analysen weiter zu senken.
Beweise
- Newsletter-Enthüllung: Data Engineering Central lieferte technische Details zu gRPC und Delta Lake Integration.
- Fallstudien: Hinweise auf eine Toyota-Fallstudie im Kontext von Databricks-Streaming auf LinkedIn.
- Plattform-Updates: Offizielle Ankündigungen zur Umstellung auf Lakebase Autoscaling ab Juni 2026.
Analyse
Der Trend geht weg von spezialisierten, isolierten Infrastruktur-Komponenten (Silos) hin zu integrierten Cloud-Datenplattformen. Indem Databricks Streaming direkt in das Lakehouse integriert, entfällt die Notwendigkeit für das “Glue-Coding” zwischen Broker und Storage. Dies könnte besonders für Unternehmen attraktiv sein, die bereits tief im Databricks-Ecosystem verwurzelt sind und die Kosten für dedizierte Kafka-Teams einsparen wollen.
Praktische Erkenntnisse
- Architektur-Review: Unternehmen sollten prüfen, ob ihre aktuellen Kafka-Workloads durch einfachere, Lakehouse-native Streaming-Dienste ersetzt werden können.
- Kosten-Nutzen: Evaluieren Sie den Overhead für das Management von Kafka gegenüber den (potenziell höheren) Lizenzkosten für integrierte SaaS-Lösungen.
- Monitoring: Achten Sie auf offizielle GA-Ankündigungen von Databricks zu Zerobus.
Offene Fragen
- Wie wird sich Zerobus preislich im Vergleich zu Kafka-SaaS-Lösungen (z.B. Confluent) positionieren?
- Welche Latenzvorteile bietet die direkte gRPC-zu-Delta-Lake-Integration tatsächlich gegenüber klassischen Brokern?