
In der heutigen Geschäftswelt steht eines fest: Unternehmen, die KI und generative KI effektiv einsetzen, werden zu Gewinnern in ihrer Branche. Was einst als Randthema galt, ist inzwischen zum strategischen Imperativ geworden. Doch viele Organisationen stehen vor einem grundlegenden Problem: Ihre Daten- und KI-Systeme existieren in getrennten Welten.
Stellen Sie sich vor: Auf der einen Seite Ihre wertvollen Unternehmensdaten – auf der anderen die leistungsstarken KI-Modelle, die diese Daten in Wettbewerbsvorteile verwandeln könnten. Dazwischen? Ein Graben aus technischen Hürden, Governance-Problemen und ineffizienten Prozessen.
In diesem Artikel zeigen wir Ihnen, wie Databricks diesen Graben überbrückt und warum dieser Ansatz für zukunftsorientierte Unternehmen so wertvoll ist. Wir beleuchten:
- Die aktuellen Herausforderungen fragmentierter Daten- und KI-Landschaften
- Das revolutionäre Lakehouse-Konzept als Brückenbauer
- Wie Unity Catalog eine einheitliche Governance ermöglicht
- Die Rolle von GenAI-Agenten in der Produktion
- Praxisnahe Anwendungsfälle für SAP-Nutzer

Die Trennung von Daten- und KI-Systemen verursacht in Unternehmen erhebliche Probleme:
1. Der Kontrollverlust über Ihre Daten
Wenn Daten zu externen Modell-Anbietern verschoben werden müssen, entsteht ein gefährlicher Kontrollverlust. Fragen zur Datenhoheit, Compliance und zum Schutz sensibler Informationen bleiben oft unbeantwortet. Zudem droht ein Ökosystem-Lock-in, der die strategische Flexibilität einschränkt.
2. Die Silos in Ihrer Datenlandschaft
Die typische Unternehmenslandschaft gleicht einem Flickenteppich aus:
- Data Warehouses für strukturierte Daten
- Data Lakes für unstrukturierte Informationen
- Separate ETL-Systeme für Datentransformationen
- Isolierte BI-Systeme für Analysen
Die Folge? Multiple Datenkopien, inkonsistente Governance und undurchsichtige Datensilos, die fundierte Entscheidungen erschweren.
3. Die Komplexität von GenAI-Agenten
Die Entwicklung von GenAI-Agenten stellt selbst erfahrene Teams vor Herausforderungen:
- Fehlende Standards für robuste Evaluierungen
- Unklarheit bei der Auswahl geeigneter Techniken
- Schwierige Balance zwischen Kosten und Qualität
4. Die Last veralteter Datenbanktechnologien
Traditionelle Datenbanken bringen ihre eigenen Probleme mit:
- Hoher Vendor Lock-in
- Kostspielige Lizenzmodelle
- Fokus auf On-Premise statt Cloud-native Lösungen
- Unflexible Skalierung
5. Die Kluft zwischen Daten-Ingenieuren und Business-Analysten
Während Daten-Ingenieure mit professionellen Tools arbeiten, nutzen Business-Analysten oft Excel oder ähnliche Anwendungen. Das Resultat: Diskrepanzen in den Daten, Produktionsprobleme und eine unklare Governance.
Databricks hat eine umfassende Lösung entwickelt, die auf einem grundlegend neuen Ansatz basiert: Die Modelle kommen zu den Daten, nicht umgekehrt. Diese Philosophie manifestiert sich in einer durchdachten Plattform mit mehreren Schlüsselkomponenten:
Das Lakehouse-Konzept: Das Beste aus beiden Welten
Das Databricks Lakehouse vereint die Stärken von Data Lakes und Data Warehouses:
- Flexibilität und Skalierbarkeit eines Data Lake
- Struktur und Performance eines Data Warehouse
- Offene Formate wie Delta und Iceberg als Grundlage
- Zugang für jede Daten-Engine, ohne proprietäre Einschränkungen
Diese Architektur ermöglicht es, sowohl strukturierte als auch unstrukturierte Daten effizient zu verwalten und für KI-Anwendungen nutzbar zu machen.
Unity Catalog: Governance über alle Daten-Assets
Der Unity Catalog geht weit über herkömmliche Datenkataloge hinaus:
- Einheitliche Governance-Schicht über allen Datenformaten
- Verwaltung sämtlicher Daten-Assets: Tabellen, unstrukturierte Dateien, Modelle, Tools, Notebooks und Dashboards
- Umfassende Sicherheitskontrollen und Zugriffsmanagement
- Detailliertes Auditing und Lineage Tracking
- Kostenkontrollen für effizientes Datenmanagement
- Federation-Funktionen zur Einbindung externer Datenquellen
Mit Unity Catalog erhalten Unternehmen endlich einen "Single Point of Truth" für ihre gesamte Datenlandschaft.

Databricks demokratisiert den Zugang zu Daten durch intuitive, KI-gestützte Interfaces:
- Genie Spaces (Text-to-SQL): Ermöglicht Datenabfragen in natürlicher Sprache – bereits von über 81% der Databricks-Nutzer verwendet
- Databricks Assistant: Ein kontinuierlich lernender Assistent, der kritische Arbeitsabläufe unterstützt und beispielsweise Code-Korrekturen vorschlägt
Diese Tools senken die Einstiegshürde für Datenanalysen drastisch und ermöglichen es auch Nicht-Experten, wertvolle Insights zu gewinnen.
Das neue Produkt Agent Bricks (aktuell in Beta) revolutioniert die Entwicklung und den Einsatz von GenAI-Agenten:
- Governance-zentrierte Plattform für zuverlässige Agenten
- Robuste Evaluierungsmechanismen mit LLM-Judges
- Intelligente Auswahl geeigneter Techniken (Fine-Tuning, Vector DBs etc.)
- Optimierung von Kosten und Qualität
Besonders bemerkenswert ist der Multi-Agent Supervisor, der verschiedene Agenten koordinieren kann. So lässt sich beispielsweise die Stärke von Genie (für strukturierte Daten) mit einem Knowledge Assistant (für unstrukturierte Daten) kombinieren, um komplexe Fragen über alle Datenquellen hinweg zu beantworten.
Lakebase wendet eine traditionelle Datenbank-Engine auf einen Data Lake an und bietet:
- Kostengünstigen, offenen Speicher als Basis
- Pay-per-use Preismodell für maximale Flexibilität
- Direkten Konsum durch KI-Modelle
- Frische und synchronisierte Echtzeit-Daten
- Konsistente Governance und Zugriffskontrollen
- Trennung von Compute und Storage für optimale Skalierung
- Ultra-niedrige Latenzen für anspruchsvolle Anwendungen
Aufgebaut auf einer PostgreSQL-Basis mit Unterstützung gängiger Erweiterungen, können Lakebase-Datenbanken in weniger als einer Sekunde gestartet werden – ein Quantensprung gegenüber traditionellen Systemen.
Für Unternehmen mit SAP-Landschaften bietet der Databricks-Ansatz besondere Vorteile. Die Integration von SAP-Daten in das Lakehouse ermöglicht:
- Einheitliche Sicht auf SAP- und Non-SAP-Daten
- Echtzeit-Analysen über Systemgrenzen hinweg
- KI-gestützte Prognosen basierend auf operativen SAP-Daten
- Automatisierte Workflows zwischen SAP und anderen Systemen
Ein besonders wertvoller Anwendungsfall ist das integrierte Supply Chain Management. Hier können Unternehmen:
- SAP ERP-Daten mit externen Marktdaten kombinieren
- Lieferengpässe durch KI-gestützte Prognosen frühzeitig erkennen
- Automatisch alternative Lieferanten identifizieren
- Kosten- und Zeitersparnisse durch optimierte Prozesse realisieren
Im Bereich Finance ermöglicht die Databricks-Plattform:
- Konsolidierung von Finanzdaten aus SAP und anderen Quellen
- KI-gestützte Anomalieerkennung für Fraud Detection
- Automatisierte Erstellung von Finanzberichten
- What-if-Analysen für strategische Planung
Um die Daten-Intelligenz-Plattform abzurunden, bietet Databricks zwei weitere Schlüsselkomponenten:
LakeFlow: Nahtlose Datenintegration und -verwaltung
LakeFlow unterstützt Unternehmen dabei, ihre Daten effizient zu integrieren und zu verwalten:
- LakeFlow Connect: Aufnahme strukturierter und unstrukturierter Daten aus verschiedenen Systemen
- LakeFlow Declarative Pipelines: Vereinfachte Transformation, Bereinigung und Qualitätssicherung
- LakeFlow Jobs: Orchestrierung von Arbeitslasten für stets aktuelle Daten
- LakeFlow Designer: Schließt die Lücke zwischen Daten-Ingenieuren und Business-Analysten durch natürliche Sprache und kollaborative Entwicklung
AIBI (AI-powered Business Intelligence) erweitert Datenintelligenz auf sämtliche BI-Teams:
- Skalierbare, verwaltete Text-to-Visualization-Funktionen
- Abgeleitete Graphen für komplexe Zusammenhänge
- Genie Databases für Datenabfragen in natürlicher Sprache

Die Vision von Databricks, Daten und KI für jedermann zu demokratisieren, manifestiert sich in einer durchdachten Plattform, die technische Silos überwindet und echten Business-Mehrwert schafft. In einer Zeit, in der jedes Unternehmen, das KI und generative KI einsetzt, zum Gewinner in seiner Branche werden kann, bietet dieser integrierte Ansatz entscheidende Vorteile.
Die Transformation zur Daten-Intelligenz-Plattform ermöglicht es Organisationen:
- Fundierte Entscheidungen auf Basis aller verfügbaren Daten zu treffen
- KI nahtlos in bestehende Prozesse zu integrieren
- Governance und Compliance über die gesamte Datenlandschaft sicherzustellen
- Die Zusammenarbeit zwischen technischen und Business-Teams zu verbessern
- Agil auf Marktveränderungen zu reagieren
Für Unternehmen, die ihre Daten als strategischen Asset betrachten und den Sprung in die KI-Ära erfolgreich meistern wollen, bietet Databricks einen überzeugenden Weg, um die Lücke zwischen Daten und KI endlich zu schließen.
Was unterscheidet das Lakehouse-Konzept von traditionellen Data Lakes und Data Warehouses?
Das Lakehouse-Konzept vereint die Flexibilität und Skalierbarkeit eines Data Lake mit der Struktur und Performance eines Data Warehouse. Es basiert auf offenen Formaten wie Delta und Iceberg, die für jede Daten-Engine zugänglich sind, und ermöglicht sowohl Analytics als auch KI-Anwendungen auf derselben Plattform.
Wie unterstützt Unity Catalog die Governance in komplexen Datenlandschaften?
Unity Catalog bietet eine einheitliche Governance-Schicht über allen Datenformaten und verwaltet sämtliche Daten-Assets wie Tabellen, unstrukturierte Dateien, Modelle und Dashboards. Es umfasst Sicherheitskontrollen, Zugriffsmanagement, Auditing, Lineage Tracking und Kostenkontrollen für ein effizientes Datenmanagement.
Welche Vorteile bietet die Integration von SAP-Daten in Databricks?
Die Integration ermöglicht eine einheitliche Sicht auf SAP- und Non-SAP-Daten, Echtzeit-Analysen über Systemgrenzen hinweg, KI-gestützte Prognosen basierend auf operativen SAP-Daten und automatisierte Workflows zwischen verschiedenen Systemen. Dies ist besonders wertvoll für Bereiche wie Supply Chain Management und Financial Reporting.
Wie können GenAI-Agenten in der Praxis eingesetzt werden?
GenAI-Agenten können für verschiedene Anwendungsfälle eingesetzt werden, von der automatisierten Datenanalyse über die Beantwortung komplexer Geschäftsfragen bis hin zur Prozessautomatisierung. Mit Agent Bricks bietet Databricks eine Plattform, die die Entwicklung und den Einsatz solcher Agenten vereinfacht und dabei Governance und Evaluierung in den Mittelpunkt stellt.
Ist der Umstieg auf Databricks mit hohen Migrationskosten verbunden?
Databricks setzt auf offene Standards und Formate, was die Migration erleichtert und einen Vendor Lock-in vermeidet. Die Plattform bietet zudem flexible Preismodelle mit Pay-per-use-Optionen, die die Kosten an die tatsächliche Nutzung anpassen. Für eine genaue Kostenschätzung empfiehlt sich jedoch eine individuelle Beratung basierend auf der spezifischen Unternehmenslandschaft.
Möchten Sie mehr darüber erfahren, wie Sie Ihre SAP-Daten mit Databricks optimal nutzen können? Bei beyond chaotic Analytics unterstützen wir Sie dabei, Ihre Datenlandschaft zu modernisieren und den maximalen Wert aus der Kombination von SAP und Databricks zu ziehen.
[Kontaktieren Sie uns für ein unverbindliches Beratungsgespräch](https://www.beyondchaotic.com/kontakt)
Mit meinem Unternehmen 'beyond chaotic Analytics' unterstütze ich Führungskräfte, Controller und Projektverantwortliche dabei, leistungsstarke Business-Analytics-Plattformen zu entwickeln. Denn gute Entscheidungen basieren auf Fakten, fundierten Methoden, reicher Erfahrung und klaren Werten. Damit Unternehmen mit SAP-Daten stets faktenbasierte und verlässliche Entscheidungen treffen können, stehe ich meinen Kunden als beratender Partner zur Seite.
Adrian Bourcevet
Schwanenstrasse 26a
8840 Einsiedeln
Schweiz
E-Mail: [email protected]
Telefon: +41 78 327 55 97
Internet: https://bourcevet.com
Datenschutzerklärung
Copyright 2024 | ALL RIGHTS RESERVED