Wie der Data Lake die Fachabteilung vor dem Baden gehen bewahren kann
Über den Data Lake wird viel geschrieben und diskutiert. Aber was ist der Data Lake überhaupt und welche Vor- und Nachteile bietet er konkret für die IT und die Fachabteilungen?
Man kann sich das Konzept des Data Lake wie einen See vorstellen, in den Daten aus verschiedenen Quellen mit geringem Aufwand für die IT hineinfließen. Dadurch, dass alle Anwender auf diese Daten zugreifen können, wird die IT auch bezüglich der Identifizierung, Bereinigung und Integration von Daten erheblich entlastet.
Die Fachabteilungen, die bisher auf die von der IT bereitgestellten Daten und Berichte angewiesen waren, können sich jetzt selbst aus dem Data Lake bedienen und auf Basis der darin gefundenen Informationen erweiterte oder neue Analysen durchführen, um zusätzlichen Nutzen für das Geschäft zu generieren.
Klingt das für Sie zu schön um wahr zu sein? Ist es auch, denn wie genau sollen die Fachabteilungen relevante Daten in der benötigten Qualität aus dem Data Lake fischen? Wie kann vermieden werden, daß Aufwände nur von der IT zu den Fachabteilungen verlagert werden und dort mehrfach anfallen?
Einen Datensumpf vermeiden
Ohne ein Mindestmaß an zentraler Governance durch die IT verkommt der Data Lake schnell zu einem unübersichtlichen Datensumpf. Um dies zu vermeiden, sollten Fachabteilung und IT gemeinsam Bereinigungsanforderungen vereinbaren. Zudem wird ein zentraler Katalog benötigt, in dem die verfügbaren Datenbereiche mit Zuständigkeiten, Begriffserklärungen, Aktualität und Qualität beschrieben sind.
Die beschriebene Basis-Governance kostet weniger als der aktuelle Aufwand für die Aufnahme von Daten in ein Data Warehouse und kann meist am effektivsten von der IT erbracht werden. Ganz ohne Governance entsteht schnell ein Datensumpf, der keine Geschäftsvorteile bringt. Bei einer kompletten Verlagerung der Governance-Aufwände von der IT zu den Fachabteilungen werden zwar Aufwände verschoben, aber nicht verringert.
Selber einen Data Lake anlegen
Vor der Implementierung eines Data Lakes sollte genau geprüft werden, welche ersten Schritte in diese neue Richtung schnell Zusatznutzen für die Fachabteilung bringen – und gleichzeitig einen geringen Aufwand für die IT bedeuten. Bei dieser Diskussion kann die IBM mit einem kostenfreien halbtägigem Workshop unterstützen, bei dem die Anforderungen und Rahmenbedingungen aller Unternehmensfunktionen aufgenommen und danach ein Lösungsvorschlag erarbeitet wird.
Bei Rückfragen zum Inhalt oder Kundenanfragen zum beschriebenen Data Lake Workshop steht der Author gern unter hgroeger@de.ibm.com zur Verfügung.