Data Driven Services - doubleSlash

Mit datengetriebenen Entscheidungen den Kunden optimal versorgen

Daten und Systeme konsolidieren – neue digitale Services und datengetriebene Entscheidungen ermöglichen

Im Energiemarkt steigt der Wettbewerbsdruck – für Versorgende wie badenova entstehen Möglichkeiten, sich durch neue Services und digitale Angebote vom Wettbewerb abzuheben. Dazu müssen Daten aus verschiedenen Kommunikationskanälen gesammelt, adaptiert und zielgruppenspezifisch in der benötigten Qualität bereitgestellt werden. Ziel ist es, Business-Entscheidungen datengetrieben zu unterstützen und diese für Auswertungszwecke und Marketingkampagnen z. B. für die Automation von Marketing zu nutzen.

badenova und badenIT – Energieversorgung und IT-Kompetenz für Südbaden

Die badenIT GmbH ist eine 100-prozentige Tochter der badenova AG & Co. KG und ist verantwortlich für einen Großteil der IT-Infrastruktur des Versorgers. Das Unternehmen ist einer der führenden Managed Service- und IT-Infrastrukturanbieter im Südwesten Deutschlands. badenIT bietet Infrastruktur und Plattform als Service für die badenova und viele weitere Kund:innen und betreibt eigene Rechenzentren und Glasfasernetze wie das sogenannte Metro-Ethernet Glasfasernetz in Freiburg. 

badenova ist der größte Energie- und Umweltdienstleister in Südbaden, welcher sich zum Ziel gesetzt hat, ein umfassendes Angebot als Grundversorger von Gas, Wasser, Strom, Internet und E-Mobilität zu bieten. Das Unternehmen steht in der Region Südbaden für nachhaltige und zuverlässige Energielösungen im Bereich Ökostrom und Erdgas. Es beschäftigt ca. 1.400 Mitarbeitende.

 

Eine skalierbare Datenbasis für datengetriebene Entscheidungen in der Energiewirtschaft

Um die Anforderungen zu erfüllen, hat doubleSlash gemeinsam mit badenIT ein Data Lake aufgebaut, welcher Daten aus verschiedenen Kanälen integriert. Dabei wurden sowohl unstrukturierte als auch strukturierte Daten der verschiedenen Quellen gesammelt, adaptiert und analysiert. Zur Strukturierung des Vorgehens und zur Visualisierung der Datenflüsse wurde eine von doubleSlash adaptierte Notation des Data Lake Zonen Modells eingesetzt. Anhand dieser wurden die verschiedenen Qualitätsstufen von Daten (Zonen) sowie die Übergänge (Transformationen) zwischen diesen Zonen modelliert, konzipiert und im Rahmen einer anschließenden Umsetzungsphase implementiert.

Der Data Lake soll keinesfalls bestehende Produktivsysteme (z. B. ERP) ersetzen. Er bildet eine sinnvolle Ergänzung als analytische Plattform zur Auswertung großer Datenmengen.

Das Data Lake Zonen Modell: Transient Zone - Raw Zone - Trusted Zone - Refined Zone

Was passiert in den Data Lake Zonen?

  • Transient Zone: Zu Beginn übertragen die Quellsysteme die Daten in ihrem ursprünglichen Format an die Transient Zone.
  • Raw Zone: Hier erfolgt die Speicherung der von den Datenquellen abgefragten Rohdaten. Falls notwendig, können hier bereits Maßnahmen zur Anonymisierung oder Pseudonymisierung von Daten erfolgen. Auch können unnötige Attribute der Quelldaten entfernt oder zusätzliche Metadaten ergänzt werden.
  • Trusted Zone: In dieser Zone werden valide Rohdaten in einem strukturierten Zielformat gespeichert. Dieses Zielformat kann dem Rohformat gleichen, es kann aber auch ein anderes Format (z. B. Datenbank-Tabelle etc.) verwendet werden, wenn sich aus diesem leichter die Nutzformate generieren lassen. In dieser Zone befindliche Daten sind die "Quelle der Wahrheit".
  • Refined Zone: Hier werden valide, transformierte und aggregierte Daten in verschiedenen Nutzformaten (ausgerichtet auf den Nutzer / die Nutzung) gespeichert. Die Daten dienen der weiteren Verarbeitung innerhalb des Systems oder können anderen Systemen zur Nutzung zur Verfügung gestellt werden.

Das Data Science Team der badenova kann auf der so geschaffenen Datenbasis dem Marketing- und Vertriebsteam Informationen für Auswertungen, Marketingkampagnen und neuen Produktentwicklungen bereitstellen. Auf Basis der gewonnenen Daten können in Zukunft datengestützt Entscheidungen getroffen und automatisiert werden, vor allem im Bereich:

  • der Optimierung von Prozessen,
  • der Entwicklung neuer Angebote, die sich an den Bedürfnissen der Kunden und ihres Lebenszyklus orientieren und diesen optimal abdecken und 
  • die Möglichkeiten auch für andere Tochterunternehmen der badenova nutzbar zu machen.

Starkes Doppel: Infrastruktur Kompetenz und agile Entwicklung für eine zukunftsfähige Datenplattform

Das Projekt wurde gemeinsam von doubleSlash und der badenova IT-Tochter badenIT realisiert. Die interdisziplinäre Zusammenarbeit und die Nutzung agiler Methoden haben das Projekt erfolgreich gemacht.

doubleSlash war für die Konzeption und die technische Entwicklung der Data Lake Anwendungen verantwortlich. Die badenIT hat sich auf das Hosting der Basis- und Hadoop-Infrastruktur und den Support der Applikation fokussiert. Gemeinsam konnte der gesamte Softwarelebenszyklus abgedeckt und eine passende Lösung für die badenova entwickelt werden. Eine große Herausforderung war hier insbesondere die wachsende Komplexität der Datenmengen und -quellen zu beherrschen und dennoch skalierbar für neue Produkte und Marktbedürfnisse zu bleiben.
 
Zu Beginn des Projekts wurden die Anforderungen der unterschiedlichen Fachbereiche aufgenommen sowie das technische Grundgerüst geschaffen. Für den weiteren Verlauf ist geplant, zusätzliche Quellen und Zielsysteme an den Data Lake anzubinden. So können badenova Kunden noch besser verstehen und zielgerichtet ansprechen sowie Entscheidungen und Prozesse automatisieren.

 

Digital Partnering – gemeinsam den digitalen Wandel in der Energieversorgung erfolgreich gestalten

Das Zusammenspiel und die Vernetzung beider IT-Unternehmen sind der beste Beweis für den erfolgversprechenden Ansatz des Digital Partnering – für beide Seiten. Der Auftraggeber badenova kennt die Infrastruktur sowie den Markt und die Anforderungen seiner Kunden. Er hat die erfahrene IT-Tochter badenIT für seine Anforderungen ins Rennen geschickt: einen leistungsstarken IT-Dienstleister für kompetente und zielorientierte IT- und Kommunikationslösungen in der Region, der vor allem eine starke Infrastruktur-Kompetenz z. B. im hadoop Cluster mitbringt. Der Digital Partner doubleSlash bringt das nötige IT Know-how für die Realisierung des Data Lake Projekts und die agile Kultur mit, vor allem im Kontext von Design, Architektur und Umsetzung von Data Pipelines. Greifen diese Kompetenzen professionell und kreativ ineinander, ist das eine ausgezeichnete Basis für zielgerichtetes und investitionssicheres Vorgehen. Außerdem lassen sich so die Risiken auf mehre Schultern verteilen und Komplexität von IT-Projekten erfolgreich reduzieren.

Dadurch hat die badenova als gemeinsamer Kunde beider Unternehmen von dem Know-how, der Schnelligkeit und Flexibilität profitiert, was im Hinblick auf die Entwicklung von Technologien und Märkten ein entscheidender Erfolgsfaktor ist. So können auch andere Unternehmen verschiedener Branchen davon profitieren und ihren digitalen Wandel schnell, flexibel und vorausschauend mit doubleSlash und badenIT vorantreiben. Die Basis für eine zukunftsfähige Zusammenarbeit ist gelegt: Gemeinsam digitale Projekte gestalten und umsetzen.

 

Software Defined Products

Mehr erfahren

Das sagen unsere Partner

„Mit unserem Partner doubleSlash konnten wir unsere Stärken in Hosting und Betrieb optimal mit dem dort vorhandenen Data Lake Know-how und der agilen Kultur verbinden. Mit dem erfolgreichen Projekt bei badenova sehen wir den Grundstein für eine künftige fruchtbare Zusammenarbeit in weiteren digitalen Projekten der Energieversorgung gelegt.“

„Der Data Lake fungiert als Schnittstelle zwischen dem badenova Online-Shop und dem Marketing-Tool z. B. im Vertrieb. Dank des Data Lake ist es uns nun möglich, die Kunden individueller anzusprechen. Wir können vertriebliche Entscheidungen nun stärker datengetrieben und damit am Kundenlebenszyklus orientiert ausrichten.“

„Mit badenIT verbindet uns eine lösungsorientierte und vertrauensvolle Zusammenarbeit. Wir können die Stärken unseres Partners in Infrastruktur und Support mit unserem Know-how in der Architektur und Entwicklung einer Data Pipeline prima kombinieren – für ein optimales Kundenergebnis. Darüber hinaus ist auch das gemeinsame Verständnis einer Zusammenarbeitskultur die ideale Voraussetzung für eine nachhaltige Partnerschaft.“

Dr. Alexander Schätzle //  System Architekt //  badenIT

Dirk Fleischer //  Fachlicher Projektleiter des Data Lake Projekts im Vertrieb //  badenova

Marc Mai //  Projektleiter //  doubleSlash

Technologien

  • Hadoop
  • Hive

  • Kafka

  • Zeppelin Notebooks

  • OpenStack Cloud Platform

  • Docker

  • Java

  • SpringBoot

  • Maven

Leistungen

  • Anforderungsmanagement
  • IT- und Workflow Design
  • Software Architektur
  • Design, Architektur und Umsetzung von Data Pipelines basierend auf Data Staging, Data Zones und Data Pipelines
  • Agiles Projektmanagement
  • Agile Softwareentwicklung
  • Testmanagement
  • 3rd Level Support
  • IT Infrastruktur Kompetenz

Haben Sie Fragen oder planen einen Data Lake?

Dann sprechen Sie uns gerne an!