Volkswagen Financial Services
Die Volkswagen Financial Services ist ein Geschäftsbereich der Volkswagen AG und betreiben und koordinieren die Finanzdienstleistungsaktivitäten des Konzerns. Dazu gehören unter anderem das Direct Banking, Fahrzeugfinanzierungen, Leasing, Versicherungen und weitere Mobilitätsservices. Die VWFS weist eine Bilanzsumme von mehr als 225 Milliarden Euro auf und ist international in 48 Märkten mit eigenen Tochtergesellschaften, Beteiligungen und Joint Ventures vertreten.
Ausgangssituation
Für effiziente und zielgerichtete Marketingkampagnen ist eine solide und gleichzeitig agile Datenversorgung des CRM-Systems unerlässlich. Einen Teil der benötigten Daten liefert bei VWFS bereits qualitätsgeprüft das bestehende Data Warehouse an Salesforce. Auf Grund der starken Regulierung in der Finanzbranche ermöglichte dies allerdings nur ein vergleichsweise langsames Reporting. Um darüber hinaus einen schnellen und einfachen Weg zu haben, weitere Daten bereitzustellen – beispielsweise für kurzfristige Anforderungen – sollte parallel eine »Schnellspur« in Richtung Salesforce und Data Analytics geschaffen werden. Dieser »Fast Track« Data Lake sollte nicht nur offen für die Anbindung sowohl bestehender als auch neuer Technologien und Systeme sein, sondern ebenso die Verarbeitung verschiedener Datenqualitätsstufen, von Rohdaten bis hin zu vollständig aufbereiteten ‚Gold‘ Daten, ermöglichen.
Zielsetzung
Das grundsätzliche Ziel war es dabei, verschiedene internationale Datenquellen unter einem Dach zu spiegeln und mit einer einheitlichen Schnittstelle nach oben bereitzustellen. Um dabei den Anforderungen einer „Schnellspur“ gerecht zu werden, war die performante und automatisierte Verarbeitung täglicher Datenlieferungen eines der zentralen Ziele des Fast Tracks. Besonders der kostenoptimierte Umgang mit großen Datenmengen war hier zur berücksichtigen. Auf der anderen Seite durften jedoch auch regulatorische Rahmenbedingungen, insbesondere in Bezug auf personenbezogene Daten, nicht außer Acht gelassen werden. Nach dem Laden der Daten aus den Quellsystemen sollte zudem im Zuge der anschließenden Transformation ein einheitliches Datenmodell sowie das zentrale Data Dictionary der VWFS Anwendung finden.
Lösung
Da AWS gleichzeitig die Public Cloud Plattform der Wahl für alle deutschen und internationalen Gesellschaften der VWFS darstellt, lag es nahe, die entsprechenden Services dieses Hyperscalers auch in Bezug auf den geplanten Data Lake zu nutzen. Eine Vergleichsanalyse verschiedener Produkte bestätigte dies, und so baute das Team aus VWFS- und fme-Mitarbeitern in agilen Sprints sukzessive alle notwendigen Komponenten eines skalierbaren AWS Data Lakes auf. Nach detaillierter Betrachtung wurde dabei jedoch nicht auf den AWS Data Lake Service „Lake Formation“ gesetzt, sondern andere AWS Services zu einer hoch automatisierten und betriebsoptimierten Lösungen kombiniert, welche verschiedene Legacysysteme und Middleware integriert. So hat die fme AG unter anderem auf Basis von AWS Step Functions und Lambda die Workflows zur Datenverarbeitung, -anreicherung und -backup nach dem Hochladen neuer Quelldaten vollständig automatisiert. Um darüber hinaus die DSGVO-Anforderungen abzudecken, ist der Fast Track an die zentrale Sperr- und Löschkomponente der VWFS angeschlossen.
Ebenso hat die fme bei der Effizienzsteigerung des Deployments und Infrastrukturaufbaus geholfen. Neben der Nutzung bewährter CI/CD Tools wie Concourse CI haben die erfahrenen fme-Berater dabei auch verschiedene Python-Tools entwickelt, um beispielsweise das vollständig automatisierte und konfigurierbare Aufsetzen der Staging-Umgebungen und deren Pipelines zu realisieren. Dies ermöglicht es dem Team nicht nur, sich auf die Weiterentwicklung des Data Lakes zu konzentrieren, sondern vermindert auch die Fehleranfälligkeit und daraus resultierende Nacharbeiten.
Ausblick
Die bisherigen Erfahrungen sind für die VWFS auf ihrem weiteren Weg zum datengetriebenen Unternehmen sehr wertvoll. Neben dem Onboarding weiterer Auslandsgesellschaften sowie dem Ausbau des Fast Tracks und dessen Ergänzung um weitere Quellsysteme, sollen zukünftig auch wesentlich mehr Datenanalysen durch Machine Learning Services unterstützt werden.
Technologie
- AWS-verwaltete Datenbanken (RDS, Aurora Serverless, DynamoDB) und Datenverwaltungsdienste (Database Migration Service, Glue)
- Relationale Datenbanken: PostgreSQL, MySQL
- AWS-verwaltete Containerisierungslösungen: ECS, FARGATE, AWS Batch
- Automatisierung und CI Pipelines: AWS Step Functions und Concourse CI
- AWS Basis-Services: IAM, S3, Lambda, KMS
- Serverless Funktionen/ Automatisierungsskripte: Python 3
- Externe ETL-Tools: u.a. von Informatica und MuleSoft
