Der Datenmarkt entwickelt sich sehr schnell weiter.
Bis vor kurzem waren Data-Engineering-Plattformen auf die Verarbeitung von Informationen und das Routing von Daten ausgerichtet. Heute sucht mehr als die Hälfte unserer Kunden nach einer globalen Plattform, die Data Science Layer mit Data Lakes und Data Pipelines integriert. Die Industrialisierung von Tools für
Datenwissenschaftler und Dateningenieure, die ihnen helfen, Modelle zu erstellen und diese in die Produktion zu übergeben, ist inzwischen ein deutlicher Markttrend.
Data Lakes sind heute ein Vermögenswert, dessen Best Practices bekannt sind und beherrscht werden. Anders verhält es sich bei der Datenwissenschaft, wo das, was als neuester Stand der Technik angesehen werden könnte, noch nicht in Stein gemeißelt ist. Auf diesen Plattformen bewegt sich unsere Arbeit zwischen F&E und Industrialisierung. Unser Ziel ist es, die besten Praktiken zu erkennen,
sie innerhalb solcher Plattformen anzuwenden und unsere Kunden bei der Einführung zu unterstützen. Dies ist eine Übergangsphase vor der weiteren Industrialisierung.
In fünf Jahren werden Plattformen für den Betrieb von Machine Learning
(ML Ops) automatisiert auf AWS bereitgestellt werden; die Verfahren werden standardisiert sein, und es wird keine Unklarheiten mehr geben, wie man damit umgeht.
In diesem E-Book geben wir Ihnen einen Überblick über die
Herausforderungen im Bereich der Datenverarbeitung im Jahr 2021:
- Best Practices für Data Lakes
- Entstehung von ML Ops
- Feedback aus unserer Kundenerfahrung – Fallstudie Olympique de Marseille
- Anwendungsfall Erkennung von Anomalien
- Fokus auf den Beruf des Datenwissenschaftlers
Whitepaper-Sprache: Deutsch