Für ein Geschäftssegment, dem Markets and Markets erst kürzlich einen Wert von 322,9 Milliarden Dollar bis 2026 vorausgesagt hat, sollte man meinen, dass diese Daten vielversprechend sind 1 . Leider werden nur etwa 28 % der unstrukturierten Daten, die 80 % des weltweiten Datenbestands ausmachen, analysiert - die 72 % sind es, die dem Data Science-Markt in den nächsten vier Jahren ein Wachstum von 22,7 % CAGR bescheren.
Tatsache ist, dass wir fast jeden Tag eine Menge Daten erzeugen. Terabytes, Petabytes, Exabytes und Zettabytes sind alles Wörter, die die sofortige Aufmerksamkeit von Datenwissenschaftlern und CXOs gleichermaßen erregen und dies auch weiterhin tun werden, denn die ganze Welt stellt sich auf Datenzentrierung um. Von Ladenregalen bis hin zu autonomen Fahrzeugen, jede einzelne Branche und jedes einzelne Unternehmen befindet sich jetzt in der einen oder anderen Phase der Nutzung der Macht von Daten. Und diejenigen, die das nicht tun, verlieren an Boden.
Eine weitere wichtige Statistik ist der Anstieg des Marktes für Data Lakes, der bis zum Jahr 2026 von derzeit 3,74 Milliarden Dollar auf etwa 17,6 Milliarden Dollar anwachsen soll. 2 . Es ist nicht unerwartet, dass das Wachstum von Data Lakes nur geringfügig höher ist als das prognostizierte Wachstum des Data Science-Marktes. Diese Ähnlichkeit rührt von der Tatsache her, dass für Data Science Daten benötigt werden. Abgesehen von den typischen Anwendungsfällen für Business Intelligence und Analytik verwenden die meisten Modelle für Statistik, maschinelles Lernen und künstliche Intelligenz weitgehend unstrukturierte Daten, was einen Data Lake erfordert.
Was bedeuten Data Lakes für Unternehmen?
Ein Hardware-Hersteller, der Server und Speicher für Data Lakes und Data Science-Anwendungen anbietet, hat eine globale Kampagne mit dem Titel "The Data Centered" entwickelt, um die Leistungen von Menschen und Unternehmen zu feiern, die datengestützte Entscheidungsfindung nutzen. 3 . Diese Kampagne ist nur ein Beispiel dafür, warum Unternehmen zunehmend Datenlösungen einsetzen, um ihre Geschäftsziele und Visionen voranzutreiben.
Daten machen Ergebnisse vorhersehbar. So einfach ist das. Von der Produktbündelung bis hin zur Automatisierung der Prüfung, wie fest die Schrauben, die die Serverpanels halten, eingeschraubt sind, können Daten das Richtige identifizieren. Da Daten die Grundlage für Analysen und KI bilden, ist es für Unternehmen unerlässlich, in die Speicherung, Verwaltung und Nutzung von Daten zu investieren.
Da sich innovative Geschäftsmodelle rund um Daten entwickeln, ist das durchschnittliche Unternehmen gezwungen, die Abläufe mit einer KI-Brille neu zu betrachten. Einige der transformativen Business Cases für Data Lakes und Data Science sind:
- Einblicke in das Verhalten von Kundenaktivitäten und das Kaufverhalten sowie das Potenzial für dynamische Produktbündelungen auf der Grundlage des Käuferverhaltens
- Social Listening kann Unternehmen dabei helfen, ihre Marketing- und Produkt-/Servicestrategie auf der Grundlage von Erkenntnissen aus Social Media Chatter anzupassen.
- Geografische und demografische Analysen ermöglichen differenzierte Strategien für verschiedene Marktsegmente auf der Grundlage einer statistischen Modellierung von Käufern in Segmenten, die auf geografischen, demografischen und anderen Variablen basieren.
Obwohl die Argumente für Data Lakes und Data Science überzeugend sind, gibt es einige Punkte zu beachten. Für den Erfolg von Data Science sind die Vision, die Strategie und der Data Lake wichtige Erfolgsfaktoren und der Schlüssel zum Erfolg Ihrer Data Science-Initiativen.
Erste Schritte - Einrichten des Data Lake
Der Einstieg in Ihren Data Lake ist einfach, wenn Sie wissen, was Sie tun wollen, wie Sie es tun wollen und was Sie dafür brauchen.
- Was Sie tun möchten: Ihr zentraler Geschäftsgrund für die Zusammenführung und Nutzung von Daten. Um zu wissen, was Sie mit Daten machen wollen, schauen wir uns zunächst an, welche Art von Daten Sie haben und welche Art von Daten Sie erwerben werden. Sobald diese Informationen vorliegen, machen wir uns einfach an die Arbeit und erstellen eine Wunschliste datengesteuerter Szenarien. Sobald Sie diese Liste haben, können Sie die Prioritäten nach Geschäftsbedarf, Technologie-/Entwicklungsanforderungen und anderen Grundlagen festlegen, die Sie benötigen, bevor Ihr Data Science-Anwendungsfall effektiv umgesetzt werden kann.
- Wie Sie es machen wollen: Hier müssen wir über die verschiedenen zur Verfügung stehenden Technologien sprechen. Dazu listen wir zunächst unsere Datenquellen und die Art der von ihnen verwendeten Technologien auf und beschränken uns dann auf die Technologieoptionen, die wir für die Einrichtung unseres Data Lake haben. Welche Cloud-Plattform eignet sich zum Beispiel am besten? Vielleicht ist sogar eine gehostete Data Lake-Lösung möglich, denn einige Dienstleister bieten Data Lakes als Service an.
- Was es braucht: Eine der größten Herausforderungen bei der technologischen Transformation (einschließlich der digitalen Transformation) ist der Umgang mit den Veränderungen in der Arbeitsweise. Aber das ist nicht die einzige Herausforderung. Damit die datengestützte Entscheidungsfindung funktioniert, müssen auch die entsprechenden Systeme ständig miteinander im Gespräch sein. Dieses Maß an Integration erfordert auch eine unternehmensweite Strategie und, was noch wichtiger ist, eine Vision des zukünftigen Unternehmens und wie die Organisation in Zukunft aussehen soll.
Machen Sie weiter mit Ihrem Data Lake
Nun, da Sie Ihren Data Lake in Betrieb genommen haben, ist nur ein kleiner Teil des Weges zurückgelegt. Der Weg ist noch lang und beschwerlich und birgt viele Risiken und Fallstricke. Einige der größten Herausforderungen sind die Aufrechterhaltung einer konstanten Dynamik:
- Dreaming Big: Eine der Hauptursachen für das Scheitern bei der Einführung von Data Science, Analytik und KI ist eine sehr große, vage Vision, da sie keine klaren Ziele und zeitkritischen Vorgaben definiert. Da Unternehmen eine Vielzahl von Geschäftsfällen verfolgen, wird der wahre Wert von Big Data, Datenanalyse und KI nicht schnell genug erkannt. Dieser Mangel an greifbaren Ergebnissen erhöht wiederum das Risiko und reduziert somit die Investitionen in diese Lösungen.
- Zu klein geträumt: Genauso wie es eine Herausforderung ist, einen sehr großen Anwendungsfall oder zu viele Anwendungsfälle gleichzeitig anzunehmen, ist es auch eine Herausforderung, zu klein zu denken. Dies ist das andere Extrem. Ein zu kleiner oder eng fokussierter Anwendungsfall kann die Anwendbarkeit des Ergebnisses einschränken und die Beteiligten dazu bringen, zweimal darüber nachzudenken, ob es sich tatsächlich lohnt, in Data Science und einen Data Lake zu investieren.
- Kein Management des Wandels: Wenn Sie Ihren Data Lake einrichten und Data Science-Prototypen und Proofs of Concept implementieren, ist es wichtig, dass Sie sich intern einbringen. Die Förderung einer datenzentrierten Unternehmenskultur und die Vermittlung der Notwendigkeit von Data Science sowie der Tatsache, dass Data Science die menschlichen Berührungspunkte nicht ersetzen, sondern unterstützen wird, sind entscheidende Erfolgsfaktoren für den Erfolg Ihrer Data Lake- und KI-Initiativen.
Die Inanspruchnahme eines Beratungsdienstleisters kann Ihnen helfen, Ihren Reifegrad zu bewerten, und auch eine unvoreingenommene interne Sicht auf den Data Lake und seine Bedeutung liefern. Dieser Einblick in die Meinung Ihrer Mitarbeiter zu den neuen Prozessen und Technologien (Data Lakes, Data Science, ML und KI) ist der Schlüssel zur Überwindung künftiger Herausforderungen bei der Einführung dieser Anwendungsfälle.
Allein oder sicher?
Abhängig von Ihrem Business Case für Data Lake und Data Science und Ihrer Roadmap können Sie entweder ein internes Team aufbauen, auslagern oder einen Beratungs- oder Talentpartner engagieren. Jeder Ansatz hat seine Vorteile und Risiken, aber hier sind fünf Aspekte, die Sie bei Ihrer Entscheidung berücksichtigen sollten.
- Team - der Aufbau eines Teams kann Zeit, Mühe und Geld kosten. Mit Beratungspartnern können Sie relativ schnell loslegen und haben so einen Vorsprung bei Ihren Data Science-Projekten. Die Personalaufstockung funktioniert ähnlich: Sie erhalten ein Team, aber wenn Sie einen Outsourcing-Ansatz wählen, erhalten Sie ein Team, das in der Regel eine gewisse Erfahrung in der Zusammenarbeit hat und auch erfolgreich zusammenarbeitet, da Partner über eigene Ressourcenpools für Projekte verfügen.
- Zeit - wenn Sie nicht sehr viel Glück haben, ist der Aufbau eines internen Teams am zeitaufwändigsten. Wenn Sie Ihre Anwendungsfälle in die Produktion überführen wollen, geht das am schnellsten mit Outsourcing, gefolgt von Personalaufstockung und Beratungsdiensten.
- Technologien - Die Auswahl der richtigen Technologien und der Aufbau der richtigen technologischen Kapazitäten sind entscheidend für den Erfolg. Hier kann jeder der Ansätze eine inhärente Voreingenommenheit aufweisen. Beratungsdienstleister bevorzugen in der Regel eine bestimmte Technologie, es sei denn, sie sind ausdrücklich neutral. Auch bei der Personalaufstockung gibt es eine Tendenz, die auf der kollektiven Technologieerfahrung der Teammitglieder beruht. Der Aufbau eines internen Teams von Grund auf kann diese technologische Voreingenommenheit zwar verringern, aber es kann auch ein leicht heterogener Ressourcenpool in Bezug auf die technologische Erfahrung entstehen.
- Prozesse - Sofern Ihre Data-Science-Führungskräfte nicht selbst über umfangreiche Erfahrungen verfügen, sind Beratungsdienste der richtige Weg, da die Anbieter die besten Praktiken der Branche bündeln und anpassen können, um sicherzustellen, dass sie optimal auf Ihr Unternehmen, Ihren Markt und Ihre Branche zugeschnitten sind.
- Risiko - Die Risikominderung ist eine Funktion Ihres Talents, des Technologie-Stacks, der Prozesse und der Gesamtkapazitäten, die als Teil Ihres Data CoE eingerichtet wurden. Je größer die kollektive Erfahrung und Vielfalt bei der Bewältigung verschiedener Geschäftsfälle, desto geringer ist das Risiko eines Fehlschlags.
Letztlich geht es bei diesem Gleichgewicht nicht um Risiko und Belohnung, sondern um Opportunitätskosten und Kosten. Wenn Sie entscheiden, wie Sie Ihre Data-Lake- und Data-Science-Initiativen angehen wollen, sollten Sie die Kosten eines Alleingangs gegenüber einem partnerschaftlichen Ansatz abwägen und sie mit den oben genannten Variablen für die Opportunitätskosten vergleichen. Das wäre Ihr logisches Argument dafür oder dagegen.
Unsere Ideen
Weitere Artikel

Das EU-Datenschutzgesetz: Ihr Fahrplan von der regulatorischen Belastung zur...
Verwandeln Sie die Einhaltung des EU-Datenschutzgesetzes in einen strategischen Vorteil. Erfahren Sie, wie vernetzte Unternehmen neue Umsätze...
Włodzimierz Marat
Contact



