Der globale Big-Data-Markt soll bis 2025 eine Viertel Billion Dollar erreichen, und der KI-Markt, der ebenfalls stark von Daten abhängig ist, soll im gleichen Zeitraum auf 38,4 Milliarden Dollar anwachsen. Der Hype um Daten ist immens, mit Klischee-Zitaten wie "Daten sind das neue Öl". Bereits 2010 berichtete der Economist über eine IBM-Studie, die zeigte, dass die Unternehmen nicht das nötige Vertrauen in die Anwendung von Data Science auf ihre Daten haben. Was hat sich heute geändert? Nun, eine ganze Menge, und zwar aus der Sicht der Unternehmen, die sich bei der Durchführung von Datenprojekten auf alles verlassen können.
Der Kontext der digitalen Transformation
Angesichts des aktuellen Hypes um die Digitalisierung und die digitale Transformation sind Unternehmensdaten der Elefant im Raum, der einen viel größeren und wichtigeren Platz einnimmt als noch vor einem Jahrzehnt. Daher die Frage: "Wie können Unternehmen angesichts der Dominanz digitaler Technologien den Punkt erreichen, an dem sich ihre Daten und Data Science in Umsatz und ROI niederschlagen?"
Die Antwort beginnt damit, den Elefanten im Raum anzusprechen. Wie planen Sie das?
- Aggregieren SieIhre Daten effizient
- VerwaltenSie Ihre Datenquellen
- Bestimmen Siedie richtigen Anwendungsfälle für Ihre Data Science
- Führen Sieklare Governance-Prozesse ein, um sicherzustellen, dass Ihre Daten vertrauenswürdig sind.
- RigoroseImplementierung von Zugangs- und Sicherheitssystemen, um Datenschutz- und Sicherheitsbedenken zu berücksichtigen
- Vermitteln Siedie Geschichte der Daten, um das Vertrauen und die Unterstützung der Stakeholder zu gewinnen.
Dieser AMPERE-Ansatz kann dazu beitragen, den Strom des Interesses aufrechtzuerhalten, den Strom, der Ihre Data-Science-Projekte am Laufen hält und - was noch wichtiger ist - erfolgreich macht. Aber es ist der erste Schritt, und die Teams müssen das verstehen:
- Ihre Data Lakes, Data Warehouses, Clouds - sie sind die Technologie. Die Infrastruktur, die Ihre Daten enthält, die Tools, Prozesse und die verschiedenen Integratoren, die Ihrem Datenprogramm Leben einhauchen.
- Daten sind das Öl, das Ihr Geschäft schmiert. Der Schlüssel zur Konsistenz liegt darin, sie rein zu halten, sie am Laufen zu halten und die Datenanforderungen für jeden Ihrer Anwendungsfälle zu erfüllen.
- KI ist Ihr Unterscheidungsmerkmal. Die geheime Soße, die Ihrem Unternehmen den Wettbewerbsvorteil verschafft, den Sie am meisten brauchen, um in der heutigen digitalen Welt relevant zu bleiben.
Dennoch ist es immer noch eine Kombination aus allen drei Facetten Ihrer Datengeschichte, die den geschäftlichen Nutzen bringt - sie müssen nahtlos aufeinander abgestimmt werden, und das bringt uns zu...
Wie machen wir das?
Die Orchestrierung der drei entscheidenden Facetten Ihrer Datengeschichte erfordert ein so genanntes Data Center of Excellence. Ein Aggregat aus Datenquellen, Datenverwaltung, Datentools, Plattformen und natürlich der KI selbst.
Es beginnt mit Daten
Die Daten, die Sie haben, müssen im richtigen Licht erscheinen. Dafür brauchen Sie mehr als nur Datenwissenschaftler. Zunächst müssen Sie Ihre Daten in Ordnung bringen, damit sie von den Datenwissenschaftlern genutzt werden können. Hier kommt das Datenmanagement ins Spiel.
Datenmanagement ist nichts anderes als die Prozesse, die Sie implementieren, um sicherzustellen, dass Ihre Daten in Ordnung sind:
- Bereinigen und Validieren - Als Big Data vor einem Jahrzehnt in aller Munde war, bestand die größte Herausforderung darin, den von Ihnen verwendeten Daten zu vertrauen - und sie ist auch heute noch eine der größten Herausforderungen. Von der Beseitigung von Duplikaten bis hin zu Unterlassungs- und Begehungsfehlern, wie z.B. Unterschiede in der Rechtschreibung, der Zeichensetzung und der Auswahl der Felder, können die Daten, die Sie für Ihre Erkenntnisse benötigen, aus den unterschiedlichsten Gründen beeinträchtigt sein. Es ist wichtig, dass diese Informationen korrekt und validiert sind.
- Datenintegrität - Nach der Bereinigung müssen die Daten eine eindeutige Beziehung zwischen der Quelle, dem Bereitstellungsbereich und dem endgültigen Ziel in Ihren Data Science-Plattformen aufweisen und fehlerfrei sein. Ja, nachdem sie bereinigt wurden... denn Ihre Daten werden ständig verwendet, geändert und aktualisiert. Es ist wichtig, dass Sie diese Datenqualität aufrechterhalten, indem Sie geeignete Prozesse und Verfahren implementieren, die eine beabsichtigte oder unbefugte Änderung dieser Daten und damit eine Beeinträchtigung ihrer Integrität verhindern. Ein Prozess, der auch als Data Governance bekannt ist.
- Daten verwaltet? Teilen Sie sie jetzt - Integrieren Sie die Datenquellen mit den Analysetools, APIs und Schnittstellen für Berichte und Dashboards.
Es hört sich einfach an, aber es steckt viel Arbeit dahinter, Ihre Daten zu identifizieren, sie vertrauenswürdig zu machen, sie zu verwalten und sie für die Datenwissenschaftler verfügbar zu machen.
Erste Schritte mit Ihrem Data Center of Excellence
Anfangen ist in diesem Zusammenhang eine falsche Bezeichnung, denn eine der größten Herausforderungen für Unternehmen im Zusammenhang mit ihrem Data CoE ist der Prozess des Anfangens. Einige der Aspekte, die bei der Schaffung eines Data Center of Excellence oder Data CoE eine Rolle spielen, sind:
Daten Vision
Ihre Datenvision, die Ihre Datenaggregation, -verwaltung, -steuerung und schließlich Ihre Data Science vorantreibt. Während große Unternehmen ihre Data Science-Teams eingestellt haben und diesen Teil des Data CoE abdecken konnten, haben sie sich immer noch auf Beratungsdienstleister verlassen. Warum eigentlich? Wegen der Unparteilichkeit von Beratungsunternehmen. Da Beratungsunternehmen in der Lage sind, die Perspektive eines Dritten einzunehmen, sind sie in der Regel in der Lage, die treibenden Kräfte zu identifizieren, die entweder die Datenvision Ihres Unternehmens vorantreiben oder konstruktive Argumente dagegen vorbringen.
Die Business Cases
Ihre Daten-Geschäftsfälle, die diese Vision letztendlich in die Realität umsetzen. Während es einfach ist, potenzielle Fälle zu identifizieren, ist es auch entscheidend, ihre Machbarkeit zu verstehen und die potenziellen Gewinne aus jedem dieser Geschäftsfälle zu prüfen, um die Gültigkeit jedes einzelnen Geschäftsfalls festzustellen. Auch hier können externe Berater helfen, Objektivität zu wahren und Voreingenommenheit zu vermeiden.
Technologie-Auswahl
Führen Sie die richtigen Technologien ein - Ob On-Premise, Cloud oder Hybrid - Ihre Datenplattformen benötigen die richtigen Technologien, um Silos zu vermeiden und Transparenz und Governance zu verbessern. Hier liegt der Schwerpunkt in der Regel auf dem "richtigen Partner". Selbst wenn Sie mit einem Beratungsdienstleister zusammenarbeiten, müssen Sie sicherstellen, dass dieser einen technologieunabhängigen Ansatz verfolgt, der Ihnen hilft, das Beste aus Ihren Data CoE-Investitionen zu machen. Einer der wichtigsten Beiträge eines Beratungspartners, wenn es um die Einführung von Technologien geht, ist die Erstellung eines langfristigen Geschäftsszenarios für den Einsatz einer Technologie im Gegensatz zu einer anderen.
Ein sehr wichtiger Aspekt ist hier, dass eine einmal ausgewählte Technologie die richtigen Fähigkeiten und Erfahrungen für die Implementierung des Technologie-Stacks erfordert. Sobald die Technologie implementiert ist, muss sie verwaltet und unterstützt werden, wofür ebenfalls die entsprechenden Fähigkeiten erforderlich sind. Die wichtigsten Fragen, die Sie sich hier stellen sollten, sind
- Menschen: Verfügen Sie über die erforderlichen Fähigkeiten? Wenn nicht, können Sie sie rechtzeitig erwerben? Wenn ja, können Sie es sich leisten? Data Scientists sind heute bei weitem die teuersten Ressourcen, gefolgt von KI, ML und NLP. Dies ist eine wichtige Überlegung, bevor Sie sich entscheiden, die Fähigkeiten einzustellen, die Sie für die Implementierung und Unterstützung Ihres Data CoE-Technologie-Stacks benötigen.
- Prozesse: Und Praktiken - Sie brauchen beides, und Sie brauchen die richtigen Prozesse und Best Practices der Branche, damit Ihr Data CoE mit Volldampf und höchster Effizienz arbeitet. Sie zu erreichen kann schwierig sein, denn auch hier sind Menschen beteiligt. Erfahrung hilft, Risiken zu verringern, und Fachwissen sorgt dafür, dass die Dinge reibungsloser und fast immer schneller ablaufen.
- Technologien: Neben dem eigentlichen Technologie-Stack benötigen Sie Tools und Technologien, die Ihr Data CoE am Laufen halten. Von Überwachungstools, die dabei helfen, die Infrastruktur und die Anwendungen am Laufen zu halten, bis hin zu IT-Service-Management-Tools, um Probleme und Serviceanfragen zu bearbeiten, und natürlich die Entwicklungstools für Continuous Integration und Continuous Delivery (CI/CD). Wir müssen hier auf die ersten beiden Punkte zurückkommen, d.h. auf die Erfahrung und das Fachwissen der Ressourcen im Umgang mit diesen Tools und Technologien und natürlich auf die Prozesse und Praktiken wie Agile, ITIL und ISO, um sicherzustellen, dass die Tools und Technologien richtig und angemessen eingesetzt werden.
Bauen oder und kaufen
Der wichtigste Aspekt des Data CoE ist das CoE selbst. Langfristig spielt es keine Rolle, ob Sie es selbst aufgebaut haben oder ob Sie einen Partner hatten. Letztlich wird die Leistung Ihres Data CoE an den Erkenntnissen und dem ROI gemessen, die es liefert. Ist also schneller nicht besser?
Wenn die Zeit drängt und es schwierig ist, ein Team von Grund auf neu aufzubauen, können Consulting und Talent Services helfen, das Risiko zu verringern und die Zeit bis zur Erkenntnis zu verkürzen. Sie können die richtigen Ressourcen einbringen, um Ihr Data CoE zu konzipieren, den richtigen Technologie-Stack und die Praktiken zu etablieren und es Ihnen zu ermöglichen, sofort loszulegen.
Unsere Ideen
Weitere Artikel

Das EU-Datenschutzgesetz: Ihr Fahrplan von der regulatorischen Belastung zur...
Verwandeln Sie die Einhaltung des EU-Datenschutzgesetzes in einen strategischen Vorteil. Erfahren Sie, wie vernetzte Unternehmen neue Umsätze...
Włodzimierz Marat
Contact



