Die Datenlandschaft entwickelt sich ständig weiter, so dass es eine Herausforderung ist, über neue Trends auf dem Laufenden zu bleiben. Deshalb haben wir beschlossen, einen Blog zu starten, der sich auf die Datentrends konzentriert, die wir für das Jahr 2025 erwarten.
1. Die Zukunft der Datenprodukte: Unternehmen mit Qualität und Governance unterstützen
Während sich GenAI von einem Hype zu einem ausgereiften Produkt entwickelt, ist die Erkenntnis über den Wert der Datenqualität wieder aufgetaucht. Data Governance rückt auf der Prioritätenliste großer Unternehmen, die datengesteuert mit KI arbeiten wollen, immer weiter nach oben. Schlechte Datenqualität führt automatisch zu schlechten Entscheidungen. Das gilt nicht nur für GenAI, sondern für alle Datenprodukte.
In vielen Unternehmen sind die Daten über verschiedene Speicherorte und Plattformen verteilt, so dass die Sicherstellung effektiver Verbindungen und Governance von entscheidender Bedeutung ist. Der Schlüssel zur Entwicklung erfolgreicher Datenprodukte ist das Verständnis der Bedürfnisse und Herausforderungen des Unternehmens, auf die die Datenprodukte abzielen. Bis 2025 werden wir die Verantwortung für die Daten in die Hände derjenigen legen, die sie am besten kennen: die Geschäftsteams. Wenn wir wollen, dass die Benutzer das Potenzial der Daten voll ausschöpfen, müssen sie Einblicke in die Semantik, Qualität und Herkunft aller Daten erhalten. Infolgedessen werden die folgenden Datenressourcen immer mehr an Bedeutung gewinnen:
- Daten Verträge
- Datenkataloge
- Tools für Datenqualität und Beobachtbarkeit
- Semantische Schichten
Eine der wichtigsten Fragen wird daher lauten: Wie können wir Daten für nicht-technische Benutzer in Organisationen optimal zugänglich machen?
2. Befähigung von Geschäftsanwendern: Die nächste Grenze der Datendemokratisierung.
Tools wie dbt beschleunigen die Demokratisierung von Daten, indem sie es Ingenieuren ermöglichen, die Geschäftslogik "nach links zu verlagern" und ein Hub-Spoke-Modell für Daten zu erstellen. Dies erhöht die Effizienz und das Vertrauen in die Datenqualität (oder zumindest die Einheitlichkeit der Geschäftslogik über verschiedene Dashboards hinweg).
In der Regel speist ein Analyst diese Daten in ein Dashboard für Geschäftsanwender ein. Unabhängig davon, wie viel Drilling ein Dashboard erlaubt, werden sich Geschäftsanwender mit Datenfragen an Datenspezialisten wenden. Datenteams sind nicht für ihre leeren Auftragsbücher bekannt, was einen Engpass für Ad-hoc-Geschäftsfragen bedeutet.
Der nächste Schritt in der Demokratisierung von Daten besteht darin, Geschäftsanwendern die Möglichkeit zu geben, direkt in natürlicher Sprache mit den Daten im Datenarchiv oder Datawarehouse zu interagieren. Keine Engpässe mehr und keine Notwendigkeit, SQL zu lernen. Tools, die Sie in diesem Bereich im Auge behalten sollten, sind Databricks AI/BI Genie (Databricks AI/BI Genie), Snowflake Cortex Analyst (Snowflake Cortex) oder domänenspezifische Tools wie(Akkio ) für Werbeagenturen.
3. Unlocking Data Access: Wie die Datenkatalogisierung Unternehmen im Jahr 2025 verändern wird.
Datenkatalogisierung ist ein Trend, der dazu beiträgt, Daten im Jahr 2025 organisationsübergreifend zu demokratisieren. Ein Datenkatalog ist wie ein Bibliotheksverwaltungssystem, in dem Datensätze und Datenprodukte wie Bücher und Mitarbeiter wie Bibliotheksbesucher sind. Ein Bibliotheksverwaltungssystem hilft den Bibliotheksbesuchern, Bücher zu finden und auszuleihen. Ein Datenkatalog hilft Mitarbeitern, Daten (Produkte) zu finden und zu nutzen, und ist somit ein wichtiger nächster Schritt in der Demokratisierung von Daten.
Die Katalogisierung von Daten hilft Benutzern, verfügbare Daten (Produkte) intuitiv zu entdecken. Metadaten wie Titel, Definitionen, Glossare, Tags und Klassifizierungen helfen, die Daten (Produkte) besser zu verstehen. Lineage (d.h. der Fluss Ihrer Daten) hilft den Mitarbeitern, vor- und nachgelagerte Abhängigkeiten besser zu verstehen. Darüber hinaus machen Datenkataloge die Verwaltung des Datenzugriffs intuitiver.
Ein Datenkatalog zentralisiert das Wissen über Daten(produkte) und versetzt die Geschäftsteams in die Lage, die Verantwortung für die Datenprodukte zu übernehmen, die sie dem Rest des Unternehmens zur Verfügung stellen. Anstatt dass die IT-Abteilung für alle Daten(produkte) verantwortlich ist, ohne Einfluss auf den Datenerzeugungsprozess zu haben, können die Dateneigentümer und Datenverwalter in den Geschäftsbereichen nun für die Datendefinitionen und die Qualität ihrer Daten(produkte) verantwortlich gemacht werden.
Einige Anbieter, die Sie in diesem Bereich beobachten sollten:(Atlan),(Collibra ), Databricks Unity Catalog (Unity Catalog), Informatica Data Catalog (Informatica Data Catalog) und Talend (Talend Data Catalogue). Und(data.world), ein Unternehmen, das uns aufgrund seiner Knowledge Graph-Architektur besonders interessiert.
4. Der Aufstieg der agentenbasierten KI
Bis Ende 2025 wird die agentenbasierte KI die Art und Weise revolutionieren, wie Unternehmen komplexe Aufgaben automatisieren und Entscheidungen treffen. Im Gegensatz zu herkömmlichen KI-Systemen arbeitet die agentenbasierte KI autonom und übernimmt Prozesse wie Personalverwaltung, Kundenservice und sogar Finanztransaktionen. Diese "digitalen Mitarbeiter" werden Aufgaben übernehmen, die bisher Menschen vorbehalten waren, wie z.B. das Lösen von Support-Tickets, die Unterstützung bei der Personalverwaltung und die Automatisierung komplexer Arbeitsabläufe. Branchenführer wie Microsoft, Google und Salesforce führen diesen Wandel an und zwingen SaaS-Anbieter dazu, agentenbasierte Modelle einzuführen, um die Betriebskosten zu senken und die Effizienz zu steigern.
Trotz des Versprechens bleiben Hindernisse bestehen. KI-Agenten sind nach wie vor fehleranfällig, und erhebliche Fehltritte könnten zu einer öffentlichen und behördlichen Überprüfung führen. Es wird erwartet, dass die ersten Agenten kleine, strukturierte interne Aufgaben mit einem gewissen Maß an Fehlertoleranz übernehmen, wie z.B. die Änderung von Passwörtern in IT-Systemen oder die Buchung von Urlaubstagen auf HR-Plattformen. Unternehmen müssen sich auf robuste Sicherheits-, Überwachungs- und ethische Standards konzentrieren, um sicherzustellen, dass diese Systeme verantwortungsvoll eingesetzt werden.
Unternehmen, die sich frühzeitig mit agentenbasierter KI auseinandersetzen, werden einen Wettbewerbsvorteil erlangen. Durch die Steigerung der Produktivität und die Förderung von Innovationen wird die Zusammenarbeit zwischen Mensch und KI die Arbeitswelt neu gestalten und die Abläufe effizienter, skalierbarer und anpassungsfähiger machen. Um den Anfang zu machen, sollten Unternehmen mit risikoarmen, strukturierten Aufgaben beginnen, bei denen KI einen unmittelbaren Nutzen bringen und gleichzeitig mögliche Fehler minimieren kann. Die Einführung starker Kontrollmechanismen, wie z.B. die Validierung durch den Menschen und die kontinuierliche Überwachung, ist für die Risikominimierung von entscheidender Bedeutung. Darüber hinaus werden Investitionen in die Schulung der Mitarbeiter und die Festlegung klarer ethischer Richtlinien einen reibungsloseren Übergang gewährleisten. Durch einen maßvollen, strategischen Ansatz können Unternehmen eine solide Grundlage für die KI-gestützte Transformation schaffen und gleichzeitig das Vertrauen und die Compliance aufrechterhalten.
5. Sich entwickelnde Rollen und Kompetenzen
Die Rolle des "Datenwissenschaftlers" wurde einst als der attraktivste Job des 21. Jahrhunderts angesehen. Jahrhunderts. Doch diese Position, die traditionell ein breites Spektrum an Fähigkeiten, Rollen und Aufgaben umfasste, entwickelt sich nun weiter. Wir beobachten, dass sich die Fähigkeiten, Verantwortlichkeiten und Aufgaben von Data Scientists und Machine Learning Engineers zunehmend überschneiden.
Heutzutage muss ein Datenwissenschaftler zuverlässige, skalierbare und wartbare Pipelines für maschinelles Lernen entwickeln und dabei bewährte Verfahren aus der Softwareentwicklung anwenden und in der Lage sein, die Ergebnisse effektiv an die Geschäftsinteressenten zu kommunizieren. Darüber hinaus benötigen Sie angesichts der zunehmenden Verwendung von LLMs als Entscheidungshilfen einen Datenwissenschaftler, um zuverlässige, valide und robuste Ergebnisse garantieren zu können.
6. GenAI im Jahr 2025: Sicherheit, Beobachtbarkeit und der weitere Aufstieg von LLMOps
Der anfängliche Hype um KI entwickelt sich zu einer Konzentration auf praktische Anwendungen, die einen messbaren Wert liefern. Die Unternehmen verstehen jetzt, was KI tatsächlich leisten kann, und sind über die anfängliche Begeisterung hinausgewachsen. Die eigentliche Herausforderung im Jahr 2025 ist der effektive und verantwortungsvolle Einsatz von KI. Hier kommt LLMOps (LLM Operations) ins Spiel. LLMOps kann als eine Möglichkeit gesehen werden, die Entwicklung, Verwaltung, Bereitstellung und Überwachung von LLM-Anwendungen zu rationalisieren. Es ist das Toolkit für zuverlässige, sichere und wertschöpfende KI. Dabei hat die Sicherheit weiterhin oberste Priorität. Robuste Sicherheitsmaßnahmen sind für den effektiven Einsatz von generativer KI unerlässlich. Es sollten auf jeden Fall starke Schutzmechanismen vorhanden sein, die sowohl die Eingaben als auch die Ausgaben des Systems aktiv validieren. Ebenso ist es wichtig, die Leistung der KI zu verstehen. Die "Beobachtbarkeit" gibt uns einen Überblick über das System, indem wir Echtzeit-Dashboards, Protokolle und Datenverfolgung nutzen, um Probleme schnell zu beheben. Die datengesteuerte Bewertung mit spezifischen Metriken für Genauigkeit, Faktizität und Verzerrung ersetzt die Intuition. Menschliche Experten kommentieren die Daten, gehen auf Grenzfälle ein und sorgen für eine qualitativ hochwertige Auswertung, die die nötigen Erkenntnisse zur weiteren Verbesserung des Systems liefert. Unternehmen, die wissen, wie sie ihr System effizient und effektiv auswerten können, werden den größten Nutzen daraus ziehen. Darüber hinaus erfordert der erfolgreiche Einsatz von generativer KI sowohl ein solides Verständnis von generativer KI als auch Best Practices aus der Softwareentwicklung. Für viele Unternehmen geht es bei der Skalierung von generativer KI um die Orchestrierung von Aufrufen zu vortrainierten Modellen und anderen APIs. Die technischen Bemühungen konzentrieren sich jetzt auf die Optimierung der Kosten und den Aufbau robuster, skalierbarer Anwendungen, die Geschwindigkeit, Genauigkeit und Effizienz in Einklang bringen. Eine solide Grundlage von Plattformen und Tools ist entscheidend für die Ausschöpfung des vollen Potenzials von Gen AI im Jahr 2025. Diese Grundlage ermöglicht nicht nur eine verantwortungsvolle und wirkungsvolle Nutzung, sondern sorgt auch für geschäftlichen Nutzen: Beschleunigung der Markteinführung neuer Produkte, Verkürzung der Iterationszyklen, um schnellere Produktverbesserungen zu ermöglichen, und gleichzeitige deutliche Minderung des Risikos negativer Folgen. Unternehmen mit einem robusten KI-Lebenszyklusmanagement werden in der Lage sein, bei Innovationen führend zu sein und einen erheblichen Wettbewerbsvorteil zu erzielen.
Verfasst von
Koen Graat
Unsere Ideen
Weitere Blogs
Contact




