Blog
Data Science Wissensmanagement mit einer Community of Practice

[caption id="" align="aligncenter" width="960"]
Quelle: https://www.topdesk.com/en/glossary/what-is-knowledge-management[/caption]
Die Umstrukturierung von Unternehmen von einer Ansammlung wissensorientierter funktionaler Teams in eine Konstellation produktorientierter funktionsübergreifender Teams hat zu einer enormen Verkürzung der Zeit geführt, die für die Entwicklung und Veröffentlichung neuer Produkte benötigt wird. In der Tat ist es heute üblich, dass datengesteuerte Produkte von Teams entwickelt werden, die sich aus einer Mischung aus Datenwissenschaftlern, Dateningenieuren, ML-Ops-Spezialisten und Analytikern zusammensetzen. Aber diese Geschwindigkeitsgewinne gehen auf Kosten der Zersplitterung des Wissens der Funktionsgemeinschaften des Unternehmens, und die meisten Unternehmen tun sich nach wie vor schwer mit dem Wissensmanagement in einem funktionsübergreifenden Umfeld.
In diesem Beitrag wird beschrieben, worin die Herausforderung des Wissensmanagements besteht. Es wird dargelegt, warum wir den traditionellen, IT-basierten Ansatz überdenken müssen, und es wird eine soziale Alternative vorgeschlagen, die auf dem Konzept einer Community of Practice basiert.
Eine geteilte Gemeinschaft
Ich möchte Ihnen zunächst die Situation schildern, die ich kürzlich bei einem Kunden erlebt habe und die sicher vielen bekannt vorkommt.
Die Datenwissenschaftler (und Ingenieure) dieses Unternehmens waren in drei isolierte Teams aufgeteilt. Der einzige Moment in der Woche, in dem sich die Mitglieder der drei Teams begegneten, abgesehen von einem gelegentlichen gemeinsamen Gang zur Kantine, war ein 15-minütiges, auf die Logistik ausgerichtetes All-Hands-Meeting am Montagmorgen. Jedes Team hatte seine eigenen Projekte und folglich auch seine eigenen Stakeholder in der größeren Organisation, aber manchmal gab es Überschneidungen bei den Produktverantwortlichen, mit denen sie zusammenarbeiteten, und häufig gab es Überschneidungen bei den Datenquellen der Projekte. Außerdem war das Onboarding sehr teamorientiert, ein Scheuklappen-Ansatz, der darauf abzielte, neue Mitarbeiter so schnell wie möglich in ihrem Projekt produktiv zu machen, was auf Kosten des allgemeinen organisatorischen Wissens und der Beziehungen zu den anderen Datenwissenschaftlern ging.
Quelle: Tapete Flare
Was waren die Folgen? Zum einen blieb das
Selbst wenn es mehr Kontakt zwischen den Teams gegeben hätte, behinderte die Inkonsistenz der Data-Science-Praktiken, z. B. unterschiedliche Codestile, Repository-Strukturen und Werkzeuge, die Data Scientists eines Teams daran, ihr Wissen mit Kollegen in anderen Teams zu teilen, zwischen Teams zu wechseln und neue Mitarbeiter einzustellen.
Die Herausforderung des Wissensmanagements
Die obigen Ausführungen beschreiben ein Unternehmen, das mit Wissensmanagement zu kämpfen hat: die Identifizierung von Wissen, das es den Datenwissenschaftlern des Unternehmens ermöglicht, ihre Arbeit effektiv zu erledigen, dieses Wissen auf dem neuesten Stand zu halten und es in der Community zu verbreiten, obwohl die Mitglieder dieser Community über das gesamte Unternehmen verteilt sind. Viele Unternehmen würden auf diese Herausforderung reagieren, indem sie versuchen, das oben genannte Wissen in einem internen Wiki, wie z.B. Confluence, zu kodieren, und diese Organisation war nicht anders. Doch typischerweise werden solche statischen Wissensspeicher schnell zu
Die effektivste Art, Wissen in einer Organisation zu speichern, zu aktualisieren und weiterzugeben, sieht ganz anders aus als ein Wiki.
Laut dem ausgezeichneten Buch Cultivating Communities of Practice von E. Wenger, R. McDermott und W. M. Snyder ("CCoP") liegt der Hauptgrund für das Scheitern dieser wiki-ähnlichen Wissensmanagement-Ansätze darin, dass Informationen häufig mit Wissen verwechselt werden. Wie kommt es zu diesem Unterschied? CCoP weist auf vier Gründe hin:
Wissen lebt im menschlichen Akt des Wissens.
Sicher, Sie können eine gebloggte Fallstudie lesen, um etwas über bessere Data Science zu lernen. Aber viel effektiver ist es, das Gelesene in die Praxis umzusetzen und ein Gefühl dafür zu entwickeln, unter welchen Bedingungen das Gelesene angewendet werden kann und wie Sie das Thema der Fallstudie in Ihrem Unternehmen umsetzen können. Noch besser ist es, wenn Sie während der Lektüre Feedback von einem erfahrenen Praktiker erhalten.
Wissen ist sowohl implizit als auch explizit.
Genauso wie ein trainiertes neuronales Netzwerk viel besser zwischen Bildern von Katzen und Hunden unterscheiden kann als eine beliebig lange Kaskade von if-else-Anweisungen, lässt sich das Handwerk der Datenwissenschaft nicht auf eine Bedienungsanleitung reduzieren. Nennen Sie es Geschmack, Gefühl oder Instinkt, aber es gibt einige Aspekte der Arbeit, die sich nicht einfach in Worte fassen lassen.
Wissen ist nicht nur individuell, sondern auch sozial.
Kein einzelner Datenwissenschaftler in Ihrem Unternehmen beherrscht alle Aspekte seiner Arbeit. Kombinieren Sie dies mit dem, was wir über die Unmöglichkeit gesehen haben, alles, was die Arbeit betrifft, perfekt aufzuschreiben. Wir sehen, dass die Stärke des Data-Science-Wissens eines Unternehmens notwendigerweise daraus entsteht, dass Data Scientists ihre Perspektiven miteinander teilen und manchmal aneinander geraten.
Wissen ist dynamisch.
Ganz gleich, wie schnell sich die Palette der Data-Science-Techniken weiterentwickelt, die Werkzeuge ändern sich einfach in einem Tempo, bei dem es wenig Sinn macht, einmal zu evaluieren, was am besten funktioniert, und diese Wahl dann nie wieder zu überdenken. Die Data-Science-Community eines Unternehmens muss ständig einen Prozess der Entdeckung, Bewertung und Integration durchlaufen, und aus diesem Grund wird ein Wiki immer nur so nützlich sein, wie es aktualisiert wird.
Quelle: Die Entwicklung der Online-Bildung: Gemeinsam lernen
Als Folge der vier oben genannten Gründe sieht die effektivste Art, Wissen in einer Organisation zu speichern, zu aktualisieren und zu teilen, ganz anders aus als ein Wiki. Die Verwaltung von Wissen muss Menschen einbeziehen, die regelmäßig und häufig als "lebendes Repository" für das Wissen der Organisation interagieren. Sie müssen sich freiwillig engagieren, auf der Grundlage kollegialer und nicht autoritärer Beziehungen. Und es kann schriftliche Anleitungen geben, aber nur insoweit, als diese die Gespräche, das Coaching und das Erzählen von Geschichten ergänzen.
Wie wir das Wiki hinter uns gelassen haben
Eine Community of Practice ist ein Ansatz zur Verwaltung von Wissen, der die Unterschiede zwischen Informationen und Wissen anerkennt. Laut den Autoren von CCoP ist es:
Eine Gruppe von Menschen, die ein Anliegen, eine Reihe von Problemen oder eine Leidenschaft für ein Thema teilen und die ihr Wissen und ihre Fachkenntnisse in diesem Bereich durch ständige Interaktion vertiefen... [Eine] einzigartige Kombination aus drei grundlegenden Elementen: ein Wissensgebiet, das eine Reihe von Themen definiert; eine Gemeinschaft von Menschen, die sich um dieses Gebiet kümmern; und die gemeinsame Praxis, die sie entwickeln, um in ihrem Gebiet effektiv zu sein.
Im Fall meines Kunden war die Anzahl der Datenwissenschaftler in der Organisation gering (weniger als fünfzehn), so dass wir diese Definition erfüllen konnten, indem wir einfach alle Datenwissenschaftler zum Fachsimpeln zusammenbrachten. (Wenn die Rolle der Datenwissenschaft in der Organisation wächst, könnte es sinnvoll sein, untergeordnete Gemeinschaften mit engeren Bereichen wie Marketing oder spezialisierteren Verfahren wie Deep Learning abzuspalten). Wir buchten einen Konferenzraum, in dem sich die Datenwissenschaftler aller drei Teams wöchentlich eine Stunde lang treffen konnten, bevor sie gemeinsam zum Mittagessen gingen. Zu Beginn jedes Quartals stimmten wir über wöchentliche Themen ab und ließen einige Wochen frei, so dass ein Team, das mit seinem Projekt nicht weiterkam, um eine spontane Brainstorming-Sitzung der Community bitten konnte. Die Mitglieder meldeten sich freiwillig, um Themen zu präsentieren oder "Gastvorträge" aus einem benachbarten Bereich zu koordinieren, und konnten die Sitzung nach eigenem Ermessen gestalten. Manchmal, wenn es darum ging, an einer neuen Bibliothek oder einem neuen Datensatz zu hacken, aßen wir im Konferenzraum zu Mittag und verlängerten die Sitzung um eine weitere Stunde.
Die Community of Practice hat eine Koordinatorin, deren Aufgabe es ist, Community-Treffen zu moderieren. Sie kann zwar die Abstimmungsrunden leiten, ein einfaches Wiki mit "Sitzungsnotizen" führen oder den Konferenzraum buchen, aber die Koordinatorin ist ausdrücklich
Ergebnisse, erwartet und unerwartet
Was hat diese Data Science Community of Practice also in den ersten sechs Monaten seit ihrer Gründung gebracht? Natürlich viel Wissensaustausch in Bezug auf statistische Techniken, Visualisierung, ungewöhnliche Datensätze, Modellüberwachung usw. Darüber hinaus hat sich das Gefühl der Kameradschaft unter den Datenwissenschaftlern deutlich verstärkt, motiviert durch projektübergreifende Ziele und einfach durch die Möglichkeit, gemeinsam in einem Raum zu sitzen und zu fachsimpeln. Aber es gab auch ein paar unerwartete Dinge zu berichten.
Zum einen führte die Community einen Workshop zur Arbeitsweise durch, mit dem Ziel, "80 %" der Art und Weise, wie alle Teams Data Science betreiben, zu standardisieren. Die daraus resultierenden Richtlinien führten zu einer schnelleren Entwicklung von Datenprodukten, senkten die Hürden für die Einbringung von Beiträgen in Code-Reviews und Brainstorming-Sitzungen anderer Teams und erleichterten sowohl die Einstellung von Mitarbeitern als auch die Mobilität zwischen den Teams. (Mehr darüber, warum und wie wir diesen Workshop durchgeführt haben, erfahren Sie in einem späteren Beitrag!)
Dieser neue Prozess stellt nicht nur sicher, dass neue Mitarbeiter so schnell wie möglich Zugang zu allen Data-Science-Tools erhalten, sondern gibt auch einen umfassenden Überblick über die domänenspezifischen Aspekte der Data-Science-Tätigkeit im Unternehmen durch eine Kombination aus Präsentationen und Informationskaffeesitzungen mit Domänenexperten im Unternehmen. Darüber hinaus wird sichergestellt, dass die neue Mitarbeiterin das Gefühl hat, einer Gemeinschaft von Datenwissenschaftlern und nicht nur einem Projektteam beizutreten, indem ihr ein Onboarding-Buddy zugewiesen wird, der sie durch den Prozess führt, und indem sie bei einem Kaffee mit Datenwissenschaftlern aus allen Teams sowohl etwas über die Projekte der anderen Teams als auch über die Hintergründe ihrer Mitglieder erfährt.
Drittens eine interne Data-Science-Bibliothek, die von einer eher technisch orientierten Untergruppe der Community erstellt wurde. Diese aktiv gepflegte Bibliothek enthält häufig verwendete, auf PySpark basierende Funktionen für das Feature-Engineering und kombinierte Datensatzansichten. Dadurch wurde nicht nur erheblicher technischer Aufwand zwischen den Teams vermieden, sondern diese Untergruppe hatte auch die Möglichkeit, ihre Fähigkeiten im Bereich Software-Engineering zu verbessern.
Und schließlich wurden die Dateningenieure des Unternehmens dazu inspiriert, ebenfalls eine eigene Community of Practice zu bilden.
Danksagungen
Besonderen Dank an Steven Nooijen, der GoDataDriven in das Konzept der Community of Practice eingeführt hat und der es gewagt hat, als erster eine solche bei einem unserer Kunden zu implementieren. Lesen Sie mehr über die Randstad-Fallstudie. Neben Steven danke ich auch meinen Kollegen Arjan van den Heuvel und Julian de Ruiter für ihr Feedback zu diesem Blogbeitrag.
Nachtrag
Oberflächlich betrachtet ähnelt diese Struktur sehr stark der einer Gilde oder eines Kapitels aus dem Spotify Agile Modell. Allerdings unterscheiden sich die Communities of Practice von beiden. Gilden sind offener und umfassen mehrere Rollen in allen Stämmen der Organisation. Daher sind sie weniger stark fokussiert und umfassen ein breites Spektrum an Praktiken. Die Chapter werden von einem Vorgesetzten geleitet, der für die Festsetzung der Gehälter und die Gestaltung der Entwicklungswege der Mitglieder verantwortlich ist und somit für den Erfolg des Chapters haftet. Kapitel legen daher einen besonderen Schwerpunkt auf die Praxis statt auf Fachwissen und wirken dem Engagement und der Innovation entgegen, die durch die Abschaffung von Berichtsbeziehungen entstehen. Dennoch kann eine Community of Practice als Sprungbrett für eine Konstellation von Chaptern dienen, wenn die Organisation wächst und reift.
Unsere Ideen
Weitere Blogs
Contact



