Blog
Wichtige Bereiche, die Sie vor dem Aufbau Ihrer Azure-Datenplattform planen sollten

Bevor Sie mit dem Aufbau Ihrer Datenplattform auf Azure beginnen, lohnt es sich, eine Pause einzulegen und sich auf die Gestaltung der Cloud-Ressourcen zu konzentrieren. Wenn Sie sich die Zeit nehmen, die wichtigsten Komponenten im Voraus zu planen, können Sie kostspielige Nachbesserungen im Nachhinein vermeiden. Ein gut durchdachtes Fundament hilft Ihnen nicht nur, technische Schulden zu vermeiden - es schafft auch die Voraussetzungen für Skalierbarkeit, bessere Governance und mehr Sicherheit vom ersten Tag an. Unabhängig davon, ob Sie für ein einzelnes Team oder ein ganzes Unternehmen entwickeln, wird es durch kluge Entscheidungen im Vorfeld viel einfacher, Ihre Plattform im Laufe der Zeit zu erweitern, zu pflegen und ihr zu vertrauen.
In diesem Artikel heben wir fünf grundlegende Bereiche hervor, die Sie durchdenken sollten, bevor Sie mit der Entwicklungsarbeit beginnen. Wir verstehen, dass knappe Fristen, Projektdruck oder begrenzte Verfügbarkeit des Teams Sie manchmal dazu verleiten können, sich direkt in die Programmierung zu stürzen. Aber vertrauen Sie uns - Sie werden sich später bedanken, wenn Sie sehen, wie viel schneller, reibungsloser und qualitativ hochwertiger die Arbeit in einer gut vorbereiteten Umgebung verläuft.
Landezonen & Netzwerkarchitektur
Um es gleich vorweg zu nehmen: Ja, wenn Sie eine Datenplattform aufbauen, brauchen Sie ein gewisses Verständnis von Cloud-Infrastruktur und Netzwerken. Sie müssen kein Experte für Microsofts Cloud Adoption Framework (CAF) sein oder in der Lage, eine komplette Unternehmensnetzwerk-Topologie zu entwerfen, aber Sie müssen die Grundlagen verstehen und in der Lage sein, effektiv mit den Teams zu kommunizieren, die für diese Bereiche zuständig sind.
Unsere Erfahrung zeigt, dass Sie sich bei der Einrichtung der Plattform in der Regel in einem von zwei Szenarien wiederfinden:
- Die ausgereifte Konfiguration - wenn das Unternehmen bereits über gut etablierte Standards für die Cloud-Umgebung und Landing Zone-Muster verfügt. Ihre Aufgabe besteht hier darin, sich an diesen Regeln zu orientieren und innerhalb ihrer Grenzen zu arbeiten.
- Die Herausforderung auf der grünen Wiese - wenn diese Grundlagen fehlen oder nur unzureichend definiert sind und Sie als Teil Ihres Projekts in Zusammenarbeit mit dem Kunden zumindest die Grundlagen schaffen müssen.
Unabhängig davon, in welcher Situation Sie sich befinden, gibt es ein paar Dinge, mit denen Sie wahrscheinlich konfrontiert werden:
-
Planung der Trennung von Umgebungen über Azure-Abonnements hinweg, einschließlich der Auswirkungen auf Zugriffskontrolle, Netzwerke und Governance
-
Anwendung von umgebungsspezifischen Richtlinien, oft über Azure Policy
-
Budgetplanung und Strategien zur Kostenkontrolle
-
Das umfangreiche Thema der Netzwerkarchitektur
Der letzte Punkt, die Vernetzung, kann leicht einen beträchtlichen Teil Ihres Projektzeitplans in Anspruch nehmen - vor allem, wenn Sie anfangen, über Private Link, VNet Peering, DNS-Auflösung oder Firewalls zu diskutieren. Dies sind nicht nur technische Fußnoten, sondern wichtige Entscheidungen, die sich darauf auswirken, wie sicher, skalierbar und wartbar Ihre Plattform sein wird.
Was passiert also, wenn Sie diesen Teil auslassen? Im schlimmsten Fall müssen Sie nach Wochen oder sogar Monaten der Arbeit grundlegende Entscheidungen revidieren, weil der Netzwerkverkehr einfach nicht so läuft, wie er sollte, oder weil Sicherheitseinschränkungen Ihren Zugriff in der Produktion blockieren. Das bedeutet Verzögerungen, Nacharbeit und unerwartete Kosten - alles Dinge, die mit ein paar frühen Gesprächen und ein wenig architektonischer Planung hätten vermieden werden können.
Klingt interessant? Unten finden Sie einige empfehlenswerte Links, und nun weiter zu IAM.
- Verwendung von Landing Zones bei der Migration in die Cloud
- Wie Sie eine wartbare und hochverfügbare Azure Landing Zone aufbauen
Identitäts- und Zugriffsmanagement (IAM)
In unserem Plattformdesign sollte Microsoft Entra ID (früher Azure Active Directory) als zentraler Knotenpunkt für die Identitäts- und Zugriffsverwaltung dienen. Bevor Sie mit der Implementierung von Ressourcen beginnen, sollten Sie sich die Zeit nehmen, einige grundlegende Annahmen sorgfältig zu durchdenken. Diese frühzeitigen Entscheidungen können Ihnen später viel Arbeit ersparen - vor allem, wenn man bedenkt, dass die Rückgängigmachung von Änderungen des Zugriffsmodells in einer produktiven Umgebung fast immer sehr viel zeitaufwändiger und komplexer ist, als wenn man es von Anfang an richtig macht.
Hier sind einige Empfehlungen, die auf unserer Erfahrung beruhen:
-
Verwenden Sie, wo immer möglich, domänenbasierte Identitäten und behalten Sie Microsoft Entra als einzige Quelle der Wahrheit für die Verwaltung von Benutzern und Gruppen bei.
-
Vermeiden Sie die direkte Zuweisung von Berechtigungen an einzelne Benutzer. Definieren und verwalten Sie den Zugriff stattdessen über Sicherheitsgruppen - insbesondere bei der Definition von Eigentumsrechten...
-
Entwerfen Sie eine klare Hierarchie von funktionalen und nicht-funktionalen Gruppen, die auf die Zuständigkeiten der Teams abgestimmt sind (z.B. Plattform, Data Engineering, Data Science).
-
Verwenden Sie Privileged Identity Management (PIM) für erhöhte Berechtigungen wie Contributor- oder Owner-Rollen, um eine zusätzliche Ebene der Kontrolle und Transparenz zu schaffen.
-
Folgen Sie dem Prinzip der geringsten Privilegien. Erstellen Sie insbesondere eng begrenzte Service Principals, die jeweils auf einen bestimmten Anwendungsfall oder eine bestimmte Pipeline zugeschnitten sind und nur die Berechtigungen haben, die sie wirklich benötigen.
Eine gut durchdachte IAM-Strategie verringert nicht nur das langfristige Risiko, sondern verbessert auch die Übersichtlichkeit, Governance und Skalierbarkeit.
Konventionen
Wo immer möglich, sollten Sie Standards und Konventionen für Ihr Cloud-Projekt definieren und durchsetzen. Dies gewährleistet Konsistenz, verbessert die Zusammenarbeit und vereinfacht die Automatisierung und Governance.
Beispielsweise helfen einheitliche Namenskonventionen für Cloud-Ressourcen den Teams, den Zweck, die Umgebung und die Eigentumsverhältnisse jeder Ressource schnell zu verstehen, was für eine effektive Verwaltung und Zusammenarbeit entscheidend ist. Wenn die Benennungsmuster vorhersehbar und standardisiert sind, ist es viel einfacher, Ressourcen zu finden, Protokolle zu interpretieren, Richtlinien anzuwenden und sicherzustellen, dass die Ressourcen korrekt gruppiert und überwacht werden. Dies wird umso wichtiger, je größer die Umgebung wird und je mehr verschiedene Teams - z.B. aus den Bereichen Betrieb, Sicherheit und Finanzen - mit derselben Infrastruktur arbeiten. Eine gut durchdachte Namenskonvention kann auch dazu beitragen, Fehlkonfigurationen zu vermeiden, das Risiko menschlicher Fehler zu verringern und die Automatisierung zu unterstützen, indem sie es einfacher macht, Skripte gegen Ressourcennamen auf konsistente Weise einzusetzen.
Gut definierte Tagging-Konventionen - wie z.B. Tags für Umgebung, Kostenstelle oder Eigentümer - sind für das Kostenmanagement, die Rechenschaftspflicht und die betriebliche Berichterstattung entscheidend. Tags bieten strukturierte Metadaten, mit denen Ressourcen über Abonnements und Regionen hinweg gruppiert und analysiert werden können, unabhängig davon, wie sie benannt sind oder wo sie sich befinden. Auf diese Weise können Teams die Ausgaben pro Projekt, Team oder Geschäftseinheit verfolgen und ungenutzte oder nicht ausgelastete Ressourcen identifizieren. Tags spielen auch eine wichtige Rolle bei der Durchsetzung von Governance-Richtlinien, bei der Automatisierung (z.B. automatisches Herunterfahren von Umgebungen, die nicht für den Produktivbetrieb bestimmt sind) und bei der Sicherstellung klarer Eigentumsverhältnisse - was besonders wichtig für die Reaktion auf Vorfälle und den Support ist. Ohne eine Tagging-Strategie wird die Verwaltung einer wachsenden Azure-Umgebung schnell chaotisch und ineffizient.
Ebenso wichtig sind Kodierungsstandards - ob für Infrastructure as Code, Notebooks oder Datenverarbeitungsskripte -, die dazu beitragen, eine konsistente Codequalität aufrechtzuerhalten, die Einarbeitungszeit für neue Teammitglieder zu verkürzen und die Wiederverwendung von Code in verschiedenen Umgebungen und Projekten zu unterstützen. Standards für Struktur, Benennung, Dokumentation und Formatierung führen zu klarerem, zuverlässigerem Code, der sich leichter überprüfen, debuggen und erweitern lässt. Diese Konventionen sind nicht nur eine Frage der Vorliebe - sie sind die Grundlage für den Aufbau einer skalierbaren und wartbaren Plattform. Um diese Standards durchzusetzen, können Teams Tools wie Pre-Commit Hooks einsetzen, die automatisch auf Probleme wie Formatierungsfehler, Sicherheitsrisiken oder fehlende Dokumentation prüfen, bevor der Code übertragen wird. In Kombination mit Linters, Formatierern (wie black, flake8 oder terraform fmt) und CI/CD-Pipeline-Prüfungen dienen diese Tools als automatisierte Leitplanken, die sauberen, konsistenten und produktionsreifen Code vom ersten Tag an fördern.
Wenn Sie gerade dabei sind, Ihre Konventionen zu definieren, empfehlen wir Ihnen, mit den folgenden Punkten zu beginnen:
- Azure Data Factory und Synapse Analytics Benennungskonventionen
- Azure Periodensystem der Ressourcennamenskonventionen Kurzzeichen
- Azure Tagging Anleitung
- Modul: Kontext
Infrastruktur als Code
Die Zeiten der manuellen Bereitstellung von Cloud-Ressourcen über das Azure-Portal sind längst vorbei. Bei modernen Datenplattformprojekten ist - genau wie bei der Anwendungsentwicklung - Infrastructure as Code kein Luxus, sondern der Standard. Sie ermöglicht es Teams, die Bereitstellung von Infrastruktur auf konsistente, wiederholbare und skalierbare Weise zu definieren, zu versionieren und zu automatisieren.
IaC ist besonders wichtig bei Konfigurationen mit mehreren Umgebungen, bei denen dieselben Plattformkomponenten in Entwicklungs-, Test-, Staging- und Produktionsumgebungen mit minimaler Abweichung eingesetzt werden müssen. Ohne IaC wird die Aufrechterhaltung der Konsistenz zwischen Umgebungen fehleranfällig und zeitaufwändig, was sich direkt auf die Zuverlässigkeit und das Vertrauen in Ihre Daten-Workflows auswirkt.
Nichts beschleunigt die Entwicklung von Plattformen so sehr wie gut durchdachte, wiederverwendbare IaC-Module. Diese Module dienen als Bausteine für Ihre Architektur und ermöglichen es Teams, schnell eine sichere und konforme Infrastruktur aufzubauen, ohne das Rad jedes Mal neu erfinden zu müssen. Eine robuste Modulbibliothek fördert außerdem bewährte Verfahren, vereinfacht die Einarbeitung und ermöglicht schnellere Experimente und Iterationen.
Die Wahl der richtigen Tools für diese Aufgabe ist ebenso wichtig. Terraform ist im Azure-Ökosystem aufgrund seiner Flexibilität, der starken Unterstützung durch die Community und der breiten Akzeptanz eine beliebte Wahl. Alternativen wie Bicep oder Pulumi sind jedoch möglicherweise besser geeignet für Teams, die eine engere Azure-Integration wünschen oder vertraute Programmiersprachen nutzen möchten.
Schließlich geht es bei der Einführung von Infrastructure as Code nicht nur um Tools - es ist eine Denkweise. Es drängt die Teams standardmäßig zur Automatisierung, zum Testen und zur Dokumentation, was letztendlich zu einer höheren Plattformqualität, schnelleren Lieferzyklen und einer besseren Zusammenarbeit zwischen Daten- und DevOps-Teams führt.
Bevorzugte Tools? Wir sind große Fans von Terraform! Vor allem wegen seines Cloud-agnostischen Ansatzes und seines reichhaltigen Ökosystems von Anbietern, einschließlich der Unterstützung von Technologien wie Databricks und Snowflake. Für größere Einsätze empfehlen wir Terragrunt und Atlantis, um die Dinge reibungsloser zu verwalten.
CI/CD und Umweltstrategie
Keine moderne Datenplattform ist vollständig ohne einen gut definierten Entwicklungs- und Bereitstellungslebenszyklus. CI/CD-Verfahren, die einst der Anwendungsentwicklung vorbehalten waren, sind nun auch in der Welt der Datentechnik und -analyse unverzichtbar geworden. Alles beginnt mit klar definierten Umgebungen - Dev, Test und Prod - die jeweils von den anderen isoliert sind, um sichere Tests und vorhersehbare Releases zu ermöglichen. Ihre Verzweigungsstrategie sollte diese Struktur widerspiegeln (z. B. trunk-basiert, GitFlow usw.), unterstützt durch automatisierte Release-Pipelines.
Wie bereits erwähnt, spielen Infrastructure as Code-Tools wie Terraform eine wichtige Rolle in diesem Prozess. Sie stellen sicher, dass die Umgebungen konsistent, reproduzierbar und versionskontrolliert sind. Aber CI/CD hört nicht bei der Infrastruktur auf. Sie sollten auch darüber nachdenken, wie Sie die Bereitstellung von Notebooks, Workflows (z.B. Jobs oder Pipelines), Bibliotheken und sogar Berechtigungen automatisieren können. Unabhängig davon, ob Sie native Tools wie Databricks CLI, Asset Bundles oder benutzerdefinierte Skripte verwenden, gewährleistet die Automatisierung dieser Teile Qualität, Wiederholbarkeit und eine schnellere Bereitstellung in verschiedenen Umgebungen.
Und genau wie in den anderen Bereichen, die wir besprochen haben, sollten Ihre Bereitstellungspipelines eingerichtet sein, bevor jemand die erste Codezeile in die gemeinsamen Umgebungen überträgt. So stellen Sie sicher, dass Sie vom ersten Tag an einen standardisierten, zuverlässigen Entwicklungsprozess fördern und Konflikte, manuelle Korrekturen und unnötige Neuimplementierungen vermeiden.
Denken Sie daran - DevOps vom ersten Tag an! Es ist nicht nur ein Slogan, sondern eine Denkweise, die Ihnen hilft, mit Zuversicht und Klarheit zu skalieren.
Abschließende Überlegungen zur Datenplattform
Die Definition der Grundsätze und die Bewältigung der oben genannten Herausforderungen kann sich wie eine gewaltige Aufgabe anfühlen - und genau deshalb wird sie so oft auf spätere Phasen des Projekts verschoben. Und wenn wir Glück haben, werden diese Teile schließlich geliefert.
Aber wie können wir sie frühzeitig angehen, ohne das Projekt für Monate zu blockieren?
Ganz einfach: Finden Sie jemanden, der es schon einmal gemacht hat. Beim Aufbau einer Datenplattform müssen wir das Rad nicht immer wieder neu erfinden. In den meisten Fällen entstehen echte Geschäftsspezifität, Innovation und Differenzierung auf der Ebene der Datentechnik, Modellierung und Analyse - und nicht bei der Einrichtung der zugrunde liegenden Plattform. Die Plattform ist nur ein Werkzeug. Lassen Sie uns also auf bewährte Muster zurückgreifen, Lösungen verwenden, die funktionieren, und jemanden finden, der weiß, wie man die Teile zusammensetzt. Dann vertrauen Sie ihm, dass er es richtig macht - und lassen Sie den Rest des Teams sich darauf konzentrieren, echten Wert zu schaffen. Vom ersten Tag an.
Wenn Sie wissen möchten, wie wir in nur 8 Wochen eine durchgängige Datenplattform aufgebaut haben, sehen Sie sich hier unser Webinar mit Red Flag Alert an.
Unsere Ideen
Weitere Blogs
Contact



