Kundengeschichten

MN implementiert Ausfallsicherheit für Windows-Workloads

MN verfügt nun über eine vollständig automatisierte Lösung für seine kritischen Arbeitslasten. Dies verbessert die Erfolgschancen in einem echten Katastrophenszenario erheblich und verkürzt die Zeit bis zur Wiederherstellung der Serviceverfügbarkeit erheblich.


MN Pensioen ist ein niederländischer Finanzdienstleister, der sich auf betriebliche und branchenweite Pensionsfonds und Investitionen spezialisiert hat. Das Unternehmen verwaltet ein Pensionsvermögen von über 175 Milliarden Euro und betreut zwei Millionen Menschen in der Metall-, Technologie- und Automobilbranche. Verantwortungsbewusstes Investieren ist das Kernstück von MN, das ein ökologisches, soziales und Governance (ESG) Geschäftsmodell verfolgt. Die treuhänderische Analyse, Verwaltung und Kommunikation machen einen großen Teil der Dienstleistungen von MN aus. Sie verwalten auch Einkommensversicherungen und arbeiten mit Forschungs- und Entwicklungsfonds und Sozialfonds in ihren jeweiligen Branchen zusammen. MN hat seinen Hauptsitz in Den Haag und verfügt über fünf Geschäftseinheiten.

Verbessern Sie die Widerstandsfähigkeit und Notfallwiederherstellung, um die Geschäftskontinuität zu gewährleisten.

Warum

Implementierung von automatischen Failover-Diensten auf AWS

Was

Migration von Anwendungen zu AWS und Nutzung nativer Cloud-Services

Wie

Die Herausforderung

MN Pensioen bat Xebia, sie bei der Migration ihrer Windows-basierten Arbeitslasten vom Rechenzentrum ihres Outsourcers zu AWS zu unterstützen. Aus zeitlichen Gründen (die Migration musste vor dem Auslaufen des Outsourcing-Vertrags abgeschlossen sein) und aus technischen Gründen wurden die Anwendungen weitgehend so migriert, wie sie waren, mit begrenzten Anpassungen für den Betrieb auf AWS. Dieser Migrationsansatz verkürzt zwar die Vorlaufzeit für die Migration, schöpft aber nicht die vollen Möglichkeiten und den Wert von AWS aus. MN Pensioen bat Xebia, der Geschäftskontinuität und Ausfallsicherheit für diese Arbeitslasten Priorität einzuräumen, ohne sich auf die manuellen Prozesse verlassen zu können, die das vorherige Outsourcing-Unternehmen zur Verfügung stellte.


Die Lösung

Die meisten in Rechenzentren gehosteten Anwendungen waren nicht in der Lage, aktiv-aktiv über zwei oder mehr Availability Zones zu laufen. Eine solche Umstrukturierung war aus Kostengründen und wegen des begrenzten Zeitrahmens nicht möglich, und in einigen Fällen besaß MN den Quellcode nicht.

Design
Xebia optimierte die Architektur, indem es Ausfallsicherheitsfunktionen implementierte und gleichzeitig mit den gegebenen Einschränkungen arbeitete. Das Ergebnis ist eine Lösung mit tiefgreifenden Abhilfemaßnahmen. Ein Beispiel: Um den Ausfall eines einzelnen EC2-Hosts zu beheben, ist es nicht notwendig, einen vollständigen Failover in ein anderes Rechenzentrum durchzuführen. Ein Neustart der ausgefallenen EC2-Instanz auf einem anderen EC2-Host in derselben Region hat weniger Auswirkungen (Zeit für die Wiederherstellung, Änderungen an beweglichen Teilen usw.). Der Neustart in der gleichen AZ (Availability Zone) erfolgt oft innerhalb von Minuten und erfordert keine weiteren Änderungen oder manuellen Eingriffe.

Betrieb
Dieses neue Lösungsdesign erfordert auch neue Fähigkeiten, Prozesse und Fertigkeiten für den Betrieb der Umgebung. Xebia arbeitete mit dem Kunden zusammen, um seine Arbeitsweise mit AWS anzupassen und zu verbessern. Das Ergebnis sind aktualisierte Prozesse und Verfahren, die zu einem höheren Automatisierungsgrad und weniger manuellen Eingriffen führen. Die MN-Mitarbeiter wurden von Xebia auch für den täglichen Betrieb und den Betrieb bei einem Failover geschult.

Wiederherstellung
Um sich von einem (seltenen) Ausfall einer gesamten AZ zu erholen, implementierte Xebia AWS Backup für nicht kritische Anwendungen, bei denen viel Zeit für die Wiederherstellung in einer zweiten AZ zur Verfügung steht. Für kritische Anwendungen implementierte Xebia eine Kombination aus täglichen Backups und kontinuierlicher Replikation unter Verwendung von AWS Elastic Disaster Recovery Service (AWS DRS). Die implementierten technischen Kontrollen sind auf die Geschäftsanforderungen abgestimmt, um die Kosten mit den Anforderungen in Einklang zu bringen.

Eine wirklich widerstandsfähige Architektur 

Wo in der Vergangenheit ein Failover aufgrund eines Ausfalls des Rechenzentrums viele manuelle Eingriffe erforderte, verfügt MN jetzt über eine vollständig automatisierte Lösung für seine kritischen Workloads. Dadurch werden die Erfolgschancen in einem realen Katastrophenszenario erheblich verbessert und die Zeit bis zur Wiederherstellung der Serviceverfügbarkeit deutlich verkürzt, so dass die IT-Abteilung die SLA für diese Anwendungen für das Unternehmen verbessern kann. Auch das Testen der Disaster Recovery wird verbessert. In der Vergangenheit war dies eine stressige Situation, da innerhalb des Zeitrahmens eines einzigen Wochenendes sowohl ein Failover zu den DR-Rechenzentren des Outsourcers als auch ein Failback zum Hauptproduktionsstandort durchgeführt werden musste. Aufgrund der erforderlichen Replikationszeiten war dies immer eine Herausforderung und ließ wenig Spielraum für Fehler.

Mit der neuen Lösung wird das Failover auf eine alternative AWS Availability Zone durchgeführt. Sobald diese erfolgreich ist, wird sie zum neuen Produktionsstandort erklärt, so dass kein Failback erforderlich ist.

Contact

Let’s discuss how we can support your journey.