Blog

Überwachen Sie Ihren Mesos-Cluster mit StackState

Cristiana

Aktualisiert Oktober 21, 2025
4 Minuten
Dieser Beitrag ist Teil 2 einer 4-teiligen Serie über Container Monitoring. In Beitrag 1 ging es um einige der neuen Herausforderungen, die Container und Microservices mit sich bringen, und um die Informationen, auf die Sie sich konzentrieren sollten. Dieser Artikel beschreibt, wie Sie Ihren Mesos-Cluster überwachen können. Apache Mesos ist ein Kernel für verteilte Systeme, der das Herzstück von Mesosphere DC/OS bildet und für den Betrieb in sehr großem Maßstab konzipiert ist. Er abstrahiert das gesamte Rechenzentrum in einen einzigen Pool von Rechenressourcen und vereinfacht so den Betrieb verteilter Systeme in großem Maßstab. Mesos unterstützt verschiedene Arten von Workloads, um eine wirklich moderne Anwendung aufzubauen. Zu diesen verteilten Arbeitslasten gehören Container-Orchestrierung (wie Mesos-Container, Docker und Kubernetes), Analytik(Spark), Big Data-Technologien(Kafka und Cassandra) und vieles mehr. Herausforderung bei der Mesos-Überwachung Mesos kann Ihnen dabei helfen, Ressourcen von Ihrem Cluster zu den kritischen Anwendungen zu verschieben, die sie benötigen, aber zu verstehen, was in Ihrem Mesos-Cluster passiert, kann eine Herausforderung sein. Eine der wichtigsten (und am meisten gehassten) Aufgaben im Systembereich ist die Fehlersuche. Trotz all Ihrer Erfahrung und Ihres Wissens werden Systeme kaputt gehen. Mit der Containerisierung Ihrer Landschaft ist es sogar noch wichtiger zu wissen, wo man nachschauen muss, um herauszufinden, was ausfällt und wie es sich auf kritische Dienste auswirkt. In einer typischen Mesos-Umgebung führen Sie mehrere Dienste wie Marathon (Container-Orchestrierung), Docker und verteilte Anwendungen wie HBase, MongoDB und Spark aus. Ihre Aufgaben sind von diesen Diensten und voneinander abhängig. StackState hilft Ihnen, diese Abhängigkeiten zu verstehen und zu überwachen. All diese Technologien erzeugen unterschiedliche Arten von Metriken. Es ist nicht effizient, jede Technologiekomponente Ihres Clusters mit einem anderen Tool zu überwachen und zu kontrollieren. Wenn ein Container plötzlich ausfällt, erhalten Sie eine Flut von Warnmeldungen. Eine endlose Fehlersuche wird folgen. Wie werden Sie mit dieser Herausforderung fertig? Überwachen Sie Mesos mit StackState StackState macht es Ihnen leicht, eine Vielzahl relevanter Metriken und Prüfungen von Ihrem Mesos-Master, seinen Slaves und Tasks zu aggregieren. Stellen Sie StackState einfach den Mesos-API-Endpunkt zur Verfügung oder installieren Sie den Agenten. In dem folgenden Beispiel zeigen wir eine Visualisierung einer containerisierten Umgebung. Sie zeigt den Gesundheitszustand der einzelnen Komponenten und die ihnen zugrunde liegenden Abhängigkeiten. Wenn etwas nicht funktioniert, sehen Sie sofort die Ursache für das Problem. Eingefügtes Bild bei 2017_03_22 10_38 AM.png StackState ist auch in der Lage, Protokolldateien und relevante Ereignisse zu analysieren. Dies hilft Ihnen, die Ursache von Problemen schnell zu untersuchen. In dem folgenden Beispiel sehen Sie einige langsame Abfragen einer Datenbank, die auf Mesos läuft. Eingefügtes Bild bei 2017_03_22 11_13 AM.png StackState zeigt und überwacht nicht nur alle Ihre Abhängigkeiten, sondern verfügt auch über fortschrittliche Analysefunktionen, die Ihnen die Möglichkeit bieten, Schlussfolgerungen über das gesamte Modell Ihres IT-Stacks zu ziehen. So können Sie z.B. eine Abfrage darüber durchführen, welche Mesos-Batch-Aufgabe nicht rechtzeitig fertig wird und Ihre primären Geschäftsprozesse beeinträchtigen könnte. So ist z.B. die rechtzeitige Berechnung der richtigen Zinsen jeden Tag (ETA 8:00 Uhr) ein wichtiger Prozess, der nicht wegen eines einzigen Jobs, der zu viel Zeit in Anspruch genommen hat, scheitern sollte. StackState wird Sie benachrichtigen, wenn Probleme auftreten. Schlussfolgerung Die Verbindung von Mesos mit StackState bietet die Möglichkeit,:
  • Visualisieren Sie die Leistung Ihres Mesos-Clusters
  • Korrelieren Sie die Leistung von Mesos mit dem Rest Ihrer Anwendungen
  • Alle Aufgaben finden (einschließlich Container)
  • Korrelieren Sie alle Aufgaben (basierend auf der Konnektivität zwischen ihnen)
  • Bericht der Metriken für einen Mesos-Slave und -Master
  • Korrelieren Sie alle in Mesos ausgeführten Dienste mit anderen Komponenten in Ihrem IT-Stack
  • Analysieren Sie Anwendungs- oder Dienstprotokolle, um relevante Ereignisse zu extrahieren und an StackState zu übermitteln.
  • Big Data Graph-Analysen
StackState bietet alle fortschrittlichen Funktionen, die Sie für die Überwachung Ihrer containerisierten Umgebung benötigen, einschließlich automatischer Service-Erkennung, Ursachenanalyse, Erkennung von Anomalien und der Korrelation von Metriken, Protokollen und Ereignissen an einem Ort. Fordern Sie gleich hier eine Testversion an und setzen Sie sich mit dem StackState-Team in Verbindung!

Verfasst von

Cristiana

Some bio goes here

Contact

Let’s discuss how we can support your journey.