Rockefeller University überwacht IT-Infrastruktur mit Checkmk

Wer ist die Rockefeller University?

Die Rockefeller University ist die weltweit führende Forschungsuniversität im Bereich Biomedizin. Die Einrichtung ist die Institution für Forscher:innen und Studierende aus aller Welt. Sie alle setzen sich für das gemeinsame Ziel der Universität ein: dem Dienst der Wissenschaft zum Wohle der Menschheit. Um dieser großen Herausforderung gerecht zu werden, bieten die Labore der Rockefeller University die neueste Technologie. Dadurch entsteht direkt vor den Toren New Yorks ein Mekka für Kultur und neue Ideen.

Logo der Rockefeller University

Wir brauchen ein Monitoring, mit dem wir reagieren können, bevor es zu ernsthaften Problemen kommt. Mit Checkmk haben wir es gefunden.

Icon Server-Monitoring

Das IT-Team muss neben den eigenen Rechenzentren die IT-Systeme von 85 Laboren und den darin arbeitenden Wissenschaftler:innen überwachen. Für den Erfolg der Universität ist das Monitoring daher sehr wichtig.

Icon Benachrichtigungen
Die zuvor eingesetzte Monitoring-Lösung, Nagios, verursachte über 800 E-Mail-Alerts täglich und war zudem aufwendig zu verwalten. Deshalb entschied sich die Rockefeller University für eine neue Monitoring-Lösung.
Icon Iot-Mmonitoring

Die Universität entschied sich im Jahre 2022 für den Wechsel zur Checkmk Enterprise Edition. Seitdem überwacht das IT-Team etwa 850 Hosts mit Checkmk.

Höchste Performance-Ansprüche

Die Rockefeller University ist eine der führenden Forschungseinrichtungen für biomedizinische Forschung. Seit der Gründung im Jahre 1901 brachte die Universität insgesamt 26 Nobelpreisträger:innen hervor.

Um heutzutage weiterhin Forschung auf so einem Spitzenniveau zu ermöglichen, ist eine funktionierende IT-Infrastruktur unabdingbar. Das IT-Team muss gewährleisten, dass alle Abteilungen jederzeit die nötigen IT-Ressourcen bekommen.

Da die Rockefeller University keine Bachelor-Abschlüsse anbietet und einen starken Fokus auf Forschung legt, besteht das Personal zum Großteil aus Wissenschaftler:innen. Die IT-Infrastruktur ist daher für eine Universität verhältnismäßig groß. Die meisten Hardware-Ressourcen hostet das IT-Team im Rechenzentrum der Universität. Es betreibt mehrere Server-Cluster mit mehr als 6.000 CPU-Kernen. Außerdem gehören zur IT-Infrastruktur auch die IT-Systeme des Universitätsklinikums, welches sich ebenfalls auf dem Campus befindet. Hinzu kommen die Systeme von über 50 Laboren aus mehreren Wissenschaftsbereichen, sowie einige Werkstätten.

Drei Forschende vor einem Bildschirm in einem Labor

Die Herausforderung

Die Rockefeller University muss die IT-Infrastruktur für mehrere Forschungslabore überwachen. Die ehemalige Monitoring-Lösung war veraltet und sendete eine große Menge an fehlerhaften Benachrichtigungen. Daher suchte das IT-Team nach einer neuen Lösung, die den hohen Performance-Anforderungen standhält, sinnvolle Alarmmeldungen versendet und ohne großen Aufwand nutzbar ist.

Der Kontakt und der Support von Checkmk sind großartig. Wir werden gut behandelt und sind mit Checkmk sehr zufrieden

In allen Bereichen erwarten die Nutzenden eine optimale IT-Performance. Das IT-Monitoring ist deshalb besonders wichtig für die Rockefeller University. Früher setzte man hier auf Nagios, die Lösung versendete aber zu viele falsche Alarmmeldungen und bot keine ausreichende Visibilität.

Eine Ärztin an einem Laptop

Im Jahr 2022 entschied sich das IT-Team für den Wechsel zur Checkmk Enterprise Edition. Zuvor hat es bereits Erfahrung mit der Checkmk Raw Edition gesammelt. Die zusätzlichen Enterprise-Features erlauben es, die Monitoring-Daten besser zu nutzen und proaktiver zu agieren

Checkmk überwacht sämtliche Systeme im Rechenzentrum und in den verschiedenen Netzwerken. Dazu gehören beispielsweise Enterprise-Applikationen, Server, Switches und Storage. Im Monitoring befinden sich über 850 Hosts mit etwa 17.000 Monitoring-Services. Die Installation von Checkmk war einfach. Im Laufe der Jahre hat das IT-Team eigene Monitoring-Plugins für Nagios geschrieben, allerdings überwacht die Rockefeller University mittlerweile die meisten Systeme mit den offiziellen Checkmk Plugins.

Die Lösung

Seit 2022 setzt die Rockefeller University auf die Checkmk Enterprise Edition, und beendete damit die Alarmmüdigkeit des IT-Teams. Heute nutzen mehrere Teams Checkmk, um sämtliche Systeme auf dem Campus, das gesamte Netzwerk und die eigenen Rechenzentren zu überwachen

Mehr Transparenz und einfachere Kommunikation

Der größte Vorteil von Checkmk sind aber die einzigartigen Einblicke, die es liefert. Alle Nutzer:innen haben Leserechte für sämtliche Hosts im Monitoring. Dadurch gibt es eine gemeinsame Informationsbasis und die Möglichkeit, bei Problemen Zusammenhänge schnell zu erkennen.

Zudem kann jede Abteilung die Überwachung Ihrer Systeme auf die eigenen Anforderungen anpassen. Checkmk bringt hierfür eine granular anpassbare Zugangsberechtigung mit. Die Monitoring-Verantwortlichen können Administrationsrechte für unterschiedliche Nutzergruppen einfach über Ordnerstrukturen verwalten. Dadurch profitieren zum Beispiel der Help-Desk oder das IT-Security-Team, da sie ihre Hosts selbstständig prüfen können.

Aus Sicht der Rockefeller University hat Checkmk die Erwartungen in jeder Beziehung erfüllt. Die Zahl an Support-Anfragen ist seit der Einführung von Checkmk merklich zurückgegangen. Das IT-Team hat jetzt mehr Zeit und kann sich auf andere Themen fokussieren.

Picture of the Rockefeller University from the riverside

Checkmk kann Daten über lange Zeiträume speichern. Das erlaubt uns, die Auswirkungen von Veränderungen zu verstehen. Wir können Kausalitäten genau zurückverfolgen und gewinnen so präzise Einblicke in unsere IT-Infrastruktur und unsere Geschäftsprozesse.

Die Vorteile

Dank Checkmk hat das IT-Team deutlich weniger Aufwand mit dem IT-Monitoring. Die Benachrichtigungen sind präzise und informieren die richtigen Personen umgehend, sodass diese direkt in der Lage sind, passende Maßnahmen einzuleiten. Zudem kann das IT-Team mit Checkmk Echtzeit-Daten erfassen und speichern, um proaktiv zu agieren. Damit ist es in der Lage, Probleme zu lösen, bevor sie eine Auswirkung auf die Performance der IT haben.

Diese Case Study jetzt herunterladen

Jetzt herunterladen