Management Server

Wie gut geht es meinem Computer und meiner IT Infrastruktur? Gibt es Probleme? Oder stehen die kurz bevor ?

Wie mit unseren eigenen Wehwehchen

verhält es sich auch bei den Rechnern und dem Netzwerk, mit dem wir jeden Tag arbeiten. Wir gehen zum Arzt weil
  • •wir akute Beschwerden haben
  • weil wir vorbeugen wollen

Akute Beschwerden

merken wir und teilen dies auch mit . Rechner tun das auch. Sogar die Netzwerke können das. Ihr Sprachrohr nennt sich Ereignisprotokoll, Systemtagebuch oder im Fachjargon: Syslog.

Jeder Rechner schreibt ein Syslog. Da dieses Syslog jedoch standardmäßig lokal auf dem Rechner gespeichert wird, bemerkt das kein anderer (Rechner). Die Flut der Meldungen, die in diesem Syslog erscheinen hängt mit der Qualität heutiger Programme zusammen. Es wird viel zu viel und vor allem unqualifiziert geloggt. Die Ursache hierfür liegt teilweise darin begründet, dass die Entwickler unserer Programme keine Programmierer im Sinne der Pioniere aus der Anfangszeit der Computer- und Netzwerktechnologie mehr sind. Heute werden die Programme mit so genannten CASE Tools entwickelt, die dem Entwickler scheinbar sehr viel Arbeit abnehmen. Hochgezüchtete Programmiersprachen wie zum Beispiel JAVA tun das Ihre dazu, denn auch sie versuchen den Programmentwickler weitestgehend zu entlasten. Das Problem ist nur, dass Fehlerbehandlungen nun viel generischer sind und nicht mehr gezielt ein Problem umschiffen, es beheben oder zumindest aussagekräftig protokollieren können.

Spurensuche

Die Folge hieraus ist, dass die Einträge im Syslog zum Teil nicht mehr einzeln, als singulären Hinweis darauf, was schief läuft gesehen werden können, sondern dass viele Einträge in den Logs erst das Gesamtbild eines Fehlerzustandes ergeben. Sie sind im Zusammenhang zu sehen und zu interpretieren. Effizient die Meldungen aus einem ganzen Netzwerk interpretieren zu können, setzt voraus, sie alle zentral zu sammeln. Die meisten Rechner, Router, Switches und sonstige Elemente in den Netzwerken unterstützen uns dabei. Sie bieten die Möglichkeit an, das Syslog nicht lokal, sondern auf einem anderen Rechner im Netzwerk abzulegen, dem Syslog-Server. Damit das funktioniert, läuft auf dem Syslog-Server ein Programm, das alle Meldungen aus dem Netzwerk entgegen nimmt, sie vorsortiert und in unterschiedlichen Dateien, sortiert nach dem Datum, ablegt. Das Programm sorgt darüber hinaus dafür, dass diese Dateien nicht zu groß werden und archiviert sie daher turnusmäßig.

Auf dem Syslog-Server läuft jedoch noch ein weiteres Programm, das diese Dateien auswertet und mit einer Datenbank vergleicht. Bekannte unwichtige Meldungen werden direkt aussortiert, der Rest weiter sortiert, bewertet und in einen Zusammenhang gebracht. Daraus ergeben sich dann die Ursachen für das beobachtete Fehlverhalten,die der Syslog-Server dann dem Netzwerk-Administrator weitermelden kann. Die Fehlermeldungen die nicht zugeordnet werden können sammelt der Syslog-Server und speichert sie ab. Es ergibt sich eine Datensammlung, auf Basis derer die Know-How Datenbank des Syslog-Servers später einmal erweitert werden kann. Gegebenenfalls können ja Zusammenhänge mit ganz anderen Daten hergestellt werden, nämlich mit denen, die gesammelt werden, um Fehlerzuständen vorzubeugen.

Vorsorge:

Die Rechner in unserem Netzwerk und dem Netzwerk selber werden in kurzen Abständen zur Vorsorge ?untersucht? und die Ergebnisse gesammelt und gespeichert. Hierbei entsteht ein großes Zahlenwerk, das der Systemverwalter interpretieren kann und heraus kommt der Gesamt-Gesundheitszustand des untersuchten Servers zum einen, aber auch spezielle Indikationen ganz bestimmter Fehler oder solcher die sich anbahnen. Diese Art der Datenerhebung im Netzwerk wird aus diesem Grund auch 'proaktiv' genannt.

Ein ganzes Netz

Die Flut der gesammelten Daten muss vorsortiert werden. An manche Daten kommt ein zentraler Server aufgrund der Segmentierung des Netzwerkes gar nicht direkt heran. Hier bedient sich dieser zentrale Server einem ganzen Netz von Helfern, den so genannten Agenten. Agenten, das sind Server im Netzwerk, auf denen Hilfsprogramme laufen. Diese sammeln Daten in ihrem Netzwerksegment, nehmen teilweise eine Vorabbewertung vor und senden das Ergebnis zum zentralen Server.

Anamnese

Die Syslogmeldungen und die Ergebnisse der proaktiven Untersuchungen geben nur eine Momentaufnahme des Netzwerk- oder Serverzustandes wieder. Oft reicht das aber nicht aus. Die Historie der aufgenommenen Daten lässt bei Netzwerken und Computern Rückschlüsse darauf ziehen, ob ein angebliches Fehlerbild tatsächlich ein solches ist und wenn ja, ob mit einer Verschlimmerung oder Verbesserung zu rechnen ist. Oftmals ist es sogar möglich hochzurechnen, wann die Ressourcen eines Rechners oder Netzwerkes nicht mehr dazu ausreichen, den geplanten Zweck zu erfüllen - und daraus dann vorherzusagen, mit welchen Fehlerbildern in der nächsten Zukunft zu rechnen ist.

Network Management

Die Verwaltung eines Netzes unterteilt sich im Wesentlichen in die vier Kategorien
  • Problem Management
  • Change Management
  • Incident Management
  • Capacity Management
und einige weitere eher organisatorische Aufgaben, wie zum Beispiel die Verwaltung von Wartungsverträgen und Softwarelizenzen.

Der Strawberry Management Server

etabliert ein Instrument im Netzwerk mit dem all die oben genannten Tätigkeiten ausgeführt oder zumindest unterstützt werden können. Er besteht aus
  • einem Syslog-Server
  • einem Logfile Analyzer
  • einem Network Management System, das proaktive Messungen durchführt und die festgestellten Einzelzustände verwaltet
  • einer graphischen Visualisierung historischer Messwerte
  • einem Alarm Management System, das im Fehlerfall die zuständigen Systemverwalter informiert.
Eine grafische, Web-basierende grafische Benutzeroberfläche steht zur Verfügung, um die vielen Funktionen des Management konfigurieren und abfragen zu können.

Der Strawberry Management Server stellt das Schaufenster auf das Netzwerk dar. Es ist von hoher Bedeutung, dass auf diesen Server auch dann noch Verlass ist, wenn große Teile des Netzwerkes bereits ausgefallen sind. Strawberry setzt daher gerade bei dem Management Server auf hoch zuverlässige Hardware und auf eines der verlässlichsten Betriebssysteme, das uns heute zur Verfügung steht.

Leistungsgrenzen

Die Leistungsfähigkeit des Strawberry Management Servers wird definiert durch die Performance der eingesetzten Hardware zum einem, durch die Anzahl der überwachten Einzelkomponenten zum anderen. Reicht die Leistungsfähigkeit eines Servers für beides nicht mehr aus, so ist es möglich, den Server in einen Rechnerverbund aufzuteilen, bei dem Datenerfassung und Auswertung durch getrennte Komponenten übernommen werden. Auch der Einsatz von Agenten kann genutzt werden, um den Management Server weiter zu entlasten.

Dimensionierung und Anpassungen

Die Überwachung eines Netzwerkes ist eine hoch individuelle Tätigkeit, die auf das einzelne zu überwachende Netzwerk angepasst werden muss.

Strawberry steht Ihnen bei der Planung, Dimensionierung und Implementierung eines Network-Management Systems für Ihr Netzwerk zur Seite. Auch beim späteren Betrieb des Systems, bei Anpassungen oder der Erweiterung der Know-How-Basis bietet Ihnen Strawberry seine Dienste an.

Bei Umsetzung des Network Management Systems setzt Strawberry auf das leitungsstarke, flexibel einzusetzende Instrument Strawberry Management Server.