Webwatch Anleitung
About Webwatch:
Webwatch ermöglicht die vernetzte Überwachung von x-beliebigen Internet Services - daher der Namen.
Webwatch besteht aus einem Netzwerk aus sogenanten "Slaves" die Daten bezüglich eines oder mehrerer "Targets "an den zentralen "Master" liefern.
Der Ausfall eines Slaves führt nicht zu einer Überwachungsunterbrechung und wirkt sich daher nicht auf das Ergebnis aus.
Slaves:
Die Erfassung der Daten bezüglich eines "Target" erfolgt nach best. versetzten Zeitintervallen und sorgt so für eine lückenlose Überwachung.
Ablauf:
1. Versuch zu pingen --> Messen der Antwortzeit (Rechner überhaupt am Netz ?)
2. Kommunikation mit Services am Target--> Funktionstest (= Standadisierter Test: Http Request) --> Rensponsetime
3. daten werden in gewissen versetzten Zeitintervallen zum Master gesendet, akkumuliert und ausgewertet.
Logdaten und deren Auswertung:
Ausgeworfene Logs beinhalten 3 Ereignisse
1. Service "ON/OFF": Der Wechsel des Status wird im Log aufgezeichnet.
2. System reachable/unreachable: Bezieht sich auf die Pingbarkeit
3. Aufzeichnung falls Slaves von sich aus einen tracroute durchführen.
Erfolgt wenn weder das Service erreichbar ist, bzw Target nicht pingbar ist und der Slave erkennt, daß er selber aber sehrwohl online ist
Timout für Service ist mit 20 sec festgesetzt -->
antwortet das system nicht innerhalb der Zeit weiß man,
das das service nicht online ist.
Zusätzliche Logarten.
1. "Tempfail" (einzelabfrage gescheitert - Paketloss) eher überlast als ausfall
2. Target ist nicht pingbar ist (3 aufeinander folgende pings) Bei Häufung könnte es zu probleme kommen. dh. aber nicht offline aber auch nicht 100 erreichbar
3. "Checkpoint" (00:00 jeden Tag), findet einmal am Tag statt. Beinhaltet die durchschnittlichen, minimalen und max Responsezeiten für Service und Pingzeiten des speziellen Tages.
Zusatzinfos zu Logeinträgen:
Bei "tempfail" wird die Adresse des "Slaves", der das Problem festgestellt hat, aufgezeichnet.
Bei Service "OFF" und "Nicht-Erreichbarkeit" wird die durchschnittliche, min. und max. Pingzeit und Antwortzeit des Services seit dem letzen Ausfall aufgezeichnet .
Definition eines Ausfalles:
Ein Ausfall wird bzgl. Erreichbarkeit und Services getrennt ausgewertet.
Als solcher wird gewertet, wenn der selbe Slave zweimal hintereinander das Service nicht abrufen kann und den Target nicht pingen kann, und dies auch durch keinen anderen Slave erfolgreich absolviert wurde.
In jedem anderem Fall handelt es sich um ein Netzwerkproblem, das nicht mit dem Service zu tun hat.
Die größte Ausfallszeit, die max nicht detektiert wird ist das doppelte Überwachungsinterwall.
Das Überwachunsintervall wird individuell eingestellt und ist vom Kunden abhängig.
Wenn das System wieder erreichbar ist bzw. das Service wieder aktiv ist, dann wird die Ausfallslänge in sec aufgezeichnet.
Passwot ändern:
Hier ist das Ändern des eigenen Passworts für Zugriff auf Webwatch möglich.
Administration:
"ADD USER" erlaubt das Hinzufügen von neuen Benutzern.
Hierbei wird festgelegt auf welche Server "Targets" der User Zugriff hat, ob er administrative Rechte hat. Nur User mit Administratoven Rechten habe Zugriff auf den Menupunkt Administration.
"Delete User" erlaubt das entfernen eines bereits angelegten Users.
"List User" wirft eine Liste angelegter User aus.
"Modify User" erlaubt das änder verschiedenster Userattribute.
|