We houden alles altijd in de gaten
Geplaatst op 15-06-2017
Geplaatst op 15-06-2017
Net als onze klanten hebben we echt een diepgewortelde hekel aan storingen. Uitval van servers zorgt voor veel overlast, klanten die niet kunnen werken en bezoekers welke hun favoriete website niet kunnen benaderen. Daarom houden we alles 24 uur per dag en 7 dagen per week alles continu in de gaten.
Dit doen we met behulp van ons eigen monitoringsysteem in combinatie met een over meerdere datacenters verspreid Observium cluster. Servers worden elke minuut gecheckt op ruim 80 verschillende punten waaronder belasting, processor en geheugen verbruik, beschikbare opslagruimte, netwerkbelasting en service status.
Het verzamelen van al deze data zorgt er niet alleen voor dat wij het op elk moment van de dag direct weten zodra er een storing is ontstaan maar ook dat we in veel gevallen preventief/proactief kunnen ingrijpen om storingen te voorkomen. Vooral dit laatste is iets waar we de afgelopen jaren zeer goed in zijn geworden.
Bijvoorbeeld: Ons monitoringsysteem detecteert dat de /home partitie van een server op een sneller tempo dan normaal volloopt, medewerkers ontvangen dan een melding, loggen in op de server en onderzoeken hoe dit komt. Het probleem kan dan verholpen worden of de opslagruimte kan worden uitgebreid voordat deze vol is.
Een ander voorbeeld is: Ons monitoringsysteem waarschuwt ons dat de gemiddelde belasting van een server - processor en geheugen verbruik, opslagruimte I/O - de afgelopen tijd is toegenomen of dat de server ongewoon wordt belast, we kunnen het probleem dan onderzoeken en oplossen voordat er een storing ontstaan.
“Voorkomen is beter dan genezen”, als wij preventief/proactief ingrijpen merkt de klant er niets van en blijft alles werken. Dat is overduidelijk beter dan een storing proberen op te lossen nadat deze al is ontstaan. Ons monitoringsysteem en Observium cluster is verspreid over 8 Nederlandse, Belgische en Duitse datacenters.
Als je zo’n gigantische data in de gaten houdt heb je ook veel capaciteit nodig om al deze data te kunnen verwerken, daarom hebben alle monitoring servers een hexa core processor, 24 GB DDR3 RAM en zijn ze voorzien van SSD opslag. Meer dan voldoende rekenkracht om snel tot resultaten te komen en meldingen te versturen.
Uiteraard wordt het monitoringsysteem ook elke minuut vanaf een andere locatie door ons in de gaten gehouden, mocht daar wat misgaan dan gaan de alarmbellen af en zal er direct worden ingegrepen. Zolang er niet meer dan 6 locaties “stuk” gaan binnen ons monitoringplatform blijft deze gewoon werken!
Geplaatst op 26-10-2024
Geplaatst op 19-10-2024
Geplaatst op 13-10-2024
Geplaatst op 01-08-2024
Geplaatst op 28-05-2024
Geplaatst op 19-03-2024