Performance des Hosts Sirius in den letzten Tagen

Posted by luto on Friday, June 24, 2016

Wie eine Hand voll User bemerkt haben, lief es in den letzten Tagen auf dem Host “Sirius” nicht ganz so rund, wie wir es selbst gerne hätten. Konkret hatten wir dort seit Dienstag Mittag mit einer erhöhten Load- und I/O-Werten zu kämpfen.

Wir möchten hier bei den betroffenen Sirius-Ubernauten um Entschuldigung bitten, euch erzählen warum das überhaupt der Fall war und auch ein bisschen darüber aufklären, wie wir im Allgemeinen mit solchen Problemen umgehen.

In unserem Monitoring sah die Lastsituation so aus:

Die CPU-Auslastung (in grün/blau) ab Dienstag Mittag war demnach rund doppelt so hoch wie in den Tagen davor. Auch das Plattensystem (in lila) hatte weit mehr zu tun, als normalerweise, sodass Prozesse auf ihre Daten warten mussten.

Kurze Zeit später klar war, dass es sich dabei nicht um einen Spike im Stundenbereich handelt - wie er zum Beispiel vorkommt, wenn es mal ein User auf Hackernews, reddit o.A. schafft - sondern um eine langfristige Änderung der Auslastung, die sich recht klar auf eine einzelne Seite eingrenzen ließ. Wir haben mit dem User Kontakt aufgenommen und nach kurzem Mailwechsel hat er selbst vorgeschlagen die Seite in den nächsten 24 Stunden auf einen eigenen Server umzuziehen.

Am Donnerstag um circa 18:30 stoppten dann auch die Zugriffe auf den fraglichen Uberspace.

Solange ein Uberspace den Server nicht in den Abgrund reißt, versuchen wir zusammen mit dem User eine Lösung zu finden, indem dieser z.B. einen CDN-Anbieter vorschaltet oder wir Teile der Seite deaktivieren. Eine Seite komplett zu deaktivieren ist immer nur der letzte Ausweg, wenn wir die Auslastung des Servers gar nicht anders in den Griff bekommen. Dass eine Situation wie diese über mehrere Tage hinweg anhält, ist aber eher die Ausnahme.