Routingprobleme beim Standort rh-tec

Posted by daniel on Saturday, January 31, 2015

tl;dr: Hardware-Probleme bei rh-tec haben dazu geführt, dass ein Router Pakete verworfen hat. Anfänglich sah es nach einem Problem aus, das nur Telekom-Kunden betroffen hat. Gegen Mittag breitete sich das auf andere Provider aus, so dass sämtliche Hosts bei rh-tec stellenweise nicht zuverlässig erreichbar waren. rh-tec hat das Problem inzwischen gelöst.

Wir haben seit heute früh eine große Zahl an Störungsmeldungen bezüglich der Nichterreichbarkeit von Servern erhalten. Allerdings stammten diese Meldungen weit überwiegend von Usern aus dem Netz der Telekom (DTAG), während die Erreichbarkeit der Server über andere Zugangsprovider in der Regel nicht betroffen schien. Einzelne Meldungen betrafen zwar auch unter anderem o2, Kabel Deutschland oder Unitymedia; es gab aber auch viele User bei eben jenen Providern, die eine problemlose Erreichbarkeit bestätigten.

Es geht derzeit auch nur um Server im Netzbereich 95.143.172.0/24; Server in den Netzbereichen 82.98.82.0/24, 82.98.87.0/24 (jeweils Plusline) und 185.26.156.0/24 (uvensys) sind nicht betroffen.

Wir haben bereits vor Stunden direkt bei erstem Bekanntwerden von Problemen ein entsprechendes Störungsticket beim betreffenden Rechenzentrum aufgemacht und inzwischen auch mehrmals mit dem schichthabenden Netzwerk-Admin telefoniert. Jener bestätigte uns, dass nach derzeitigem Kenntnisstand derzeit keine Probleme auf seiten des Rechenzentrums vorlägen, dass er aber erkennen könne, dass insbesondere Traffic aus dem Telekom-DSL-Pool beeinträchtigt sei. Inzwischen wissen wir, dass rh-tec ein Hardware-Problem als Ursache für die Ausfälle identifiziert hat, welches zu erheblichen Paketverlusten geführt hat. Der defekte Router wurde inzwischen isoliert. Seit ca. 13:20 konnten wir keine weiteren Störungen mehr feststellen.