Wartungsarbeiten 9.10.2012 zwischen 22 und 24 Uhr - 1. Update

Wir planen morgen am Dienstag, den 9.10.2012 zwischen 22 und 24 Uhr endlich den Austausch des fehlerhaften Switches vorzunehmen.

Dazu werden wir folgende Schritte ausführen:

  • Umstellung der Stromversorgung auf eine modernere Infrastruktur im letzten ausstehenden Rack abschließen
  • Unseren Standby-Switch neben dem fehlerhaften Switch montieren und auf Funktion prüfen
  • Die bestehenden Netzwerkverbindungen vom fehlerhaften Switch auf das Ersatzgerät umziehen
  • Einen neuen Ersatzswitch montieren
Da unsere Switches nicht mit einem redundanten Netzteil ausgestattet sind wird es bei der Umstellung der Stromzufuhr für einen Netzwerkausfall im gesamten Cluster von etwa 1-2 Minuten kommen. Wir erwarten keine Fehler aus dieser Operation aber bestehende Verbindungen werden für diesen Zeitraum hängen.

Außerdem werden beim Umzug der Kabel aus dem fehlerhaften Switch jeweils kurze Hänger der betroffenen Dienste zu spüren sein, jedoch keine Ausfälle erwartet.

Wir entschuldigen uns, dass die Umsetzung dieser vorbeugenden Maßnahme sich so lange hingezogen hat. Wir hoffen, dass unsere Entscheidungen in Ihrem Interesse sind und sorgfältiges, kleinschrittiges Vorgehen Ihren Betriebsansprüchen an eine stabile und gepflegte Umgebung gerecht wird.


Update 1 [9.10.2012 23:32]

Der defekte Switch wurde (endlich) ausgetauscht. In einem Zeitraum von etwa 5 Minuten gab es Störungen bei Teilen der Außenanbindung, da die redundanten Router in einen inkonsistenten Zustand geraten waren. Alle anderen Unterbrechungen waren planmäßig kurz und ohne weitere Auswirkungen auf den Betrieb.