Ausfall einiger VMs am 5.9.2011 zwischen 16:25 und 17:00 MESZ


Leider gab es gestern (5.9.2011) zwischen 16:25 und 17:00 MESZ einen Ausfall einiger virtueller Maschinen, da deren Festplatten in den "Read-Only"-Modus umgeschaltet haben.

Um die Störung schnell zu beheben haben wir die betroffenen VMs hart beendet und den dazugehörigen KVM-Server neugestartet. Die VMs waren nach dem Neustart wieder regulär verfügbar.

Die Kunden der betroffenen VMs wurden individuell direkt nach dem Zwischenfall benachrichtigt.

Unsere bisherige Analyse hat ergeben, dass es sich um einen Fehler in unserem iSCSI-Konfigurationscode handelt, der bewirkte, dass alle VMs auf dem betroffenen physischen Server die Verbindung zum Storage-System verloren haben.

Das Fehlverhalten wurde beim installieren einer neuen virtuellen Maschine ausgelöst.

Der Fehler wird momentan weiter analyisiert und in unserer Entwicklungsumgebung nachgestellt. Wir erwarten, dass wir den Fehler sehr bald behoben haben.

Bis dahin haben wir weiter Aktionen, die den Fehler potentiell auslösen, angehalten und erwarten keine weiteren Auswirkungen dieses Fehlers auf den VM-Betrieb.