Avbrott 2013-04-17

Avklarat

Nedan följer en händeserapport gällande dagens elavbrott:

11:30 Grävdes en större strömkabel av i centrala Västerås som även servar vår största serverhall med ström.  Då vi har backupström i hallen fortsatte samtliga tjänster att fungera som normalt.

12:10 Uppdagades det att temperaturen i hallen snabbt steg. Delar av miljön stängde då automatiskt ner sig själv via en s.k Thermal shutdown pga. värmen för att skydda sig. Teknikerna tog då beslutet att stänga ner resterande tjänster i hallen för att inte riskera skador på miljön. Samtliga tjänster var nedstängda 12:30

13:08 Var strömmen tillbaka och temperaturen i serverhallen sjönk snabbt. Tekniker inväntade att serverhallen skulle komma ner i acceptabel temperatur och väntade ut eventuella strömspikar som kan uppstå när strömmen kommer tillbaka och skulle kunnat förstöra utrustningen. Sedan startades tjänsterna upp en efter en under övervakning.

13:25 Första del att startas upp var vårt core-nät.

13:48 Var den kritiska DNS-tjänsten uppe igen för samtliga kunder. Efter det följde resten av våra hundratals servrar som startades upp under kontrollerade former. Tekniker jobbade parallellt med de olika delarna av miljön.

14:00 Loopia Kundzon är åter tillgänglig för samtliga kunder.

15:23 Samtliga databasservrar är uppe.

15:30 Samtliga Windows-webbservrar är uppe.

16:20 Autobahn-plattformen är uppe.

16:28 Vårt e-postsystem blir tillgängligt för åtkomst utifrån för alla klienter utom webbmailen.

17:03 Samtliga UNIX-webbservrar är uppe.

18:30 Webbmailen är nu tillgänglig för samtliga kunder.

18:30 Samtliga tjänster är nu uppe igen och vi kommer nu att jobba med en utredning tillsammans med inblandade parter varför inte delar av miljön fungerade som det var tänkt under elavbrottet. Vi kommer nu att arbeta intensivt för att liknande avbrott inte ska ske i framtiden.

Under störningen så fungerade inte vår Anycast-DNS tjänst som det är tänkt. Vi har tagit ner samtliga noder förutom den i Sverige för att förbättra tjänsten. Planen är att så snabbt som möjligt få upp Anycast-noder igen med kraftfullare hårdvara och uppdaterad programvara.