Een datacentrum van Microsoft Azure in Texas is dinsdag offline gegaan. Oorzaak was extreem weer. Boven de Amerikaanse staat hing een onweersstorm, waardoor de koelsystemen van het centrum uitvielen. Het bedrijf werd naar eigen zeggen geforceerd om veel van de servers en systemen uit te schakelen, om verdere schade te voorkomen.

“Extreem weer, inclusief blikseminslagen, hing boven een van de datacentra in het zuiden van het centrum van de Verenigde Staten”, aldus het bedrijf, meldt Silicon Angle. “Dit resulteerde in een stijging in het voltage, wat impact had op de koelsystemen. Als gevolg daarvan werden geautomatiseerde procedures om de integriteit van data en hardware te waarborgen ingezet. Belangrijke hardware kwam in een proces terecht om de stroom uit te zetten.”

Het koelsysteem is een belangrijk onderdeel van de moderne datacentra. De duizenden servers in dergelijke centra staan dicht op elkaar en worden warm. Door ze af te koelen, raken ze niet oververhit. Maar als de koeling stopt, kan alles kapot gaan.

Daarom hebben bedrijven als Microsoft procedures om automatisch alle hardware uit te zetten als de temperatuur boven een veilig niveau uitkomt. Voor de datacentra is dit belangrijk, maar voor gebruikers van de cloud is het vervelend.

Getroffen diensten

Naar eigen zeggen had de storing invloed op veel van zijn clouddiensten, waaronder de Visual Studio Teams-dienst. Ook Azure Active Directory identity management en Office 365 gingen door de storing offline. Volgens Visual Studio Teams kunnen gebruikers met organisaties buiten het geraakte gebied ook last hebben van de storing, namelijk in hun CI/CD-workflows.

Microsoft zegt zelf te werken aan het weer online zetten van alle getroffen diensten. “Engineers hebben de stroom succesvol terug gekregen in het datacentrum. Daarnaast hebben ze het overgrote deel van de getroffen netwerkapparaten hersteld.”

Waarschuwing

Volgens experts is het incident een herinnering aan bedrijven die clouddiensten gebruiken dat het een slecht idee is om op een enkele provider te vertrouwen als het om het draaien van critical workloads in de cloud gaat.

“Het incident bij Azure was een nieuwe duidelijke herinnering dat organisaties hun eigen redundancy moeten inbouwen, in plaats van op een aanbieder te vertrouwen”, stelt Pete Banham, een beveiligingsexpert bij Mimecast.