2min

Tags in dit artikel

, , , ,

De Azure-cloud van Microsoft heeft een erg hoge beschikbaarheid. In het afgelopen jaar had de cloud-dienst namelijk een uptime van 99,995 procent. Maar dat is niet voldoende: CTO Mark Russinovich wil de betrouwbaarheid nog verder verhogen met nieuwe initiatieven.

Azure had in het afgelopen jaar ondanks die hoge uptime wel drie “unieke en significante” incidenten, aldus Russinovich in een blogbericht.

Het gaat dan om een storing in een datacenter in de South Central-regio in de Verenigde Staten in september 2018, problemen met Azure Active Directory Multi-Factor Authentication in november vorig jaar, en DNS-onderhoudsproblemen in mei dit jaar.

Volgens Russinovich waren de drie incidenten het resultaat van meerdere problemen, die alleen via “ingewikkelde interacties” tot storingen bij de klant leidden. De CTO stelt dat het bedrijf van zijn fouten heeft geleerd, en nu de betrouwbaarheid van Azure wil verhogen.

Quality Engineering-team

Allereerst is er een nieuw Quality Engineering-team opgezet, dat direct aan de CTO rapporteert. Het team moet nieuwe aanpakken op gaan zetten om een betrouwbaarder platform te creëren. En er zijn al een aantal initiatieven.

Allereerst worden de beschikbaarheidszones verder uitgebreid. Op dit moment zijn er zones live in de tien grootste Azure-regio’s, maar er komen tussen nu en 2021 ook nieuwe zones naar de volgende tien grootste regio’s.

Ook wordt er verder gewerkt aan Project Tardigrade, een dienst die hardware-problemen of geheugenlekken die kunnen leiden tot het crashen van een besturingssysteem detecteert, vlak voordat ze plaatsvinden. Daardoor kan Azure de virtuele machines in een paar minuten bevriezen, zodat de workloads naar een gezonde host verplaatst kunnen worden.

Safe deployment practice framework

Microsoft breidt zijn safe deployment practice framework verder uit, waarmee gezorgd wordt dat alle wijzigingen in code en configuraties in Azure eerst een set aan tests moeten behalen, voordat ze naar de verschillende regio’s worden uitgerold. Het framework wordt uitgebreid om alle software-gedefinieerde infrastructuurveranderingen in Azure te omvatten.

Voor klanten wordt verder een preview beschikbaar gemaakt van de mogelijkheid om een eigen failover te initiëren op het opslagaccountniveau. Microsoft wil verder investeren in het verbeteren van zea-impact en low-impact updatetechnieken, zoals hot patching en live migration.