Gebruikers van Snowflake kregen deze week wereldwijd te maken met ernstige problemen nadat een recente update fouten introduceerde in het datawarehouseplatform. Door de mislukte softwarewijziging vielen belangrijke functies tijdelijk uit, waardoor klanten geen queries konden uitvoeren, data niet konden laden en foutmeldingen ontvingen.

De oorzaak lag bij een database-schemawijziging die niet achterwaarts compatibel bleek te zijn. Hierdoor ontstonden versieconflicten tussen verschillende onderdelen van het Snowflake-platform, wat leidde tot falende of sterk vertraagde operaties. De eerste problemen werden gemeld rond 02:55 UTC en hielden in sommige regio’s meer dan dertien uur aan.

Volgens The Register had de storing een wereldwijde impact en werden tien van de drieëntwintig Snowflake-regio’s geraakt. In de Verenigde Staten ging het onder meer om Azure in Virginia en AWS in Oregon, terwijl ook Europese en Aziatische regio’s, waaronder Ierland, Londen, Zürich, Zweden, Mumbai en Singapore, problemen ondervonden.

Herstel en kritiek

The Register meldt dat Snowflake ongeveer anderhalf uur na de eerste meldingen aangaf de oorzaak te hebben geïdentificeerd. In sommige regio’s kwamen systemen rond 05:00 UTC weer beschikbaar, terwijl het herstel elders langer duurde en de dienstverlening nog niet direct stabiel was. Gebruikers klaagden dat het terugdraaien van de update onnodig lang duurde.

Het incident volgt kort op een eerdere verstoring begin december, toen Snowflake ook al te maken had met prestatieproblemen in een van zijn AWS-regio’s. Volgens berichtgeving van The Register past de storing bovendien in een bredere reeks recente problemen bij grote dataplatformen, waaronder concurrent Databricks.

Snowflake heeft toegezegd op korte termijn een volledige root-cause-analyse te publiceren. Daarmee wil het bedrijf meer duidelijkheid geven over hoe de fout heeft kunnen ontstaan en welke maatregelen worden genomen om herhaling te voorkomen.

Waar Snowflake tijdens incidenten doorgaans een voorlopige oorzaak en een latere root-cause-analyse publiceert, geldt dat niet voor alle concurrenten. Databricks maakt volgens The Register doorgaans geen technische oorzaken van storingen openbaar. Die transparantieverschillen spelen mee in hoe klanten cloudleveranciers beoordelen bij grootschalige incidenten.