Amazon Web Services kreeg te maken met twee storingen veroorzaakt door zijn eigen AI-tools. De incidenten, waarbij de Kiro AI-ontwikkeltool en Amazon Q Developer betrokken waren, leiden tot twijfels binnen de organisatie over de uitrol van autonome AI-assistenten.
AWS ervaarde in december een storing van 13 uur nadat engineers hun Kiro AI-tool bepaalde wijzigingen lieten doorvoeren. Volgens vier bronnen van Financial TImes besloot de autonome tool dat de beste oplossing was om “de omgeving te verwijderen en opnieuw aan te maken”. De storing trof een systeem waarmee klanten de kosten van AWS-diensten kunnen verkennen.
Het was de tweede keer in korte tijd dat een AI-tool van Amazon centraal stond bij een dienstverstoring. “We hebben al minstens twee productiestoringen gezien”, aldus een senior AWS-medewerker anoniem tegenover FT. “De engineers lieten de AI een probleem oplossen zonder tussenkomst. De storingen waren klein maar volledig te voorzien.”
Amazon benadrukt dat het “toeval was dat AI-tools betrokken waren” en dat “hetzelfde probleem kan optreden met elke ontwikkelaarstool of handmatige actie”. Het bedrijf stelt dat het in beide gevallen om gebruikers- en niet om AI-fouten ging. Men heeft geen bewijs gezien dat fouten vaker voorkomen bij AI-tools.
De storing in december was volgens Amazon een “uiterst beperkte gebeurtenis” die alleen een enkele dienst in delen van China trof. Het tweede incident had geen impact op een “klantgerichte AWS-dienst”.
Toegangscontrole en safeguards
De medewerkers stellen dat de AI-tools van Amazon worden behandeld als een verlengstuk van een operator en dezelfde permissies krijgen. In deze twee gevallen hadden de betrokken engineers geen goedkeuring van een tweede persoon nodig voordat ze wijzigingen doorvoerden, wat normaal wel het geval zou zijn.
Amazon geeft aan dat de Kiro-tool standaard “autorisatie vraagt voordat een actie wordt ondernomen”. Wel had de engineer bij het decemberincident “bredere permissies dan verwacht – een probleem met gebruikerstoegangscontrole, niet met AI-autonomie”.
Kiro zou verder gaan dan vibe coding en code schrijven op basis van specificaties. Eerder vertrouwde Amazon op zijn Amazon Q Developer-product, een AI-chatbot die engineers helpt code te schrijven. Deze was volgens drie medewerkers betrokken bij de eerdere storing.
Na het decemberincident heeft AWS volgens het bedrijf “talrijke waarborgen geïmplementeerd”, waaronder verplichte peer review en training van personeel. Toch blijven sommige Amazon-medewerkers sceptisch over het nut van AI-tools voor het grootste deel van hun werk, vanwege het risico op fouten. Het bedrijf heeft een doel gesteld dat 80 procent van de developers AI minstens één keer per week voor coderertaken gebruikt en volgt de adoptie nauwgezet.
Update – AWS heeft ons laten weten het niet eens te zijn met de beweringen van de bronnen van FT. Het bedrijf: “Deze korte storing was het gevolg van een gebruikersfout – met name verkeerd geconfigureerde toegangsrechten – en niet van AI. De serviceonderbreking was een zeer beperkte gebeurtenis vorig jaar, waarbij één enkele service (AWS Cost Explorer – waarmee klanten AWS-kosten en -gebruik in de loop van de tijd kunnen visualiseren, begrijpen en beheren) in een van onze twee regio’s in China werd getroffen. Deze storing had geen invloed op compute, storage, databases, AI-technologieën of andere van de honderden services die we beheren. Naar aanleiding van deze incidenten hebben we tal van extra beveiligingsmaatregelen geïmplementeerd, waaronder verplichte peer review voor toegang tot productieomgevingen. Kiro geeft ontwikkelaars de controle: gebruikers moeten configureren welke acties Kiro mag uitvoeren, en standaard vraagt Kiro om autorisatie voordat er actie wordt ondernomen.”
Tip: AWS maakt ontwikkelomgeving Kiro fors duurder (update: reactie AWS)