2min

Tags in dit artikel

, ,

Twitter heeft een intern ontwikkelde tool voor het ontdekken van performance-afwijkingen en pieken in netwerkgebruik open source gemaakt.

Twitter gebruikt Rezolus om workloads meetbaar te maken, runtime-performance te meten en het verkrijgen van data voor netwerkoptimalisering, zegt Brian Martin, site reliability engineer bij Twitter in de blogpost.

Martin legde verder uit dat Twitter Rezolus heeft gebouwd om de prestaties van zijn systemen tot in detail te kunnen observeren, op een zeer fijne tijdsschaal. De makers van Rezolus kwamen namelijk regelmatig verschillen in performance van slechts enkele seconden in het netwerk tegen. Ze waren echter niet in staat om de oorzaak van deze problemen te vinden. Daarvoor hadden de gebruikte systemen een te lage meetfrequentie in verhouding tot de duur van de performance-verschillen.

Problemen van enkele seconden

“Één keer hadden verschillende diensten gedurende enkele minuten te maken met een succespercentage dat steeds slechter werd”, legt Martin uit. “Deze diensten bleken allemaal te worden afgeremd door een back-end-dienst. Het team dat verantwoordelijk was voor die dienst zag niets op de monitoringsystemen die ze gebruikten om erachter te komen wat er gebeurde tijdens de minuten dat er een storing optrad. Ze wisten wel dat throttling op een kleinere tijdsschaal wordt bepaald, dus begonnen ze te vermoeden dat de problemen plaatsvonden in een tijdsspanne van minder dan een minuut.”

Door Rezolus in te zetten bij de dienst in kwestie, kon Martin’s team erachter komen wat er precies was gebeurd. Martin meldt verder dat Twitter heeft besloten om Rezolus open source te maken, omdat andere bedrijven daardoor geholpen worden. Er zijn waarschijnlijk meerdere spelers die met soortgelijke netwerkproblemen te maken hebben. Op die manier kan er daarnaast een grotere community rond Rezolus opgebouwd worden.