1 min

AWS heeft de dienst Glue Data Quality beschikbaar gemaakt. Met de dienst kunnen bedrijven makkelijker hun datakwaliteit optimaliseren binnen al hun data lakes en pipelines.

Volgens AWS letten veel bedrijven bij het maken van data lakes niet goed op de kwaliteit van de daarin ondergebrachte data. Hierdoor worden volgens de techgigant de data lakes eerder ‘data-moerassen’.

Het verbeteren van de datakwaliteit is voor engineers vaak een moeilijk en langdurig proces. Vooral door het vele handmatige nauwgezet uitpluizen van de data, het formuleren van de datakwaliteitsvereisten en het coderen bij alerts voor verslechterende datakwaliteit.

AWS Glue Data Quality-dienst

Hiervoor brengt de techgigant zijn dienst AWS Glue Data Quality op de markt die het verzorgen van een goede datakwaliteit moet versnellen door het reduceren van deze handmatige taken. De dienst berekent automatisch statistieken, geeft voorbeelden voor kwaliteitsregels, houdt data in de gaten en verstuurt alerts als wordt gedetecteerd dat de kwaliteit achteruit gaat.

Het bewaken van de datakwaliteit moet op deze manier efficiënter worden en mogelijke negatieve problemen voor het zakelijk gebruik voorkomen.

Serverless feature

De nieuwe dienst is een serverless feature van de dienst AWS Glue en zorgt verder ook voor het ontzorgen van infrastructuurbeheer en -onderhoud. Gebruikers hebben toegang tot de dienst via verschillende platforms, zoals de AWS Glue Data Catalog, Glue Studio en Glue Studio notebooks, maar ook vanuit de code-editors van hun voorkeur.

Tip: AWS kondigt algemene beschikbaarheid Verified Access aan