2min

Tags in dit artikel

, , ,

AWS heeft zijn Aqua-architectuur algemeen beschikbaar gemaakt. De architectuur moet helpen nog sneller analyticszoekvragen uit te voeren binnen de cloudgebaseerde data warehouse-omgeving van AWS Redshift. Dataspecialisten hoeven door Aqua niet eerst data van de storagelaag naar de compute-laag te brengen om de analyses uit te voeren.

Data is tegenwoordig de motor achter alle bedrijfswerkzaamheden. Hierdoor is het handig om data zeer snel te analyseren, zodat vrijwel ‘on the fly’ de uitkomsten hiervan in de bedrijfsvoering worden toegepast. Met de nu aangekondigde algemene beschikbaarheid van de AWS Aqua-architectuur wil de techgigant dit analyseproces versnellen. Vooral als data engineers en data scientists binnen bedrijven hiervoor de eigen beheerde data warehouse-oplossing AWS Redshift gebruiken.

AWS Redshift

Bij het uitvoeren van analyses met behulp van AWS Redshift wordt de data voor het analysewerk op de AWS S3 storage-infrastructuur opgeslagen. Wanneer bedrijven de daadwerkelijke analyses of zoekopdrachten willen uitvoeren, wordt deze data ‘overgeheveld’ naar een cluster van compute instances die aan de AWS Redshift-omgeving zijn verbonden; de Redshift RA3 instances. De virtuele processors van deze instances worden vervolgens gebruikt om de analyses en de zoekopdrachten uit te voeren.

Op deze manier worden storage en rekenkracht gescheiden, wat natuurlijk minder kosten met zich meebrengt. Nadeel is dat wanneer grote datasets moeten worden geanalyseerd, het overbrengen van de storage naar de computelaag lang duurt. Dit vertraagt het uitvoeren van zoekopdrachten en betekent ook weer dat bedrijven langer op resultaat moeten wachten op. En tijd is natuurlijk geld.

Introductie Aqua

Met de technologie-architectuur Aqua moet het hele proces met een factor tien – vergeleken met de oplossingen van concurrenten- worden versneld, zo geeft AWS aan. Met deze technologie wordt rekenkracht naar de storagelaag gebracht. Bedrijven hoeven hierdoor geen data die zij willen analyseren en bevragen meer van de storagelaag naar de compute-omgeving over te brengen. Dit moet hen veel tijd besparen.

Parallelle acties

De Aqua-cache met data schaalt en verwerkt op parallelle wijze de data over verschillende nodes. Iedere node beschikt over een hardwaremodule die bestaat uit de zelfontwikkelde analytics-processors van AWS. Deze processors versnellen vervolgens processen als datacompressie, en versleuteling. Daarnaast versnellen de over de verschillende nodes verspreide processors dataverwerkingstoepassingen als scannen, filteren en het toevoegen van informatie.

Verder zorgt de Aqua-technologie er ook voor dat klanten al berekeningen kunnen uitvoeren op hun raw storage data. Vooral dit bespaart op de tijd die anders nodig is om data van de ene naar de andere laag te schuiven, volgens de techgigant. Dit moet hen dan in de ogen van AWS dan ook beter prestaties van de AWS Redshift-oplossing opleveren. Deze betere resultaten zijn onder meer up-to-date dashboards, besparingen op de ontwikkeltijd en makkelijker systeemonderhoud.

Aqua is gratis voor AWS Red Shift RA3 instances en is beschikbaar in de regio’s US East (N. Virginia), US West (Oregon), US East (Ohio), Azië – Pacific (Tokyo) en Europa (Ierland). Vanzelfsprekend volgen andere cloudregio’s, zo geeft de techgigant aan.

Tip: AWS integreert machine learning in Redshift