AWS heeft nu een machine learning-tool toegevoegd aan zijn data warehouse-omgeving Redshift. Amazon Redshift ML laat dataspecialisten eenvoudig via SQL machine learning-modellen maken, trainen en uitrollen.

AWS is de laatste tijd steeds meer gaan inzetten op machine learning. Onlangs werden al belangrijke updates aangekondigd voor zijn beheerde dienst voor machine learning SageMaker, nu krijgt de cloudgebaseerde datawarehouse Redshift updates.

De nu in preview geïntroduceerde dienst Amazon Redshift ML maakt het voor eindgebruikers van datawarehouse-diensten mogelijk om met eenvoudige SQL-commando’s machine learning-modellen te ontwikkelen, te trainen en uit te rollen.

De tool helpt volgens de techgigant om de functionaliteit van Sagemaker volledig op een makkelijke manier te benutten om Ml-modellen te maken en te gebruiken. Dataspecialisten kunnen hiervoor ‘gewoon’ SQL gebruiken en hoeven geen data te verplaatsen of nieuwe vaardigheden te leren.

SQL-vragen

Meer concreet helpt het door SageMaker ondersteunde Redshift ML dataspecialisten SQL-queries te gebruiken om machine learning-modellen te maken en te trainen met de data die zich in de datawarehouse-omgeving van Amazon Redshift bevindt. De gemaakte modellen kunnen daarna worden gebruikt voor onder meer het direct voorspellen van churn of frauderisicio’s in zoekvragen of in rapporten.

Keuze uit meerdere modellen

Amazon Redshift ontdekt op basis van de trainingsdata automatisch het beste bruikbare model en past dit aan. Dit gaat met behulp van Amazon SageMaker Autopilot. Deze tool selecteert dit model uit de beste regression-, binary- of multi-class classificatiemodellen of andere modellen als Xtreme Gradient Boosted tree (XGBoost).

De voorspellingen van de getrainde modellen kunne dataspecialsiten opvragen met behulp van SQL-queries. Deze manier van opvragen lijkt volgens AWS op het inroepen van een user defined function (UDF). Uiteindelijk moet met deze manier van opvragen alle mogelijkheden van Redshift kunnen worden benut. Inclusief het uitvoeren van grootschalige parallelle verwerkingsmogelijkheden.

Beperkte kosten

Naast alle functionaliteit, levert het gebruik van Amazon Redshift ML bedrijven ook kostenbesparingen op. De tool gebruikt bestaande clusterbronnen, waardoor er geen extra kosten zijn voor Amazon Redshift. Het maken en gebruik van een model in de machine learning-tool is gratis. De voorspellingen gebeuren lokaal in het Amazon Redshift-cluster en is dus ook gratis, tenzij de omvang van het cluster wordt veranderd. Ook het gebruik van Amazon SageMaker heeft geen extra kosten.

De preview van Amazon Redshift is nu beschikbaar in de AWS cloudregio’s US East (Ohio), US East (N Virginia), US West (Oregon), US West (San Francisco), Canada (Central), Europa (Frankfurt), Europa (Ireland), Europa (London), Europa (Paris), Europa (Stockholm), Azië Pacific (Hong Kong) Azië Pacific (Tokyo), Azië Pacific (Singapore), Azië Pacific (Sydney) en Zuid-Amerika (São Paulo).