2min

Tags in dit artikel

,

AWS heeft een aantal nieuwe diensten voor machine learning gelanceerd. AWS SageMaker Data Wrangler, AWS SageMaker Pipelines en AWS Sagemaker Feature Store moeten het voor bedrijven makkelijker maken om data voor machine learning voor te bereiden en geautomatiseerde workflows voor het bouwen van modellen op te zetten.

Voor het trainen van AI-modellen dient data goed voorbereid te zijn. Volgens de techgigant is dit een grote uitdaging. Voordat data scientists hun modellen kunnen trainen, moeten zij vaak nog handmatig hun queries schrijven. Dan moeten zij nog code krijgen om hun data uit de data stores op te halen. Vervolgens moeten zij nog een keer queries schrijven om die code te transformeren en, naar behoefte, eigenschappen te combineren. Al deze voorbereidende werkzaamheden focussen niet op het bouwen van de modellen, maar juist op de infrastructuur voor het bouwen van modellen.

AWS SageMaker Data Wrangler

AWS  vindt dat dit anders kan en vooral meer geautomatiseerd kan plaatsvinden. Dit scheelt data scientists dan veel werk en tijd. Concreet wil de techgigant met de introductie van de tool AWS SageMaker Data Wrangler voorkomen dat data scientists veel tijd besteden aan het verzamelen en prepareren van data voor machine learning. Met de tool moet dit proces in minuten kunnen gebeuren in plaats van enkele weken. Data scientists kunnen het proces van het prepareren van data versimpelen en ieder proces van het datavoorbereidingsproces, dataselectie, data opschonen, data exploreren en visualiseren, in een enkele interface afhandelen.

Verder kunnen zij met meer dan 300 ingebouwde data transformaties gebruiken voor het normaliseren, transformeren en combineren van features, zonder code te hoeven schrijven. Templates visualiseren de transformaties om te kijken of deze zijn voltooid. Vervolgens kunnen data scientists volledig geautomatiseerde machine learning workflows bouwen met de eveneens gelanceerde tool AWS SageMaker Pipelines en ze voor hergebruik opslaan in de AWS SageMaker Feature Store.

CI/CD-dienst AWS Sagemaker Pipelines

AWS Sagemaker Pipelines is een CI/CD-dienst binnen het hele SageMaker-platform voor machine learning. De tool maakt het mogelijk om end-to-end workflows op te zetten, te automatiseren en te beheren voor machine learning. De tool maakt het ook mogelijk dit op schaal te doen. Gebruikers kunnen hiermee vele machine learning workflows per week maken, grote hoeveelheden data beheren, honderden model-versies uitrollen en duizenden trainingsexperimenten doen.

Introductie AWS Sagemaker Feature Store

Verder helpt de nu ook uitgebrachte tool AWS Sagemaker Feature Store bij het bewaren van features voor machine learning. Features zijn toevoegingen of eigenschappen die machine learning-modellen gebruiken tijdens het trainen van de modellen waarmee voorspellingen kunnen worden afgegeven.

Amazon SageMaker Feature Store is een volledig beheerde speciaal gebouwde repository waar deze machine learning features opgeslagen kunnen worden, worden geüpdatet, op te halen zijn en kunnen worden gedeeld. Op deze manier zijn features makkelijker binnen teams te delen en worden hergebruikt in andere machine learning-modellen.

Tip: AWS benadrukt belang van fundering en Well Architected Framework