Databricks voegt security-features toe aan analytics-platform

Abonneer je gratis op Techzine!

Databricks voert een update door aan zijn Unified Data Analytics Platform. De nieuwe functies moeten bijdragen aan de veiligheid van machine learning-applicaties en andere data-intensieve taken.

Het Unified Data Analytics Platform van Databricks wordt gebruikt voor het analyseren van data, bouwen van pipelines tussen storage-systemen en het voorbereiden van gelabelde datasets voor het bouwen van modellen. Vervolgens wordt het platform ingezet voor het trainen van machine learning- en kunstmatig intelligentie (AI)-modellen.

Volgens Databricks is het gebruiken van data op grote schaal echter complex en risicovol. Dit onder meer doordat security-maatregelen gefragmenteerd zijn en het lastig is bedrijfsbrede policies uit te breiden over de gehele organisatie. Databricks stelt dat deze uitdagingen vooral in multicloud-omgevingen voorkomen.

Update

De nieuwe toevoegingen brengen daar verandering in, waardoor de data science-leverancier spreekt over een ‘volledig beheerde security software-as-a-service’-aanbod. Bedrijven kunnen Databricks-clusters nu draaien binnen cloud-accounts. Ook biedt het platform data-encryptiesleutels die eigendom zijn van de klant en aangepaste privénetwerken om de clusters uit te voeren. Hierdoor kunnen gebruikers de dienst aanpassen aan hun eigen security-behoeftes.

Voor admins komen er tools bij om om te gaan met duizenden gebruikers die toegang hebben tot data. De admins kunnen de activiteiten van de gebruikers met de tools controleren en analyseren. Daarnaast kunnen ze policies opstellen voor bepaalde groepen, bijvoorbeeld infrastructuurbeheer en budget controle.

De laatste toevoeging richt zich op automation. Analytics kan sneller in productie gaan door het continuous integration en continuous delivery (CI/CD)-principe. Dit door ondersteuning toe te voegen voor git repositories en API’s voor taken als user management, workspace provisioning en cluster policies.

Tip: Databricks vindt open source de broodnodige innovatie voor data science