HPE neemt data science-platform Pachyderm over. Met de technologie wil HPE zijn oplossingen voor AI uitbreiden.
Met de overname, waarvan geen financiële details bekend zijn gemaakt, bouwt HPE voort op een eerdere investering van zijn investeringsvehikel Hewlett Packard Pathfinder in Pachyderm van februari 2022. De overname hoeft niet te worden goedgekeurd door de relevante autoriteiten en moet aan het einde van deze maand zijn beslag krijgen.
Technologie Pachyderm
Het overgenomen bedrijf biedt tools voor het maken en beheren van AI- en machine learning-projecten. De tools van Pachyderm, die zowel via de cloud als on-prem kunnen worden afgenomen, helpen gebruikers met het automatiseren van onderdelen van het ontwikkelen van AI-systemen met behulp van datatransformaties, data workflows en connectors.
Pachyderm biedt ook versioning-functionaliteit voor datasets voor ML-oplossingen en een op GitHub lijkende structuur voor samenwerking tussen data scientists. Ook maakt de technologie het mogelijk een niet-aanpasbare record op te stellen voor alle werkzaamheden en onderdelen op het platform. Verder biedt de startup een beheerde dienst, Pachyderm Hub, voor on-demand rekenclusters voor het ontwikkelen van AI-modellen.
Integratie met HPE ML-omgeving
HPE wil met de technologie zijn klanten meer AI- en ook supercomputing-mogelijkheden bieden. Vooral moet de technologie HPE Machine Learning Development Environment (MLDE)-omgeving gaan versterken. De volgende versies van deze omgeving krijgen daarom de Pachyderm-technologie ingebouwd
De HPE MLDE-omgeving biedt klanten ML-software waarmee zij snel ML-modellen van hoge kwaliteit kunnen ontwikkelen, verversen en opschalen van een proof-of-conceptfase naar daadwerkelijke productie.
De combinatie met het Pachyderm-platform moet klanten helpen AI-modellen sneller en grootschaliger te trainen op de meest snelle supercomputers in de wereld voor het bouwen van zeer veel vereisende AI-modellen, aldus HPE.
Voordelen integratie
Het geïntegreerde platform moet volgens de techgigant uiteindelijk voor geavanceerde data-driven pipelines zorgen. Deze pipelines kunnen dan automatisch herhaalbare ML-processen tweaken, voorbereiden, in de gaten houden en beheren tijdens de ontwikkelings- en trainingsfases.
Voordelen die hiermee kunnen worden behaald, zijn onder andere meer geavanceerde data linage of inzicht in de bronnen van data tijdens de ML lifecycle en analytische processen en het volgen van verschillende dataversies om te begrijpen waar en wanneer gegevens werden aangepast. Ook kunnen klanten door de integratie efficiënter incrementele data verwerken.