Dataiku versie 6 biedt meer flexibiliteit en eerlijke AI

Abonneer je gratis op Techzine!

Dataiku heeft de nieuwste versie aangekondigd van zijn kunstmatige intelligentie (AI)- en machine learning-platform, Dataiku 6. Met versie 6 kunnen gebruikers volgens het bedrijf eenvoudig Kubernetes-clusters inzetten en beheren. Naast die flexibiliteit heeft de nieuwe versie een aantal functies om organisaties te ondersteunen bij het ontwikkelen van duurzame AI-systemen. 

Dataiku zegt bedrijven te willen helpen bouwen aan toekomstbestendige AI, waarbij ze niet belemmerd worden door onvermijdelijke en/of onvoorziene ontwikkelingen zoals veranderende regelgeving. Verder biedt Dataiku 6 een nieuwe plugin-store, evenals de mogelijkheid tot subpopulatie-analyse. Met subpopulatie-analyse kunnen gebruikers volgens Dataiku model bias (bevooroordeling) uitfilteren, en zo zorgen voor een transparante en eerlijke toepassing van AI.

K8s

Zoals beschreven stelt de nieuwe versie gebruikers in staat Kubernetes-clusters (op AWS, Azure of Google Cloud Platform) te starten en beheren vanuit het Dataiku-platform. Dit betekent dat niet-beheerders nu snel Kubernetes-clusters kunnen inzetten voor de uitvoering van bijvoorbeeld Spark of in-memory-taken. Beheerders kunnen ook compute reserveren en beheren, zodat elk team precies krijgt wat er nodig is om een bepaalde analyse uit te voeren en om AI in te zetten.

Verder is er een geoptimaliseerde synchronisatie met WASB en native uitvoering van Spark-taken in Snowflake. Dataiku 6 zorgt verder voor snellere uitvoering van multi-step SQL-datapipelines. Dit zorgt voor een geoptimaliseerde compute- en opslagomgeving als er wordt gewerkt met SQL-data.

AI

Dataiku 6 heeft twee nieuwe visuele functies, genaamd partial dependence plots en het eerder omschreven subpopulatie-analyse. Partial dependence plots zijn handig om complexe modellen te begrijpen, omdat ze op visuele wijze de relatie tussen een functie en het doel laten zien.

Samenwerking en efficiëntie

Dankzij verbeterde IDE-integraties met RStudio, VS Code, SublimeText en PyCharm kunnen ontwikkelaars in een omgeving naar keuze werken. Ook wordt samenwerking op het Dataiku-platform zelf gestimuleerd door het bedrijf. Betere visualisatie is volgens Dataiku cruciaal om te communiceren met zakelijke stakeholders over data-driven-systemen en beslissingen. Data scientists krijgen hiermee volgens het bedrijf ook een beter inzicht in de voortgang van AI-projecten. Ten slotte is er in Dataiku 6 ondersteuning voor externe tools voor datavisualisatie, zoals Qlik en Tableau.