"*" geeft vereiste velden aan

Databricks wil standaarden maken voor vereniging machine learning en AI

Databricks wil standaarden maken voor vereniging machine learning en AI

15 oktober 201815 oktober 2018

2min

Tags in dit artikel

AI, Apache Spark, big data, databricks, machine learning

Databricks, het bedrijf achter Apache Spark, heeft als doel om gegevens, engineering en mensen te verenigen. Dit wil het doen door standaarden te definiëren voor diverse processen, waaronder distributed machine learning-trainingen, -uitvoeringen en -deployment. Dat blijkt uit een interview van ZDNet met CEO Matei Zaharia.

Veel van dit werk wil Databricks doen met zijn eigen creatie genaamd MLFlow. Dat is een toolkit die moet helpen bij het standaard maken van het proces voor het ontwikkelen van machine learning-applicaties en om ze naar productie te verplaatsen. Alles begint volgens Zaharia echter met data engineering.

“In ongeveer 80 procent van de usecases is het uiteindelijke doel van mensen om data science of machine learning in te zetten. Maar om dit te doen heb je een pijplijn nodig die op betrouwbare wijze data kan verzamelen over een langere periode aan tijd. Beide zijn belangrijk, maar je hebt data engineering nodig om de rest te doen. Wij richten ons op gebruikers met grote hoeveelheden, wat uitdagender is. Als je Spark gebruikt voor distributed processing, dan heb je veel data.”

Dit betekent vaak echter ook dat de data uit diverse bronnen komt. Nu ondersteunen Spark en Data – het cloud-platform van Databricks dat op Spark gebouwd is – al het lezen van en het schrijven naar een groot aantal databronnen. Maar Databricks wil nu nog een stap verder gaan, door verschillende frameworks voor machine learning te verenigen vanuit het lab naar productie via MLFlow.

Ook bouwt het een standaard framework voor data en uitvoering via Project Hydrogen. Dit betekent dat de data en de uitvoering verenigd worden, verschillende ML-frameworks data kunnen uitwisselen en de training en het interference-proces gestandaardiseerd worden.

MLFlow

Het doel van MLFlow is om ondersteuning te bieden bij het volgen van experimenten, het delen en hergebruiken van projecten en het ontwikkelen van productiemodellen. Niet alleen wordt het mogelijk om ML-modellen te deployen op Spark en Delta, maar MLFlow kan deze ook exporteren als REST-diensten die op ieder platform, of op Kubernetes gedraaid kunnen worden. Ook cloud-omgevingen worden ondersteund. Het gaat nu om AWS SageMaker en Azure ML.

Events - Techcalendar

6 May 2024, Denver

Red Hat Summit

Red Hat Summit

6 May 2024, San Francisco

RSA Conference 2024

RSA Conference 2024

7 May 2024, Las Vegas

Knowledge 2024

Knowledge 2024

Topartikelen

MITRE ontdekte Chinese hack pas maanden na exploitatie

MITRE ontdekte Chinese hack pas maanden na exploitatie

In januari infiltreerden hackers een netwerk van MITRE Corporation. De aanvallers, vermoedelijk van Chinese o...

Nederlandse securitybedrijven vinden slachtoffers Cactus-criminelen

Nederlandse securitybedrijven vinden slachtoffers Cactus-criminelen

De zogeheten Cactus-ransomwaregroep slaat wereldwijd toe. Tien Nederlandse organisaties werden er de afgelope...

IBM bevestigt miljardenovername van HashiCorp

IBM bevestigt miljardenovername van HashiCorp

Update 25/04/2024 - IBM heeft bekendgemaakt HashiCorp te kopen voor 6,4 miljard dollar, omgerekend zo'n 5,97 ...

Snowflake stapt in LLM-oorlog met introductie Arctic

Snowflake stapt in LLM-oorlog met introductie Arctic

Met het nieuwe Large Language Model Arctic kan Snowflake bedrijven helpen bij het genereren van code en SQL. ...

Hoe ASML de spil van de chipwereld werd

Hoe ASML de spil van de chipwereld werd

De ASML-topmannen Peter Wennink (CEO) en Martin van den Brink (CTO) zwaaien op donderdag af. Fransman Christo...

Laatste nieuws

Haags CERRIX mikt op Europese expansie met nieuwe investering

Haags CERRIX mikt op Europese expansie met nieuwe investering

De Belgische investeerder Fortino Capital ondersteunt CERRIX in zijn ambitie om bedrijven te helpen met Gover...

16 uur geleden

Bezos en Jassy beschuldigd van verwijderen chats tijdens onderzoek

Bezos en Jassy beschuldigd van verwijderen chats tijdens onderzoek

De topmannen van Amazon zouden tussen 2019 en 2022 onderling zakelijke Signal-berichten hebben verwijderd, te...

18 uur geleden

Proximus activeert 44.000 glasvezelverbindingen in drie maanden

In het afgelopen kwartaal werden 44.000 nieuwe glasvezelverbindingen geactiveerd, waardoor het totaal aantal ...

19 uur geleden

Darktrace verkocht voor 5 miljard aan private equity Thoma Bravo

Darktrace verkocht voor 5 miljard aan private equity Thoma Bravo

Securitybedrijf Darktrace is akkoord met een overname door investeringsmaatschappij Thoma Bravo. In de tweede...

19 uur geleden

Expert bijdrage

Hoe AI de SOC-expert te hulp schiet

Hoe AI de SOC-expert te hulp schiet

Security Operations Centers (SOC’s) dreigen overspoeld en de SOC-analisten overwerkt te raken. Dit komt doo...

19 uur geleden

Omzet uit clouddiensten Microsoft en Google neemt fors toe

Omzet uit clouddiensten Microsoft en Google neemt fors toe

Microsoft en Google-moederbedrijf Alphabet presenteerden hun cijfers voor Q1 2024. De resultaten zijn in beid...

20 uur geleden