Big Data-bedrijf Databricks heeft zijn MLflow machine learning toolkit ondersteuning gegeven voor de programmeertaal R. Ook zijn er nieuwe functies gelanceerd om het nut hiervan te vergroten, schrijft onder andere Silicon Angle

MLflow werd in juni onthuld. De toolkit moet helpen bij het standaard maken van het proces voor het ontwikkelen van machine learning-applicaties en om ze naar productie te verplaatsen. Volgens het bedrijf is het proces voor het trainen van machine learning-algoritmes erg inconsistent en zijn er weinig tools beschikbaar om resultaten te reproduceren, experimenten te volgen en modellen te managen.

Met MLflow moeten bedrijven hun machine learning-code beter kunnen verpakken, uitvoeren, testen en deployen. Ontwikkelaars krijgen de volledige controle om de machine learning training-levenscyclus te managen, door het standaard te maken op bestaande ML toolkits en frameworks bij verschillende deployment-methodes.

RStudio

Databricks heeft nu een partnerschap gesloten met RStudio voor de nieuwe update. RStudio biedt een open source en geïntegreerde ontwikkelingsomgeving voor R, om de programmeertaal te helpen integreren. MLflow is nu beschikbaar voor de grote gemeenschap aan datawetenschappers die RStudio en R gebruiken om nieuwe applicaties te maken.

“De integratie van R in MLflow zal het bereik van het project significant vergroten, omdat een bredere gemeenschap MLflow kan gebruiken en er aan bij kan dragen”, aldus CEO JJ Allaire van RStudio.

Integraties

MLflow krijgt verder ondersteuning voor programmeertalen als Python, Java en Scale. Verder is er een REST server-interface waarmee R met andere talen gebruikt kan worden. Daarnaast zijn er integraties gekomen met populaire machine learning libraries en -frameworks als SciKit-Learn, TensorFlow, Keras, PyTorch, H2O en Apache Spark MLlib.

Tot slot is er ondersteuning voor cross-cloud in de MLflow toolkit beschikbaar geworden. Dat betekent dat modellen die met MLflow gemaakt zijn, gedeployed kunnen worden in clouddiensten als het Azure ML-platform, SageMaker van AWS en het Unified Data Analytics-platform van Databricks zelf.