Microsoft gaat zich meer inzetten voor Apache Spark Big Data framework

Stay tuned, abonneer!

Microsoft heeft bekendgemaakt dat het zich meer gaat inzetten voor het Apache Spark Big Data framework. Het bedrijf zal deze week ook aanwezig zijn op de Spark Summit in San Francisco. Microsoft zal daar aandacht besteden aan de ondersteuning voor Spark in de Cortana Intelligence Suite, HDInsight, Microsoft R Server en Power BI.

Microsoft heeft Spark voor Azure HDInsight nu breed beschikbaar gemaakt, deze dienst bevindt zich niet langer in een previewfase (testfase). Daarmee kan Spark voor Azure HDInsight nu ook echt gebruikt worden in productie-omgevingen, voor HDInsight betekent het dat het overweg kan met Hadoop en Spark.

Deze zomer wil Microsoft de R Server voor HDInsight beschikbaar maken. Hiervan moet een cloudversie beschikbaar komen maar ook een versie die bedrijven kunnen installeren in een eigen kantoor of serveromgeving. Voor de mensen die niet bekend zijn met R, R is een programmeertaal die gebruikt kan worden om statistieken te halen uit Big Data. Met R kan data ook gemodelleerd worden en zelfs machine learning worden toegepast. Microsoft heeft in april nog Revolution Analytics overgenomen, dat bedrijf is gespecialiseerd in R en maakte een distributie voor de R-programmeertaal.

De commerciële versie van de R-programmeertaal zal worden toegepast in SQL Server 2016 als een extra service. SQL Server 2016 is sinds begin deze maand beschikbaar, de uitbreiding met R volgt later. R kan dan ook overweg met SQL Server 2016 en daar data analyses op los laten.

R Server krijgt ook ondersteuning voor Hadoop omgevingen die bedrijven in hun eigen datacenters of serveromgeving hebben draaien. R Server krijgt ondersteuning voor de R-programmeertaal maar ook voor het Spark Execution Framework. Hierdoor kunnen gebruiken het ook combineren en via Spark de R-functies inzetten op duizenden servers. Op die manier kunnen data-analyses veel sneller worden gemaakt.

Tot slot is Power BI ondersteuning voor Spark Streaming nu beschikbaar. Daarmee kan Spark nu ook echt de concurrentie aan met Hadoop. Microsoft ondersteunt beide en laat het aan de ontwikkelaar welke de voorkeur heeft, maar ze kunnen elkaar ook prima aanvullen.