2min

Cloudera heeft een geïntegreerd dataplatform gepresenteerd dat volledig bestaat uit open source-elementen. Het zogenaamde Data Platform is een ‘one-stop-shopping’ cloud-dienst voor bedrijven die analytics willen uitvoeren in hybrid en multicloud-omgevingen, met enterprise-grade security en governance.

Het Cloudera Data Platform combineert een cloud-native warehouse, een machine learning-dienst en een data hub, schrijft Silicon Angle. Al die onderdelen draaien als instances in containers. De queries worden beheerd door Apache Hive of Apache Impala. Apache Impala werd door Cloudera zelf ontwikkeld.

Met het Cloudera Data Platform kunnen organisaties tijd besparen bij het installeren en configureren van de verschillende elementen die nodig zijn om een data warehouse, analytics workbench of machine learning training suite te maken.

Het platform gebruikt bestaande componenten in de cloud, waardoor de deployment-tijden teruggebracht worden van weken naar uren. De software werkt native op Amazon Web Services (AWS) S3 en ondersteunt het Hadoop Distributed File System.

Data delen

Het platform gebruikt verder de Shared Data Experience van het bedrijf. Dat is een verenigd data framework dat schema-, permissions- en governance-onderdelen bevat. Het framework maakt het mogelijk dat meerdere gebruikers met dezelfde data werken en catalogiseren met de tools die hun voorkeur hebben. Ook kunnen gebruikers workloads naar de cloud migreren.

Het platform verschijnt later dit jaar met jaarlijkse abonnementen die vanaf 10.000 dollar per node gekocht kunnen worden. Over een paar maanden komt er ook preview van een variant van Microsoft Azure. Ondersteuning voor het Google Cloud Platform komt waarschijnlijk volgend jaar.

Open source

Het nieuwe Cloudera Data Platform sluit aan bij de nieuwe open source-strategie die het bedrijf in juli aankondigde. Toen liet het bedrijf weten dat het al zijn software open source wil maken. Onder meer de Cloudera Manager, Cloudera Navigator en Cloudera Science Workbench zijn dat namelijk nog niet. In de laatste helft van 2019 moet daar verandering in komen.

Alle software wordt voortaan onder één van de twee licenties gedistribueerd. Dit zijn Apache License versie 2 en GNU Affero General Public License (AGPL) versie 3. Alle producten die eerder niet open source waren, worden onder APGL gedistribueerd.