Big dataspecialist Cloudera heeft onlangs de tool Cloudera SQL Stream Builder gepresenteerd. Met deze tool kunnen dataspecialisten en data scientists met behulp van SQL realtime query’s uitvoeren in realtime datastromen.

Concreet heeft Cloudera met de nu geïntroduceerde oplossing de technologie van het in oktober vorig jaar overgenomen Eventador. Deze door deze overname verkregen technologie moest de mogelijkheden rondom realtime datastreaming van Cloudera verder uitbreiden.

De tool van Eventador is nu geïntegreerd in het Cloudera DataFlow (CDF)-platform voor streaming data. Cloudera CDF levert een gezamenlijke omgeving voor het verwerken van streaming data op basis van de open-source Apache Flink-, Kafka Streams of Spark structured Streaming engines.

Directe bevraging met SQL

Data-analisten en data scientists kunnen nu met Cloudera SQL Stream Builder, direct de streaming data binnen Cloudera CDF met SQL bevragen. Dit on plaats van dat zij, zoals vroeger, daarvoor bepaalde code in Java of Scala moesten schrijven.

Cloudera SQL Stream Builder maakt het ook mogelijk om views van zoekresultaten te maken die via API’s door andere programma’s en tools kunnen worden gebruikt. Daarnaast is de tool in het Shared Data Experience (SDX)-framework van Cloudera geïntegreerd. Hiermee kunnen gebruikers dan governance en security policies binnen CDF uitvoeren.

Concrete gebruiksmogelijkheden

Concrete toepassingen die het gebruik van Cloudera SQL Stream Builder opleveren, zijn onder meer het kunnen vrijmaken van realtime data voor alles soorten eindgebruikers voor onder meer ad-hoc vraagopdrachten, het makkelijker kunnen bouwen van op streaming data gebaseerde applicaties, het integreren van verrijkte datastromen naar andere applicaties en het versneld uitvoeren van zoekopdrachten binnen realtime data met een minimale impact op basissystemen als compute en storage.

Tip: Cloudera voegt analytics-functionaliteit toe aan Data Platform