8min

Tags in dit artikel

,

Cloudian, een specialist van object storage-toepassingen, timmert steeds meer aan de weg. Vooral omdat object storage erg geschikt is voor het opslaan van massaal gecreëerde ongestructureerde data. Volgens Mike Tso, CEO van Cloudian, is de public cloud voor het opslaan van grote hoeveelheden data eigenlijk niet erg geschikt. Het is beter om het dichter bij de bron op te slaan, zoals in het (lokale) datacenter of zelfs direct aan de edge. Iets waar de steeds populairder wordende storagespecialist zich sterk voor maakt.

Voordat we het over de wetenswaardigheden van Cloudian gaan hebben, is het misschien handig om uit te leggen wat object storage ook alweer is en welke voordelen deze manier van dataopslag heeft.

Bij object storage worden, grofweg gezegd, data opgeslagen als objecten. Deze objecten worden van een uniek identificatienummer, ‘hash’, en uitgebreide metadata voorzien. De toevoeging van het unieke identificatienummer en de metadata maken het mogelijk de (data) objecten makkelijker te indexeren, te identificeren en sneller terug te vinden.

De unieke hash van een object zorgt er verder voor dat data altijd direct benaderbaar is . Zo kunnen de objecten ook snel en eenvoudig worden gerepliceerd.

Alle hardware geschikt als opslagmedium

Object storage hoeft verder niet per se op speciale storage-apparatuur te worden opgeslagen. Eigenlijk zijn alle standaard x86 servers hiervoor geschikt. Dit maakt het makkelijk op de opslag eenvoudig uit te breiden, omdat het niet gebonden is aan de maximale opslagcapaciteit van dedicated storagetoepassingen.

Bedrijven kunnen zelf bepalen welke hardware ze voor het opslaan van object storage willen gebruiken. Wanneer de maximale capaciteit is bereikt, kunnen ze eenvoudig nieuwe capaciteit toevoegen door nodes bij te plaatsen. Dit maakt de schaalbaarheid en het kunnen opslaan van object storage data dus eindeloos.

De rechtstreekse adressering en bijhorende eenvoudige replicatie maken het ook mogelijk dat het opslaan van object storage niet aan een enkele locatie is gebonden. Data kan zo eenvoudig op meerdere plekken worden opgeslagen in verschillende datacenters, waar ook ter wereld. Hiermee wordt eigenlijk een soort data fabric gemaakt en is altijd een kopie van de data beschikbaar.

Een ander voordeel van de rechtstreekse adressering is hogere prestaties bij grote hoeveelheden objecten door een verminderde latency die object storage heeft bij het opvragen van de data dan bij standaard file servers of NAS-oplossingen. Voor het opvragen van objecten wordt de S3 API over http(s) gebruikt.

Grote hoeveelheden ongestructureerde data

Al deze eigenschappen, vooral de metadata en de unieke hash, maken dat object storage vooral geschikt is voor grote hoeveelheden ongestructureerde data en natuurlijk het opkomende big data. Belangrijke toepassingen zijn dan ook de opslag van grote hoeveelheden röntgenfoto’s binnen ziekenhuizen of van (zware) videobestanden. Bedrijven als Facebook, Spotify en Dropbox gebruiken object storage voor het opslaan van hun gigantische dataverzamelingen, zoals user data, foto’s, muziek en allerhande andere soorten data.

HyperStore van Cloudian

Cloudian biedt een eigen platform dat opslag en beheer, waar ook ter wereld, van grote datasets voor bedrijven en organisaties moeten vergemakkelijken. Het zogeheten HyperStore-platform, inmiddels versie 7, biedt naast een ongelimiteerde opslagcapaciteit, ook uitgebreide additionele functionaliteit als databescherming en diverse uitgebreide en slimme beheertools, zoals de RESTful API voor het automatiseren van beheertaken, zo geeft CEO Mike Tso in ons gesprek aan. Dankzij de overname van Infinity Storage in 2018 kan het platform nu ook file based storage opslaan en beheren. Hierdoor levert de toepassing nu het beste van twee werelden.

Appliances, softwaregebaseerd en geschikt voor public cloud

Het platform is leverbaar via dedicated appliances voor datacenters en een software-oplossing. Deze appliances zijn beschikbaar in 1U- en 4U-uitvoeringen, waarbij de laatste versie twee nodes in één apparaat samenvoegt. De beschikbare ruwe opslagcapaciteit van deze appliances varieert tussen de 48 TB tot 840 TB. Vanzelfsprekend bestaat het platform ook in een (virtuele) softwareversie. Deze softwareoplossing kan zowel on-premise als ook in cloudomgevingen draaien.

Het gebruik van de S3 API maakt het mogelijk dat eindgebruikers ook de oplossing van Cloudian met allen grote public cloudomgevingen kunnen combineren, zoals Amazon AWS S3, Microsoft Azure en Google Cloud Platform. Op deze manier kunnen de schaalbaarheid en redundantie dus makkelijk nog verder worden uitgebreid.

Public cloud ongeschikt voor grote hoeveelheden storage

Ondanks bovenstaande integratie met public cloudomgevingen van de eigen oplossing, is het opvallend dat Mike Tso in ons gesprek aangeeft dat grote hoeveelheden storage, in dit geval object storage, toch veel meer geschikt is voor opslag in lokale datacenteromgevingen dan in de grote public cloudomgevingen. Dat is dus waar het bedrijf met zijn appliances en virtuele toepassing op in speelt.

De topman van Cloudian vergelijkt de snelheid van de datagroei met die van de Wet van Moore voor chipsets. Alle sensors, van fotocamera’s of die van röntgenapparatuur, genereren al die data die ergens moet worden opgeslagen, op flash of iets anders. Wanneer de chips binnen deze sensors worden verbeterd, genereren ze meer data, wat weer tot meer benodigde opslagcapaciteit leidt. Dit kan met meer storage-apparatuur, maar dat lost het probleem volgens de topman niet op. Niemand wil constant (dure) storage-apparatuur bijplaatsen.

Public cloudomgevingen kunnen dan de oplossing zijn, maar Cloudian zag eigenlijk al vanaf het begin dat er zo toch vroeg of laat problemen optreden met de onderliggende netwerkinfrastructuur voor de snelheid van het datatransport. Eindgebruikers kunnen merken dat er latency optreedt in het datatransport tussen de locatie en de public cloudomgevingen of dat bepaalde functionaliteit niet goed werkt.

De oorzaak is volgens Tso dat de voor datatransport benodigde glasvezelcapaciteit niet automatisch meegroeit met de hoeveelheid data die wordt gecreëerd. De glasvezelcapaciteit gaat zo nu en dan omhoog, wanneer er nieuwe bekabeling wordt bijgelegd, maar blijft daarna weer gelijk. De hoeveelheid data blijft wel constant toenemen, maar de capaciteits- en bandbreedteproblemen en daarmee dus ook de latency blijven dus bestaan. Dit probleem kan volgens de CEO alleen worden opgelost wanneer de groei van data en die van bandbreedte gelijk blijven.

Lokale datacenter heeft nog bestaansrecht

Hieruit kun je concluderen dat er dus in plaats van een stap naar de public cloud, vooral voor object storage, nog een plek is in het (lokale) datacenter. Volgens de topman van Cloudian gaat dus het huidige beeld van de markt dat het (lokale) datacenter op termijn geheel naar public cloudomgevingen verhuist dan ook niet op.

Sterker nog, zo geeft hij aan, er is juist een ontwikkeling dat de public cloudomgevingen zich juist naar de plek begeven waar de data wordt gecreëerd. Zeker als het gaat om die grote zware (ongestructureerde) databestanden van tegenwoordig. Dit geeft het (lokale) datacenter dus recht van voortbestaan. Met zijn appliances en virtuele oplossing speelt de storagespecialist natuurlijk daar handig op in. Eigenlijk wordt hiermee de missie van de storagespecialist pas echt duidelijk: het leveren van de opslagcapaciteit van de public cloud in het (lokale) datacenter.

Storage gaat naar de edge

Voor de toekomst ziet Tso dat de locatie waar data moet worden opgeslagen zich nog dichter naar de edge gaat begeven. Dit omdat daar, bijvoorbeeld door de komst van 5G en use cases als de connected car, de enorme groei van data gaat plaatsvinden. Het is tijd voor een Cloudian-oplossing in de Tesla, zo grapt de CEO.

Meer concreet geeft hij aan dat Cloudian al serieus werkt aan oplossingen om data van edge-omgevingen als voertuigen, zo snel mogelijk en met hoge kwaliteit te kunnen opslaan. Inmiddels wordt samengewerkt met de stad Montebello in de Verenigde Staten om data van beveiligingscamera’s in stadsbussen, grote bestanden, snel en zonder problemen te kunnen offloaden. Voor de samenwerking gebruikte deze stad eerst nog een NAS-oplossing waarop de in de bus aanwezige lokale storage iedere drie uur via een 4G-verbinding rechtstreeks werden geoffload voor verdere analyse. Vaak gaf dit problemen wanneer de mobiele verbinding werd verbroken, waardoor de bestanden vaak incompleet of gecorrumpeerd overkwamen.

Nu gebruikt de stad in Californië de HyperStore-oplossing van Cloudian in hun datacenter. Nu vindt offloading via 4G/wifi plaats en worden de data als S3-bestanden op de appliances van de storagespecialist opgeslagen. Geavanceerde en proactive mechanismen binnen de HyperStore oplossing zorgen ervoor dat corrupte bestanden en bit rot tot het verleden behoren. De opgeslagen data kunnen daardoor, met behulp van de kunstmatige intelligentietoepassing Stream van de storagespecialist, makkelijker worden geanalyseerd. Uiteindelijk leverde dit de klant meer schaalbaarheid, kostenreductie, S3-interoperabiliteit en betere metadata op.

Overige ontwikkelingen

Naast het brengen van meer opslagcapaciteit naar de edge, is Cloudian ook flink bezig met het toepassen van kunstmatige intelligentie, vooral voor de met object storage meegebrachte metadata. Zo werkt de storagespecialist samen met de AI-specialist Machine Box op het gebied van machine learning om in object storage verborgen content nog makkelijker te vinden en te doorzoeken.

Vanzelfsprekend wordt voor innovatie ook nauw samengewerkt met alle grote techgiganten op het gebied van networking; van Cisco of HPE tot Veeam en van Splunk tot aan Veritas of Commvault. In combinatie met de diverse samenwerkingen met distributeurs en resellers creëert de stoargespecialist hiermee zijn eigen zo breed mogelijke ecosysteem.

Focus op groei en klanten

De visie van Cloudian op het gebied van object storage en het belang van het (lokale) datacenter heeft het bedrijf de laatste tijd geen windeieren gelegd. De storagespecialist heeft zijn klantenbestand in 2018 aardig zien toenemen. Volgens Tso is Cloudian vooral in de EMEA-sector erg in trek. Deze regio zou inmiddels ongeveer de helft van de totale omzet van het bedrijf vertegenwoordigen. Ook wist het bedrijf zich in steeds meer verticale markten uit te breiden, zoals in de gezondheidszorg. Het bedrijf, dat zich zo langzamerhand in een echte scale-out fase bevindt of misschien al zelfs is gepasseerd, ontving het afgelopen jaar ook maar liefst 95 miljoen dollar (84 miljoen euro) aan nieuwe externe funding.

Verder signaleert de CEO veel overstappers van traditionele storageleveranciers, zoals NetApp, of producten van fabrikanten als Dell Isilion. De belangrijkste reden om Cloudian te gebruiken, zo geeft de CEO nog eens aan, is dat bedrijven en organisaties zich afvragen waar ze hun groeiende data kunnen onderbrengen tegen lage kosten en met hoge betrouwbaarheid. Daarnaast ziet hij vaak bedrijven overstappen die eerst met een klein probleem binnenkomen, zoals voor datamanagement of dataprotectie. Deze klanten ontdekken vervolgens dat ze met de compacte oplossing van Cloudian veel meer kosten besparen en vinden meestal snel meer use cases die ook goed bij de oplossing passen.

Cloudian timmert dus behoorlijk aan de weg de laatste tijd. Het bedrijf ziet veel nieuwe klanten komen en gaat zich daar dan ook voor 2019 flink op richten. We hopen dat deze focus op marktgroei niet ten koste gaat van nieuwe oplossingen. Met zijn innovatie op het gebied voor object storage en het (lokale) datacenter is de specialist redelijk ‘disruptive’ bezig en het zou zonde zijn als deze focus wordt ondergesneeuwd door alleen aandacht voor groei en klanten. We blijven daarom benieuwd naar de toekomstige technische ontwikkelingen die het bedrijf gaat brengen.