Object Storage is tegenwoordig een populaire opslagoptie binnen bedrijven. Het formaat blijkt immers ideaal voor het opslaan van ongestructureerde data, waar steeds meer van geproduceerd en geconsumeerd wordt. Tegelijkertijd kan de hoeveelheid data het beheer en de beveiliging lastig maken. Daar wil DataCore op inspelen met zijn Swarm-software.

DataCore richt zich op Software-Defined Storage, waarmee het infrastructuursilo’s en de afhankelijkheid van hardware weg wil nemen. We spraken al eerder met het bedrijf over hoe een unified storage architecture daarbij helpt. In de optiek van DataCore moet er een softwarelaag over de storage ontstaan, om opslag simpeler en effectiever te maken en slimmer in te richten.

Daarvoor kiest DataCore een best-of-breedbenadering. Het bedrijf biedt hiervoor drie kernproducten aan. Het gaat om SANsymphony voor block storage, vFilO voor file storage en Swarm voor object storage. De laatste uit het rijtje is echter de nieuwste toevoeging. We spraken over de ontwikkeling met Senior Solutions Architect Pieter van de Burg.

Explosie van ongestructureerde data

Dat DataCore inmiddels flink in object storage investeert is een logisch gevolg van de populariteit van ongestructureerde data. Daar komt steeds meer van in omloop, omdat het voortkomt uit populaire formaten als video en audio. De komende jaren zal ongeveer drie kwart tot twee derde van alle wereldwijde data bestaan uit ongestructureerde data, een beetje afhankelijk van welke cijfers je er op naslaat. Al die data moet opgeslagen worden met behulp van file- of object storage.

Wanneer je file- en object storage voor ongestructureerde data naast elkaar legt, dan zijn er verschillende redenen om voor object storage te kiezen. Bij deze opslagvorm wordt data opgeslagen als objecten. De objecten worden voorzien van een uniek identificatienummer en metadata. Het identificatienummer maakt het mogelijk de objecten makkelijker te indexeren en identificeren. Van de Burg ziet dit als een hele andere werkwijze dan file storage. “Omdat je geen onderliggend file systeem hebt, wordt data op een platte structuur weggeschreven. Dat is anders dan bij file storage, waar we een hiërarchische manier kennen en folders creëren om bij een file te komen. Bij object storage wordt het object weggeschreven in het cluster. Binnen het cluster is het object vervolgens eenvoudig terug te vinden op basis van het uniek identificatienummer. Het identificatienummer wordt gecreëerd wanneer een applicatie het object wegschrijft.”

Deze opslagmanier blijkt ideaal voor grote hoeveelheden data die voor langere tijd weggeschreven moet worden. Denk hierbij aan video, audio, back-ups en replica’s, compliance data en gegevens voor analytics. Het voordeel van de opslagstructuur is ook dat het ontzettend schaalbaar is. Binnen clusters is heel veel data op te slaan, waar vervolgens ook weer personen met de juiste toegangsrechten bij kunnen. Een simpel klantvoorbeeld voor DataCore Swarm is een streamingplatform. Dergelijke diensten gebruiken object storage voor hun OTT content, waar vervolgens honderdduizenden mensen gebruik van maken.

Swarm software voor beheer

Hoewel object storage een duidelijke usecase heeft, kan de opslagvorm ook complex zijn. De data kan zich on-premises en in cloudomgevingen bevinden, terwijl er ook verschillende protocollen als S3 en HTTP zijn. Het maakt de infrastructuur versplinterd en het beheer lastig. Op dat stuk speelt DataCore met Swarm in. Het plaats een softwarelaag in de infrastructuur om het managen, opslaan en beschermen van de data te versimpelen.

Hiermee realiseren beheerders het volgende:

  • Een enkele FTE kan een cluster met meerdere petabytes beheren.
  • Een gecentraliseerd object storage-infrastructuur. Bevoegde werknemers, partners en klanten (tenants) krijgen tegelijkertijd toegang en zijn te beheren.
  • Analyses uitvoeren om de prestaties en het gebruik van data te meten. Als er afwijkingen plaatsvinden, kunnen beheerders daar op inspelen.
  • De capaciteit en performance zijn eenvoudig op te schalen. Als ze bijvoorbeeld met een minimale cluster grootte van drie servers starten en de business groeit snel, dan is de capaciteit snel te verhogen. Swarm maakt het eenvoudig om disks en serverhardware toe te voegen aan clusters.
  • Kosten zijn beter te beheren en te reduceren. Door de softwarelaag zijn uitgavenrapporten op te vragen, maar ook automatiseringsopties om de resources optimaal te benutten en beheertaken af te laten nemen.

Security naar hoger niveau

DataCore slaat met Swarm dus een versimpelslag wat betreft beheer. Tegelijkertijd ziet Van de Burg veilige data realiseren als een misschien wel net zo belangrijk voordeel. “Je praat niet meer rechtstreeks met de data. Als je een filesysteem hebt, dan kan je rechtstreeks naar je data toe. Bij een object storage-systeem praat je altijd richting een API. Daarin zit een stuk veiligheid; de data kan niet rechtstreeks benaderd worden. In de huidige context van ransomware is dat een extra securitystap. De kans is heel erg klein dat van buitenaf toegang verkregen kan worden richting de data.”

Van de Burg voegt hieraan toe dat DataCore backup en disaster recovery ook use cases zijn van Swarm die inspelen op de ransomware-trend. Swarm kan namelijk voor data immutability zorgen. Met andere woorden, het beschikt over features zoals object locking waardoor de data na het wegschrijven niet meer te wijzigen is. Alleen personen binnen de organisatie met voldoende rechten kunnen het eventueel vrijgeven. Door deze beschermingsaanpak moeten backups veiliger zijn, want die zijn steeds vaker doelwit van ransomware-aanvallen.

Swarm beschikt voor backup- en compliance-doeleinden dus over object locking. Hierdoor is de data lastiger te deleten en te overschrijven. “We kunnen als een heel groot backup-target fungeren, waarvoor object locking heel belangrijk is. We certificeren alle grote backup-applicaties die data weg kunnen schrijven naar een object store. Voor Veeam, Veritas en Rubrik zijn we geschikt”, aldus Van de Burg.

Vanwege wet- en regelgeving zijn er tevens bewaarplichten voor het opslaan van bijvoorbeeld persoonsgegevens. Er kunnen wettelijke bewaartermijnen worden ingesteld, voor waar gegevens te bewaren totdat een bewaarplicht wordt opgeheven. Voor governance doeleinden is de lock zo in te stellen dat alleen geautoriseerde gebruikers gegevens kunnen ontgrendelen.

Capaciteit zoveel mogelijk gebruiken

Inmiddels is DataCore bijna een jaar bezig om het beheer en de veiligheid van object storage met een duidelijke visie aan te pakken. Tot begin 2021 richtte het bedrijf zich met name op block- en file storage. Met de overname van Caringo, de originele maker van Swarm, kwam daar verandering in. Hiermee kan DataCore zijn gewenste best-of-breedaanpak definitief hanteren. De vraag is alleen wel wat Swarm precies uniek maakt, als je bedrijven van best-of-breed wil overtuigen.

Van de Burg geeft aan dat de onderliggende technologie onderscheidend is. “Bij veel andere leveranciers zie je een onderlaag met een file-systeem. Daar komen beperkingen bij kijken met betrekking tot prestaties, schaalbaarheid en de hoeveelheid objecten die je weg kan schrijven. Onze software is volledig op object storage gericht en dus niet beperkt. Op de storage nodes zijn geen disks nodig waar een besturingssysteem op wordt geïnstalleerd. In plaats daarvan wordt de Swarm-software op basis van PXE boot over het netwerk opgestart, wat geen opslagcapaciteit van de node opeist. De data disks worden RAW geconsumeerd, er is geen RAID controller nodig. DataCore Swarm kan daardoor 95 procent van de schijfcapaciteit binnen het cluster daadwerkelijk gebruiken. Voor huishouding hebben we dan nog iets van vijf procent nodig.”

Volgens Van de Burg winst ten opzichte van concurrentie, waar men “tien tot twintig procent overhead kent”. Met meer overhead kunnen bedrijven minder capaciteit gebruiken dan beschikbaar is. “Daarnaast kan je op basis van onze technologie heel makkelijk binnen 90 seconde een node toevoegen aan het cluster. Je hebt dan ook gelijk de beschikking over de capaciteit. Het is ook even makkelijk een node uit een cluster te halen, bijvoorbeeld om hem te vervangen”, voegt Van de Burg toe.

Object storage inrichten

Wat ons betreft is Swarm een logische pion binnen het DataCore-portfolio. Hiermee wil het bedrijf zijn werkwijze om technologie en functionaliteit uit opslaghardware en servers te halen met behulp van software verder uitbreiden naar object storage. Dat is gezien de explosie aan ongestructureerde data welkom, want dat leidt op papier tot complexiteit. DataCore streeft met Swarm dan ook naar eenvoud en beter te beheren en beveiligen object storage.