Pure Storage wil harddisks definitief overbodig maken

Pure Storage wil harddisks definitief overbodig maken

“Disk is done”, horen we tijdens Pure Accelerate 2023 heel vaak. Het is gedaan met harddisks, om het in het Nederlands te zeggen. Pure Storage heeft een duidelijke visie op dit punt en een strategie waarmee het deze belofte waar zegt te kunnen maken. We zetten deze in dit artikel uiteen.

Pure Storage is een bijzondere speler in de storage-markt. Het bedrijf is vanaf de oprichting bijna 15 jaar geleden in 2009 volledig gericht geweest op het aanbieden van flash-storage. Het heeft nooit een product gemaakt waar harddisks in zitten. Vanuit dat perspectief bekeken is de stelling dat we zo snel mogelijk van harddisks af moeten heel erg logisch. Als meer storage overgaat naar flash, krijgt Pure een groter marktaandeel. De trend is overigens ook dat flash steeds breder beschikbaar komt. Zeker met de komst van QLC-flash werd het weer een stuk beter betaalbaar. TLC en daarvoor SLC was (en is) erg prijzig.

De natuurlijke overgang van magnetische harde schijven naar flash gaat Pure echter niet snel genoeg. Met name vanaf dit jaar heeft het de aanval op harddisks pas echt geopend. Daar zijn redenen voor, zoals we verderop zullen zien. Pure is zo overtuigd van het eigen gelijk dat het een voorspelling heeft gedaan. Vanaf 2028 zullen er geen nieuwe harde schijven meer verkocht worden. Dat is nog maar vijf jaar vanaf nu. Als je bedenkt dat de storagemarkt op dit moment nog voor het overgrote deel bestaat uit systemen die harddisks gebruiken, moet er nog wel het nodige gebeuren voor die tijd.

Op zich is het niet meer dan logisch dat harde schijven uiteindelijk zullen verdwijnen. Ze zitten al niet meer in de meeste apparatuur. In de eerste iPod zat een harde schijf en ook laptops gebruikten ze bijvoorbeeld. Dat is allemaal vervangen door NAND-flash. In de basis is NAND energiezuiniger en biedt het betere prestaties dan harde schijven. Je creëert dus significant betere producten als je afstapt van de ouderwetse technologie op de moderne. Op dit moment worden HDD’s alleen nog maar gebruikt op twee locaties: data centers van (enterprise-)organisaties en data centers van hyperscalers. De enige reden dat ze daar nog worden gebruikt, is omdat HDD’s goedkoper in aanschaf zijn dan flash-gebaseerde opslag.

Pure heeft de wind mee

Voor we ingaan op de specifieke technische redenen waarom Pure denkt dat het een goede kans maakt om een groot gedeelte van de traditionele storagemarkt over te nemen, kijken we eerst even kort naar de positie van Pure in de markt. Daaruit blijkt dat het bedrijf een zeer gezonde groei laat zien. Inmiddels is de jaaromzet voorbij de 2 miljard dollar en vervangt Pure ook steeds vaker harddisks, geeft CEO Charlie Giancarlo aan in een sessie die we bijwoonden tijdens Accelerate.

Pure_facts

Om de prestaties van Pure verder te benadrukken, zien we tijdens het event meerdere keren onderstaande slide voorbijkomen:

Pure_market_share

Op basis van cijfers van IDC blijkt dat Pure de enige storageleverancier is die tussen 2014 en 2022 een groter marktaandeel gekregen heeft. Alle andere hebben een beetje tot veel in moeten leveren.

DFM als onderscheidende factor

Als we op zoek gaan naar redenen waarom Pure het zo goed doet in de markt, kunnen we niet om DFM heen. De DirectFlash Module kun je zien als de basis van al het succes van het bedrijf. De naam van deze modules geeft al een beetje aan wat het is en wat het doet. Dit zijn modules die Pure zelf ontwikkelt en waarop het NAND-flash plakt. Dit flash-geheugen kan het vervolgens rechtstreeks aanspreken vanuit Pure1, de beheeromgeving voor FlashArray- en FlashBlade-producten.

Bovenstaande architectuur is radicaal anders dan die van harddisks en SSD’s. Zo gebruiken SSD’s een extra laag met tabellen die in DRAM opgeslagen worden. Deze tabellen mappen de writes van de SSD’s naar het flashgeheugen. Daarvoor moet ruimte op de SSD vrijgemaakt worden. We hebben het hier over 1GB per 1TB. Daarnaast moeten SSD’s ook overprovisionen, om er zeker van te zijn dat ze altijd kunnen leveren. Denk aan overwrites die ze moeten doen vanwege problemen met de I/O alignment. Dit overprovisionen gaat al snel om zo’n twintig procent. Voor HDD’s gelden dezelfde dingen overigens, alleen gaat het daar om nog hogere percentages.

Bij een DFM is het niet nodig om een mapping-tabel in een extra laag in DRAM te laten draaien. Er is ook geen overprovisioning van NAND nodig. Het mappen van writes naar flash is host-gebaseerd. Dat wil zeggen dat het rechtstreeks vanuit de beheeromgeving gebeurt.

Pure_DFM

Bovenstaande kan uiteraard alleen maar als hardware en software optimaal op elkaar zijn afgestemd. Daar zit dan ook de crux. Pure ontwikkelt en bouwt alles zelf. Dit was niet vanaf het begin van het bestaan zo overigens. In het begin gebruikte Pure ook SSD’s in hun allereerste FlashArrays. Sinds 2014 heeft het de overstap gemaakt naar DFM’s.

De keuze in 2014 voor DFM’s maakt Pure in de basis een fundamenteel andere storageleverancier dan alle andere bekende namen. Die brengen ook steeds meer flash-gebaseerde systemen op de markt, maar die maken allemaal gebruik van SSD’s. SSD’s werken echter globaal hetzelfde als HDD’s, alleen zijn ze een stuk sneller. Je blijft met dezelfde problemen rondom overhead zitten.

Deze problemen zorgen ervoor dat de capaciteit van SSD’s een stuk minder hard zal groeien dan die van DFM’s. In de nieuwe FlashArray//E zit bijvoorbeeld een DFM met een capaciteit van 75 TB. SSD’s zitten op 30 TB. Eind volgend jaar brengt Pure een model met een capaciteit van 150 TB op de markt. De verwachting is dat SSD’s dan op 60 TB zitten. Eind 2025 zal Pure de 300 TB per DFM aantikken. Dit zonder dat de modules groter worden overigens. Ze plakken gewoon meer NAND op een module.

Over HDD’s hoeven we het in deze vergelijkingen al helemaal niet meer te hebben. Die zullen in de huidige vorm veel eerder tegen hun limieten aan gaan lopen. De verschillen tussen DFM’s aan de ene kant en SSD’s en HDD’s aan de andere kant, zullen alleen maar groter worden, is de voorspelling tijdens Accelerate van een van de oprichters van Pure, John Colgrove.

Het wordt betaalbaarder

Het klinkt natuurlijk allemaal interessant, DFM’s met een enorme capaciteit. Er is echter ook nog zoiets als betaalbaarheid. Dat was (en is) altijd de voornaamste reden voor organisaties om alsnog voor HDD’s te gaan, ten opzichte van flash. De aankondiging van FlashArray//E speelt hier op in. Hiermee completeert het bedrijf het portfolio (waar we verderop nog dieper op ingaan). FlashArray//E is gericht op het aanbieden van een zo hoog mogelijke capaciteit aan file en block storage, voor een zo laag mogelijke prijs. Het is de tegenhanger van FlashBlade//E, dat eerder dit jaar op de markt kwam en file en object storage in een enkel platform aanbiedt.

Pure_Charlie_Giancarlo
Charlie Giancarlo, CEO van Pure Storage

Pure wil overduidelijk een statement maken met de //E-lijn. Het wil in principe de volledige onderkant van de markt ermee afdekken. Het is de eerste keer dat een FlashArray en een FlashBlade dezelfde naamgeving hebben gekregen. Ze willen beide hetzelfde bereiken, maar dan voor verschillende workloads. Pure heeft het zelf over prijs per GB van 20 dollarcent. We horen van Jay Subramanian, verantwoordelijk voor de FlashBlade-business van Pure, dat deze prijs is gebaseerd op de 48TB DFM die in FlashBlade//E zit. De nieuwste DFM met een capaciteit van 75 TB komt over een maand of wat op de markt.

De prijs per GB heeft overigens een leidende rol gespeeld in de ontwikkeling van FlashBlade//E en FlashArray//E. Dat maken we op uit de woorden van CTO International Alex McMullan, als we hem vragen naar een calculatie voor de 20 cent per GB. Dit is volgens hem geen enorm ingewikkeld rekensommetje en is vooral gebaseerd op de zogeheten cost of goods. Om het rekensommetje te laten kloppen, moet er een bepaalde capaciteit flash afgenomen worden. Het minimale commitment van 1 PB voor FlashArray//E en 4 PB voor FlashBlade//E is daar voor een groot gedeelte het resultaat van. Met andere woorden, met respectievelijk 1 en 4 petabyte kom je uit op 20 cent per gigabyte. Daaruit volgt ook dat de kosten per gigabyte nog verder naar beneden gaan als je meer afneemt.

Meer dan prijs per gigabyte

20 cent per GB is voor flash zonder twijfel een lage prijs. Kijken we echter naar HDD’s, dan lijken die toch wel nog steeds een heel stuk voordeliger te zijn. Daarvan zit de prijs tegenwoordig al in de buurt van een dollarcent per GB. Dus zo betaalbaar klinkt het allemaal nog niet echt.

Toch moeten we hier ook weer de nodige kanttekeningen bij plaatsen. Allereerst is een GB op een HDD niet hetzelfde als een GB op een DFM. We hebben hierboven gezien dat een DFM veel meer bruikbare capaciteit heeft dan een HDD (en een SSD). Om aan de bruikbare capaciteit van een DFM van 75 TB te komen, heb je heel wat meer nodig dan 75 TB aan HDD’s. Hierdoor kruipen de prijzen per gigabyte dus sowieso iets naar elkaar toe.

Daarnaast is er ook nog het stroomverbruik. Op dat punt kan flash een enorme slag maken. Tijdens Accelerate stond er iemand van Virgin Media O2 op het podium die het had over een afname van 98 procent in energieverbruik ten opzichte van wat ze hadden staan voordat ze naar Pure overstapten. Uiteraard is een dergelijk rekensommetje afhankelijk van waar je vandaan komt en hoe oud (lees: onzuinig) de apparatuur was. Maar het mag duidelijk zijn dat een significant lager aantal vierkante meters en racks gekoppeld aan een inherent lager stroomverbruik een forse besparing op het gebied van energieverbruik kan opleveren. Dat is zeker met de ontwikkelingen op de energiemarkt van de afgelopen paar jaar in het achterhoofd een zeer interessante bijkomstigheid, nog los van het groene aspect ervan.

Het is erg lastig om een accuraat kostenplaatje te maken voor HDD’s, SSD’s en DFM’s, omdat er behoorlijk wat variabelen meespelen. Maar we durven wel te stellen dat blind kiezen voor HDD’s, omdat deze goedkoper zijn niet meer de beste benadering is. Organisaties doen er goed aan om iets verder te kijken dan dit kale bedrag per gigabyte.

Compleet en overzichtelijk portfolio

We hebben hierboven al enkele producten uit het aanbod van Pure genoemd. Hoog tijd om het portfolio als geheel eens onder de loep te nemen. Dat is namelijk best opvallend te noemen. Allereerst omdat het heel erg overzichtelijk is. Pure voert in principe twee productlijnen, FlashArray en FlashBlade. De eerste richt zich op unified file en block storage, de tweede op unified file en object storage. FlashArray kun je zien als de storage voor alle mission-critical en alledaagse workloads, FlashBlade richt zich meer op zaken zoals HPC, het trainen van AI-modellen, analytics, genomics, dat soort dingen.

Binnen de twee hoofdcategorieën heeft Pure een onderverdeling aangebracht op basis van een spectrum, dat loopt van ultieme prestaties naar ultieme capaciteit. Voor de beste prestaties binnen FlashArray, kom je uit bij FlashArray//XL, binnen FlashBlade is dat FlashBlade//S. FlashArray//X heeft nog altijd het zwaartepunt op prestaties, bijvoorbeeld door het gebruik van TLC-flash net zoals de //XL. FlashArray//C moet de optimale balans bieden tussen prestaties en capaciteit, terwijl de nieuwe FlashArray//E vooral om een zo hoog mogelijke capaciteit draait. Hier treffen we ook de FlashBlade//E aan. Deze laatste drie gebruiken QLC-flash.

Pure_family

FlashBlade//E wordt dus ook gebruikt voor de zware workloads die we hierboven aanhaalden voor FlashBlade//S, maar dan voor data die minder vaak gebruikt wordt. Volgens Subramanian is dit in zo’n tachtig procent van de gevallen aan de orde. De toevoeging van FlashBlade//E eerder dit jaar is dan ook een enorme sprong vooruit voor Pure in deze markt. Dit is namelijk allemaal potentieel nieuwe business. Voorheen gebruikten organisaties hiervoor HDD’s of SSD’s. Hij verwacht hier heel veel groei in.

Nog meer vereenvoudiging en convergentie

Het portfolio is op zich al behoorlijk overzichtelijk, maar achter de schermen is Pure bezig geweest om het geheel nog wat meer met elkaar te laten versmelten, horen we tijdens een technische deep dive. De nieuwe versie van de FlashArray//X en FlashArray//C, de R4-versies, die Pure tijdens Accelerate aankondigde, worden vaak als XC R4 aangeduid. Dat is niet uit luiheid, daar heeft Pure goede redenen voor. Achter de schermen is er namelijk sprake van steeds meer convergentie. Het gaat hier om arrays met dezelfde NIC’s, dezelfde CPU’s en dezelfde controllers. De controller wordt uiteraard anders ingezet, maar is in de basis hetzelfde. Het voornaamste verschil is dat FlashArray//C R4 gebruikmaakt van QLC-flash, terwijl FlashArray//X R4 gebruikmaakt van TLC-flash.

Een dergelijke vereenvoudiging achter de schermen betekent niet alleen dat het ontwikkelen van producten op deze manier sneller kan gaan. Het zorgt er ook voor dat het op het gebied van reserveonderdelen overzichtelijker wordt. Dat zou dan op termijn ook weer merkbaar moeten zijn voor klanten. Deze onderdelen kunnen in grotere aantallen gemaakt worden, dus dan moet de prijs ervan ook gaan zakken.

De nieuwe FlashArray//C R4 en FlashArray//X R4 bieden ondanks een vereenvoudiging achter de schermen een enorme sprong voorwaarts op het gebied prestaties. Waar de prestatieverbetering van de ene naar de andere generatie voorheen zo’n 20 procent bedroeg, is dat met de R4-versie zo’n 40 procent, horen we van Shawn Hansen, VP en GM voor FlashArray bij Pure. Tijdens de technische deep dive stelt een van de woordvoerders van Pure dat de prestatiesprong voor FlashArray//C zelfs 65 procent bedraagt. Dat zijn zonder twijfel zeer stevige prestatiewinsten.

Waar deze prestatieverbeteringen precies aan toe te schrijven zijn, is een beetje moeilijk om duidelijk te krijgen. Hoeveel is door nieuwe hardware (zoals Intel’s Sapphire Rapids Xeon Scalable-cpu’s) en hoeveel is door wat Pure eraan toevoegt? Daar krijgen we geen heel duidelijk antwoord op. Wel kunnen we melden dat PCIe 5 vooralsnog niet beschikbaar is op de FlashArray, ook al ondersteunt Sapphire Rapids dit wel. Een belangrijke reden om op PCIe 4 te blijven heeft te maken met energieverbruik. Daarnaast ziet Pure dat er op dit moment ook geen vraag is naar de bandbreedte die PCIe 5 te bieden heeft.

Eenvoud staat voorop

Op het gebied van het portfolio houdt Pure overduidelijk van duidelijkheid en eenvoud. De enige afwijking daarop zou kunnen zijn dat er wat verwarring kan ontstaan doordat er nu twee verschillende modellen zijn met de toevoeging //E. Aangezien FlashBlade en FlashArray fundamenteel andere use-cases hebben, zal deze verwarring in de praktijk wel meevallen. Voor het overige is het sowieso eenvoud wat de klok slaat in het aanbod van Pure.

Deze eenvoud is erg moeilijk om te bereiken, horen we in gesprek met Pure CTO Rob Lee. Het is van oudsher ook niet gebruikelijk om te sturen op eenvoud. Iedere keer als er een nieuwe feature wordt toegevoegd, is er de verwachting dat gebruikers deze kunnen configureren, geeft hij aan. Maar veel opties aanbieden creëert complexiteit, en dat is nu juist niet de bedoeling. Een goed voorbeeld van hoe serieus Pure deze eenvoud neemt, is het feit dat er geen powerknop op hun apparatuur zit. Aangezien Pure zero-downtime garandeert, ook bij het upgraden van arrays en blades naar de nieuwste generatie volgens het Evergreen-principe, is een dergelijke knop ook helemaal niet nodig.

Lee ziet op dit punt nog wel een uitdaging binnen veel organisaties. Ze krijgen zeker regelmatig te horen van potentiële klanten dat ze meer willen kunnen doen en zien. Dat gaat echter vooral om angst, is Lee van mening. Het idee dat je meer weet als je meer data hebt is behoorlijk vastgeslagen in de hoofden van mensen.

Als je het helemaal platslaat, levert de nadruk op eenvoud van Pure een heel overzichtelijk plaatje op. Er is één OS met Purity, één managementlaag met Pure1 en twee hardware-architecturen met FlashArray en FlashBlade. Binnen die verschillende componenten probeert Pure ook zoveel mogelijk te vereenvoudigen. Dat lukt ook behoorlijk goed, al kan de interface van Pure1 nog wel wat aandacht gebruiken wat ons betreft. Daar komen inmiddels wel heel veel opties in het paneel aan de linkerkant van het scherm te staan. Naarmate de mogelijkheden van een dergelijk beheerplatform toenemen, ontkom je er niet aan dat er op den duur iets aan gedaan moet worden.

Pure_DFM_SSD_HDD
Van links naar rechts: de nieuwe 75TB DFM van Pure, een SSD-module en een HDD.

Evergreen volgens een cloudmodel met SLA’s

Waar DFM op het gebied van de technologie de onderscheidende factor is voor Pure, heeft het ook op het gebied van de levering van producten en diensten een ijzer in het vuur op dit punt. Het doel is namelijk om klanten altijd op de meest recente versie van het platform te hebben en te houden. Dit geldt zowel voor de software als voor de hardware. Dat eerste, software-as-a-service, is niet zo ingewikkeld. Het tweede, hardware-as-a-service, is dat wel, volgens Prakash Darji, GM Digital Experience Business Unit bij Pure. Het bedrijf belooft immers zero-downtime. Hoe doe je dat als je een systeem komt upgraden of vervangen? Pure doet dit altijd zonder de data van klanten te hoeven migreren, geeft hij aan.

Als we kijken naar een cloudmodel, dan gaat het niet alleen om hoe je het afneemt, maar ook hoe je het gebruikt. Op dit punt speelt Pure Fusion een belangrijke rol. Hiermee schaf je feitelijk de tiering af binnen je organisatie. Je beheert al je storage als een storage pool (of neemt dit af als een service), waarbij je niet meer na hoeft te denken over welke data waar moet landen.

Een derde belangrijke pilaar wat betreft het afnemen van wat Pure te bieden heeft bestaat uit de SLA’s die het biedt. Dit gaat dan om wat je de digitale ervaring zou kunnen noemen. Pure biedt op dit punt inmiddels zes SLA’s aan: uptime, buffer capacity, performance, zero planned downtime, energy efficiency en de meest recente is ransomware recovery. Met die laatste gaat ook Pure zich dus meer bemoeien met de security posture van organisaties. Het is daarnaast de eerste SLA die niet standaard bij een contract met Pure zit. Het is een add-on.

Volgens Taruna Gandhi, VP Product Marketing, Digital Experience Business Unit bij Pure, is de toevoeging van deze meest recente SLA een belangrijke stap, want het is van belang om resilience op alle lagen van de IT-omgeving optimaal in te richten. Met deze meest recente SLA krijg je aanbevelingen om dit te doen voor het gedeelte waar Pure in opereert. Daarnaast is er in deze eerste iteratie ook al anomaly detection beschikbaar. Hiermee signaleert Pure1 dat er een plotse afname in de hoeveelheid data is. Richting de toekomst gaan er nog meer van dit soort signalen bijkomen, geeft ze aan. Denk hierbij aan het aanpassen van bestandsnamen, iets wat ook kan duiden op vuil spel.

Wegvagen van harddisks is geen pure prijs/technologie-discussie

In dit artikel hebben we geprobeerd om de unieke benadering van Pure in de storagemarkt te schetsen. Dit om duidelijk te krijgen hoe het bedrijf de claim/belofte dat harddisks hun tijd hebben gehad kan gaan waarmaken. Daarbij is het goed om te beseffen dat het om veel meer draait dan alleen de prijs per gigabyte en de technologie van DFM’s. Pure strooit zelf heel graag met allerlei indrukwekkende cijfers. Hoeveel beter de prestaties zijn, hoeveel hoger de capaciteit, hoeveel lager de footprint en ga zo maar door. Dat is op zichzelf erg interessant, maar het is wat ons betreft niet de manier waarop Pure iedereen van de harddisks af gaat krijgen.

Het probleem in de storagemarkt is dat storage wordt gezien als een commodity. Dat is op zich een goede zaak, maar betekent ook dat veel organisaties erover nadenken als een uniforme markt als het gaat om apparatuur. Storage is storage, niet meer, niet minder. Voor de meeste leveranciers is dat ook zo. Bij Pure ligt dat toch net iets anders. Deels vanwege de DFM’s, maar vooral vanwege het model dat het eromheen heeft gebouwd. De SaaS- en HwaaS-benadering van Pure maakt het bedrijf bijzonder. Daar zit wat ons betreft de echte meerwaarde van de investering die een klant doet.

Dat is niet per se een eenvoudig verhaal om te vertellen. Met name hardware-as-a-service heeft in de infrastructuurwereld geen enorm goede naam, want duur. Pure doet ook dit echter op een andere manier dan veel andere leveranciers. Dat verhaal moeten klanten vooral goed gaan snappen. Dan gaat Pure nog veel harder doorgroeien de komende jaren dan het nu al doet en is al die oorlogstaal richting harddisks helemaal niet nodig. De focus op eenvoud moet het hierbij dan uiteraard wel streng blijven bewaken. Dat spreekt voor zich. Zonder eenvoud is er geen Pure, ook al is de eenvoudige route niet altijd de snelste en makkelijkste.