Pure’s oranje R&D-bloed stroomt in Praag: een kijkje achter de schermen

Investeringen in R&D betalen zich uit

Pure’s oranje R&D-bloed stroomt in Praag: een kijkje achter de schermen

R&D speelt een cruciale rol bij alles wat Pure Storage doet. Dat is althans wat het bedrijf naar buiten toe uitdraagt. Op basis van de successen die het bedrijf heeft gekend sinds de oprichting in 2009 lijkt deze bewering ook zeker te kloppen. Wij gingen op uitnodiging van Pure op bezoek bij de R&D-locatie in Praag. Niet om naar de mooie architectuur van die stad te kijken, maar om meer te horen over de architectuur van de producten en diensten van Pure. Daarnaast kregen we de gelegenheid om bij Foxconn langs te gaan om te kijken hoe de FlashArrays en FlashBlades in elkaar gezet worden voor klanten.

Pure Storage is een Amerikaans bedrijf, met het hoofdkantoor in Santa Clara in Californië. In de bedrijfsvoering is het echter niet enorm op de VS gericht. Dat is een van de eerste zaken die Paul Melmon, die het R&D-center van Pure in Prague leidt, duidelijk wil maken. Er zijn drie van dit soort locaties, verspreid over de wereld. Naast die in Praag zijn er ook in Santa Clara en in Bangalore. Belangrijk is dat de twee buiten de VS op hetzelfde niveau opereren als het R&D-center in/bij het hoofdkantoor. Ze hebben alle drie “leiderschap”, zoals Melmon het noemt, en bestrijken het hele portfolio van Pure.

De twee locaties buiten de VS krijgen dus niet alleen maar een opdracht om iets uit te voeren wat ze in Santa Clara hebben bedacht. Zo heeft het R&D-team in Praag het DRaaS-aanbod Pure Protect voor de volle 100 procent ontwikkeld, geeft Melmon aan. Ook iets compleet anders, Portworx Data Services, komt in zijn geheel uit de koker van de mensen in Praag. Er werken meer dan 600 mensen op deze locatie. Het gaat ook om meer dan alleen R&D inmiddels. Er zijn tegenwoordig ook mensen die zich bezighouden met ondersteuning en er is een gedeelte van de finance-afdeling ondergebracht, om een paar zijstraten te noemen.

Een man staat naast een presentatiescherm met informatie over mijlpalen in de R&D-techniek in Praag, met producten als FlashArray, PureFusion en Pure Protect.
Paul Melmon licht enkele belangrijke bijdrages van het R&D-team in Praag uit.

R&D speelt centrale rol

Overkoepelend is de rol die een R&D-locatie zoals Praag speelt in de algemene strategie van Pure ook niet te onderschatten. Een kleine twintig procent van de totale omzet van Pure Storage stopt het in R&D (19,7 procent, om precies te zijn). Dat percentage ligt “veel hoger dan dat van de concurrenten”, aldus Melmon. Die zitten volgens hem in de enkele getallen (onder de 10 procent dus).

De boodschap is duidelijk, R&D speelt voor Pure verhoudingsgewijs een belangrijkere rol dan voor de concurrenten van het bedrijf in de storagemarkt. Pure is sowieso een bijzonder bedrijf wat ons betreft. Het is een van de weinige relatief grote en relatief jonge storagebedrijven die ons te binnen schieten, als het al niet de enige is. De meeste grote zijn namelijk al behoorlijk oud en de meeste jonge zijn nog niet zo heel groot (en worden dat vaak ook niet).

Met een omzet die naar verwachting door de 3 miljard dollar heen zal gaan in het huidige fiscale jaar, dat bijna afgelopen is, heeft Pure zich in net iets meer dan 15 jaar tussen de gevestigde namen genesteld. Dat kunnen niet veel veelbelovende storage-startups uit dezelfde periode zeggen. En die zijn er echt veel geweest. De storagemarkt is echter een behoorlijk lastige, omdat opboksen tegen de grote jongens voor veel nieuwe bedrijven onmogelijk blijkt. Dus die worden dan vaak opgekocht door die grotere bedrijven, of verdwijnen weer.

Zonder R&D geen DFM

De nadruk op zelf nieuwe dingen onderzoeken en ontwikkelen heeft Pure ver gebracht. Een van de voornaamste redenen voor het succes van Pure ligt wat ons betreft dan ook in R&D. Het is de focus op het ontwikkelen van iets radicaal nieuws, namelijk de Direct-Flash Module (DFM) en de software-defined laag die erboven ligt, die Pure in staat stelde om iets fundamenteel anders en naar eigen zeggen uiteraard ook beters op de markt te brengen.

Als Pure het bij SSD’s had gehouden, waar het de eerste jaren van het bestaan de arrays mee vulde, was het nu niet geweest waar het is. Pure’s Evergreen-belofte en de software die een centrale rol speelt in het aanbod hadden er waarschijnlijk wel voor gezorgd dat het een zekere mate van succes zou hebben. We zien echter geen scenario voor ons waarin het zo succesvol was geweest met SSD’s als het nu met DFM’s is. Als je ziet hoe langzaam overige storagespelers overstappen op SSD’s, was het in ieder geval allemaal een stuk langzamer gegaan met de ontwikkeling van Pure. Die stelling durven we wel aan.

Dankzij het verhaal rondom DFM’s wist Pure grote bedrijven met stevige wensen en eisen op het gebied van storage aan zich te binden. Het had iets nieuws te vertellen dat ook meetbaar anders en voor de nodige workloads beter was dan andere vormen van storage. Dankzij Pure’s Evergreen-model, waarbij ook zaken zoals abonnementen en dergelijke om de hoek kwamen kijken, was er weinig verloop van klanten. Hiermee lag de weg open naar meer.

AI en storage

Spoelen we vooruit naar 2025, dan zien we wat dat ‘meer’ uit de laatste zin van de vorige sectie kan zijn. AI lijkt een redelijk grote impact op de storagemarkt te gaan krijgen. Pure werkt al sinds 2016 met Meta aan opslag in combinatie met AI, horen we van CTO Rob Lee, die ook aanwezig is bij het evenement in Praag. Het bedrijf heeft inmiddels al meer dan 100 AI-klanten.

Het gaat bij storage voor AI niet alleen om prestaties, maar vooral ook om andere zaken. Betrouwbaarheid is er eentje van, maar flexibiliteit is volgens Lee zonder twijfel de belangrijkste. De meeste workloads zijn tot nu toe eigenlijk altijd vrij statisch geweest, AI verandert vaak en veel. Het is erg lastig om in te schatten hoe AI er over een halfjaar uitziet en dus ook wat dit betekent voor de opslag die je inzet. Met flexibele storage-oplossingen kun je er dan in ieder geval op inspelen.

Impact van focus op R&D: eerste hyperscaler tekent

Zonder enige twijfel het grootste nieuws van de laatste tijd rondom Pure was echter dat een eerste hyperscaler aan de slag gaat met de technologie van het bedrijf. Het is er eentje uit de top vier van hyperscalers. Pure kan en mag nog niet zeggen welke het is. Deze hyperscaler gaat overigens niet datacenters volzetten met FlashArrays of FlashBlades. Het gaat hierbij om de DFM’s die Pure richting de hyperscaler zal sturen. De rest van de infrastructuur bouwt deze zelf. Let wel, er komt ook behoorlijk wat software-ontwikkeling bij kijken, geeft Lee aan. Ze ontwikkelen dit gezamenlijk, om een en ander optimaal te integreren aan beide kanten.

Persoon geeft een presentatie voor een scherm met de tekst 'Rob Lee, CTO, Pure Storage'.
Rob Lee, CTO van Pure Storage

Ook op dit vlak betaalt de focus op R&D en daarmee de ontwikkeling van DFM’s zich weer uit. “Alle hyperscalers hebben interne projecten gehad om iets zoals direct-flash te bouwen”, geeft Lee aan. Ook de hyperscaler die nu getekend heeft bij Pure had zo’n project. Uiteindelijk kwamen ze echter tot de conclusie dat het zinvoller was om maar gewoon bij Pure aan te kloppen. Op zich is dit niet zo gek. Het is ook in lijn met iets wat John ‘Coz’ Colgrove, een van de oprichters van Pure, vorig jaar nog tegen ons zei: “In principe kan iedereen maken wat wij hebben gemaakt [DFM’s, red.], maar wij hebben een enorme voorsprong.” Met andere woorden, als je het nu nog zelf moet ontwikkelen, gaat het nog een hele tijd duren. Dan kun je beter bij Pure aankloppen, is de boodschap.

De co-engineering samenwerking met de hyperscaler roept bij ons wel wat vragen op over de roadmap, ook op het gebied van R&D. Pure gaat er immers prat op dat het veel standaardiseert. Dat wil zeggen, de visie is dat alles onderdeel is van hetzelfde (software-)platform, in de vorm van FlashArray of FlashBlade. Dezelfde 150TB DFM kan in een FlashArray of in een FlashBlade. Met de nieuwe ‘hyperscalersmaak’ van de DFM lijkt dit ten einde te komen. Lee verzekert ons echter dat dit niet het geval is. Dat zal voornamelijk gaan om de puntjes op de i, bij wijze van spreken. Er zullen geen fundamenteel andere modules worden ontwikkeld. Sterker nog, het idee is om naar aanleiding van de samenwerking met de hyperscaler een standaard te creëren voor direct-flash die ook voor kleinere hyperscalers interessant is.

Wat een volledige overstap op flash van een hyperscaler sowieso gaat bewerkstelligen, is de HDD-markt een grote slag toebrengen. 60-70 procent van de inkomsten van HDD-leveranciers komt van hyperscalers. Dit is de eerste, maar het is een kwestie van tijd voor de andere ook overstag gaan, is de verwachting. Dat lijkt ons ook logisch. “Als er eentje overgaat en geen HDD’s meer koopt, dan weet je wel waar dit naartoe gaat”, in de woorden van Lee. Het gaat maar een richting op en dat is niet die van HDD’s.

R&D betekent ook veel testen

Maar goed, terug naar Praag en het R&D-center daar. Een belangrijk onderdeel daarvan is zonder twijfel de testomgevingen die het daar heeft. Daar testen medewerkers allerlei mogelijke en denkbare zaken. Wereldwijd heeft Pure tienduizenden testbeds. We nemen een kijkje in een lab waar FlashBlade uitgebreid getest wordt.

Een serverrek vol met netwerkapparatuur en kabels in verschillende kleuren, waaronder blauw, roze, wit en zwart, die netjes met elkaar zijn verbonden.

Er zijn verschillende soorten testbeds. Aan de ene kant zijn er zogeheten persistent testbeds. Dat zijn testomgevingen die dezelfde reis doormaken als klanten. Dat houdt in dat daar allerlei software op draait, alsof het een echte productieomgeving is bij een klant. Ze testen daar ook wat eventuele updates aan de software doen met de prestaties en of daar vanuit Pure iets aan gedaan kan worden. Ze zijn dan met name op zoek naar zaken die voor disrupties kunnen zorgen. Zo testen ze ESXi, maar bijvoorbeeld ook de prestaties van SQL-databases die op de apparaten draaien. In een van de racks zien we verder nog een Nvidia DGX-unit hangen. Ook die omgeving moet getest worden, waarbij er LLM-workloads gedraaid worden om te kijken hoe ze presteren en of er iets aangepast moet worden.

Aan de andere kant zijn er non-persistent testbeds. Hier focussen de medewerkers van Pure in het R&D-lab zich op specifieke componenten van de units. Denk hierbij onder andere aan de ethernetverbindingen. Aangezien FlashBlade gebaseerd is op ethernet, zijn die erg belangrijk. Er zijn ook tests van actieve optische kabels. Zo zijn er tools waarmee het verlies van licht (en daarmee data) in dit soort kabels kan worden getest.

Opvallend in dit testlab is tot slot nog dat de evergreen-claim van Pure hier fysiek zichtbaar is. Een van de FlashBlades in het testlab draait al onafgebroken sinds 2016.

Nog meer testen voor verzending

De laatste stop tijdens ons bezoek aan Praag is de Foxconn-site op een kleine anderhalf uur rijden van de stad. Foxconn is een belangrijke speler in de Tsjechische economie. Na Skoda is het de tweede exporteur van het land. Let wel, het gaat hier niet uitsluitend om producten van Pure Storage. Het bedrijf werkt ook voor andere spelers. In de fabriek waar wij zijn werkt Foxconn bijvoorbeeld ook voor Cisco. Voor Pure kan Foxconn hier 30 FlashArrays, 4 FlashBlades en 160 zogeheten FRU’s in elkaar zetten. FRU staat voor Field Replacable Units en zou je kunnen zien als de afzonderlijke componenten. Dit kan een controller voor een van de units zijn, maar ook SFP-poorten voor de netwerkverbindingen.

Deze locatie van Foxconn is niet zozeer een fabriek, maar een assemblagelocatie. Dat wil zeggen, hier komen de onderdelen van over de hele wereld naartoe. De medewerkers maken er werkende FRU’s, FlashArrays en FlashBlades van, volledig naar de wensen van de klanten. Daarna worden ze verstuurd.

Een rij oranje serverrekken in een datacenter. Elk rek bevat meerdere servers met zwarte en rode frontpanelen.

Op deze locatie vindt ook de laatste test plaats van de configuratie. Pure wil zeker zijn dat alles exact werkt zoals het hoort. Medewerkers van de fabriek testen letterlijk alle onderdelen. Zelfs de RAM-slots die een klant niet eens gebruikt in de configuratie die deze heeft besteld, worden getest. Je weet immers maar nooit wanneer de klant deze wel nodig heeft. Verder is er een lijn waar de FlashArrays en FlashBlades zo zwaar mogelijk belast worden gedurende langere tijd. Komen ze zonder problemen door die test, dan kunnen ze uiteindelijk ingepakt worden en klaargezet worden voor transport.

Het viel ons tijdens de rondleiding tot slot op dat er vooral vrouwen in de Foxconn-fabriek rondlopen, in ieder geval in het Pure-gedeelte ervan. Dat is geen momentopname, horen we van onze begeleider. Vrouwen zijn voorzichtiger en snappen de waarde van de producten beter, volgens hem. We hebben het hier niet over goedkope producten, dus dat is vanzelfsprekend een belangrijk criterium om hier te kunnen en mogen werken. Als je iedere keer als je aan het werk wilt in deze fabriek een ESD-test moet doen (wat hier het geval is), dan is het wel prettig als je verder ook voorzichtig met de materialen omgaat.

Persoon in een blauw shirt werkt aan elektronische apparatuur aan een bureau met meerdere schermen, gereedschap en opbergbakken in een laboratoriumachtige omgeving.

Testen en verbeteren tot het laatste moment

Na ons bezoek aan de R&D-locatie in Praag en de Foxconn-fabriek er net buiten, staan twee zaken als een paal boven water. Pure neemt R&D zeer serieus, maar vergeet ook niet om alles wat het produceert en verkoopt ook continu te testen en te verbeteren. Alleen met deze combinatie kan het bedrijf de grote beloftes rondom het eigen platform ook daadwerkelijk waarmaken. De aanhoudende sterke groei van Pure in de markt lijkt aan te geven dat deze combinatie onderdeel van een winnende formule is.

Zonder alle grote investeringen in R&D was Pure Storage zoals we dat nu kennen er nooit gekomen. Dan waren de DFM’s er misschien niet eens gekomen. En zonder DFM zou Pure niet veel meer zijn geweest dan een van de vele spelers in de markt. Nu heeft het daadwerkelijk iets unieks in de markt gezet (al heeft IBM ook propriëtaire flash, zij het wezenlijk anders dan DFM’s). Dat unieke onderdeel, gekoppeld met de visie om alles onderdeel van een enkel platform te laten zijn, slaat aan in de markt. Zelfs een hyperscaler is inmiddels om.

Let wel, zonder rigoureuze tests van de uiteindelijke apparatuur, is een DFM ook niet meer dan een interessant stukje technologie. Dat is waar de R&D-afdeling in Praag en de assemblagelijn in Foxconn om de hoek komen kijken. Die moeten ervoor zorgen dat klanten hun FlashArray of FlashBlade tot in lengte der jaren kunnen gebruiken. Dit ongeacht de workloads die ze erop draaien en met de flexibiliteit om mee te gaan met nieuwe ontwikkelingen in de markt. Tot nu toe lukt Pure dat uitstekend. We zien op basis van onze indrukken ook geen reden waarom dat richting de toekomst minder zou gaan.

Lees ook: Pure Storage wil harddisks definitief overbodig maken