De wereldwijde vraag naar elektriciteit neemt snel toe, mede door de groei van AI en de benodigde uitbreiding van datacenters. In het IEA World Energy Outlook 2025-rapport wordt gewaarschuwd dat de wereldwijde netcapaciteit de groeiende vraag naar energie door digitale systemen mogelijk niet kan bijhouden en dat daardoor reële beperkingen kunnen ontstaan in de beschikbaarheid van stroom. De opkomst van AI-inferentie toepassingen en agentic workloads zullen de druk op netcapaciteit verder doen toenemen. Gezien deze ontwikkelingen is het voor datacenterplanners belangrijk om ook de energie-efficiency van storage mee te nemen in hun berekeningen.
Waarom juist storage-efficiëntie belangrijk is nu de druk op elektriciteitsnetten toeneemt
De World Energy Outlook 2025 van het International Energy Agency (IEA) bevestigt wat de meeste datacenter infrastructuurteams al zien: de wereld betreedt het elektriciteits tijdperk. In elk scenario dat het IEA modelleert, stijgt de vraag naar elektriciteit sneller dan het totale energieverbruik. De groei van de vraag naar elektriciteit kwam vroeger vooral uit opkomende economieën; nu komt die toenemende vraag naar elektriciteit steeds meer uit datacenters en AI in ontwikkelde markten. Het IEA schat dat de wereldwijde investeringen in datacenters in 2025 ongeveer 580 miljard dollar bedroegen, wat hoger is dan de 540 miljard dollar die in datzelfde jaar naar schatting werd geïnvesteerd in de olie-industrie. Hoewel de opwekking van hernieuwbare energie blijft toenemen, zullen de benodigde uitbreidingen van het elektriciteitsnet en de ontwikkeling van nieuwe energievoorzieningen niet snel genoeg gaan om de toenemende vraag vanuit de digitale sector bij te benen. Het resultaat is een groeiende kloof tussen wat datacenters en AI-systemen nodig hebben en wat het elektriciteitsnet kan leveren.
AI is de drijvende kracht achter de ‘Power Curve’
In voorgaande jaren draaide alles om datagroei. Nu is echter AI-inferentie, de toepassing van getrainde machine learning-modellen op nieuwe, ongeziene data om zinvolle voorspellingen te doen of beslissingen te maken, de belangrijkste aanjager van de ‘Power Curve’ (in deze context de groeicurve van het elektriciteitsverbruik dat nodig is om digitale workloads te draaien). Het trainen van een AI-basismodel vereist grote hoeveelheden energie voor een beperkte tijd. Inferentie vindt echter voortdurend plaats, bijvoorbeeld wanneer een organisatie chatbots, codeassistenten of agentic AI-diensten implementeert. Het energieverbruik houdt ook niet op wanneer de training stopt. Zelfs een bescheiden toename van het AI-gebruik in cloud- en enterprise workloads zou de wereldwijde energiebehoefte van datacenters tegen 2030 met enkele honderden terawattuur kunnen doen stijgen. Inferentie workloads domineren die stijging omdat ze schalen met het aantal gebruikers, niet met de complexiteit van de modellen.
Energie-efficiëntie is de nieuwe capaciteit
Om aan de groeiende vraag naar energie te voldoen, is het efficiënt gebruiken van de beschikbare energie een logische stap. In de praktijk staat efficiëntiewinst nu gelijk aan capaciteitswinst. Wanneer storage-, compute- en netwerkapparatuur minder energie verbruiken voor dezelfde workload, komt er energie beschikbaar voor meer AI en meer gebruikers, zonder dat er nieuwe substations of kabels nodig zijn. Het IEA benadrukt dat flexibiliteit en energie-efficiëntie in infrastructuur essentieel zijn om tekorten in de energievoorziening te voorkomen. Daarmee zijn energieprestaties niet alleen een maatstaf voor duurzaamheid, maar ook een factor in betrouwbare netplanning.
De centrale rol van storage
Storage wordt nog vaak vergeten in energieplanning. Compute en koeling krijgen de meeste aandacht, maar de keuze van de opslag-architectuur bepaalt de totale belasting van het datacenter op drie manieren:
- Direct stroomverbruik: het aantal watt per terabyte en het aantal watt per IOPS (Input/Output Operations per Second) van de array.
- Indirecte belasting: de hoeveelheid racks, switches en koeling-resources die nodig zijn om die storage te ondersteunen.
- Lifecycle CO2-voetafdruk: de optelsom van de energiekosten, productiekosten en verwijderingskosten.
AI-workloads, met name inferentie- en agentic systemen, zijn input/output-intensief. Ze halen en pushen grote hoeveelheden data via vectorstores (gespecialiseerde databases die hoogdimensionale numerieke representaties van data opslaan en doorzoeken), feature stores (gecentraliseerde systemen voor het beheer van machine learning-functies) en zoekindexen. Als die data op inefficiënte of low-density opslagsystemen staat, kost elke query meer energie en koeling.
Waarom inferentie workloads efficiënte storage vereisen
Zoals gezegd neemt de inzet van inferentie toe. Model serving, retrieval augmented generation (RAG), agentic systemen en ingebouwde AI-functies zijn allemaal afhankelijk van snelle toegang tot opgeslagen data. Elke call door een AI model kan gigabytes aan vectorgegevens of logbestanden omvatten. Vermenigvuldig dat met miljoenen dagelijkse calls door gebruikers en het storage-I/O profiel wordt enorm. Daarom moet storage voor inferentie aan een aantal vereisten voldoen:
- Hoge doorvoer om ervoor te zorgen dat de storage continu genoeg data kan leveren zodat AI-accelerators (zoals GPU’s) niet hoeven te wachten op I/O en dus niet stilvallen.
- Low latency voor snelle respons.
- Hoge dichtheid om gegevens dichtbij te houden en het aantal racks (en dus de benodigde energie) te verminderen
- Energie-efficiëntie om groei aan te kunnen zonder het energiebudget te overschrijden
De komende golf van agentic AI
Agentic AI-modellen gaan verder dan ‘eenvoudige’ inferentie. Ze koppelen meerdere model-calls aan elkaar, halen herhaaldelijk data op en voeren complexe redeneringsstappen uit. Deze loops kunnen tientallen keren per query worden uitgevoerd. De storagelaag moet daarom duizenden kleine, gelijktijdige verzoeken efficiënt kunnen verwerken. Als dit op een inefficiënt opslagsysteem gebeurt, voegt elke agentic AI-sessie meetbare energiekosten toe. Na verloop van tijd kan het totale energieverbruik van het systeem even groot worden als de initiële trainingsbelasting. De enige haalbare manier om dat te beheren is door efficiëntie en dichtheid op elke laag te optimaliseren.
Keuzes die energieverbruik beïnvloeden
Datacenter- en infrastructuurteams hebben geen controle over de tijdschema’s voor de aanleg van het elektriciteitsnet, maar ze kunnen wel de designkeuzes van hun organisatie beïnvloeden. Hieronder 8 factoren die belangrijk zijn om energieverbruik te optimaliseren:
- Audit en baseline: meet het totale energie- en ruimtegebruik voor bestaande storage, compute en koeling. Houd dit bij voor watt per TB en watt per IOPS.
- Houd rekening met toekomstige AI-vraag: maak een schatting van zowel groei als training van inferentie. Houd rekening met verwachte agentic workloads en gedistribueerde inferentiepatronen.
- Identificeer knelpunten: zoek uit waar energie of ruimte de groei het eerst zal beperken: rackruimte, koeling, stroomtoevoer of transformatorcapaciteit.
- Moderniseer storage: schakel over van legacy harde schijven (HDD) of hybride arrays naar all-flash systemen met een hoge opslagdichtheid. Dit vermindert het energieverbruik per TB, het aantal racks en de koelbehoeften.
- Optimaliseer data placement: bewaar veelgebruikte inferentiegegevens op high-performance flash en verplaats minder gebruikte data naar lagere lagen of object storage met deduplicatie.
- Stem af op faciliteiten en nutsvoorzieningen: betrek lokale energieleveranciers in een vroeg stadium. Maak een prognose van de energiebehoefte voor de komende drie tot vijf jaar. Stem storage-upgrades af op de beschikbare stroomvoorziening.
- Integreer duurzaamheidstatistieken: neem energie- en CO2-data mee in infrastructuurplanning. Kwantificeer de reducties van elke individuele efficiëntiemaatregel die is genomen.
- Bereid voor op energieschaarste: maak plannen voor scenario’s waarin de stroomvoorziening wordt beperkt of vertraagd. Efficiënte opslag zorgt ervoor dat je nog steeds kunt op- en afschalen binnen de bestaande limieten.
Vooruitblik
Het IEA verwacht dat hernieuwbare energiebronnen tot 2050 sneller zullen groeien dan alle andere energiebronnen, met zonne-energie voorop. Ook kernenergie zal groeien, na decennia van stagnatie. Maar zelfs met deze groei in het vooruitzicht kost het tijd om de nieuwe, schone energie online te brengen. AI en datadiensten groeien sneller dan dat energie wordt opgewekt en het elektriciteitsnet wordt uitgebreid. Die onbalans zal bepalend zijn voor infrastructuurdesign in het komende decennium. Storage-efficiëntie is niet langer een bijkomend voordeel, het is een designvereiste. Systemen die meer prestaties per watt en meer capaciteit per rack leveren, ondersteunen direct de bedrijfscontinuïteit en duurzaamheid.
De volgende golf AI zal niet worden beperkt door rekenkracht, maar door de beschikbaarheid van stroom. Organisaties die nu plannen maken voor energie- en ruimte-efficiëntie, zullen sneller implementeren, tegen lagere kosten opereren en met minder inspanning hun duurzaamheidsdoelstellingen halen.
Dit is een ingezonden bijdrage van Pure Storage. Via deze link vind je meer informatie over de mogelijkheden van het bedrijf.