Servers met Nvidia Blackwell-chips raken oververhit, klanten bezorgd

Wil Nvidia te snel innoveren?

Servers met Nvidia Blackwell-chips raken oververhit, klanten bezorgd

Nvidia probeert sneller dan ooit nieuwe AI-chips te introduceren. De volgende generatie hiervan, Blackwell, was al vertraagd wegens designfouten. Nu blijken de GPU’s binnen servers oververhit te raken.

Het nieuws hierover werd als eerste gedeeld door The Information. Klanten maken zich zorgen over de hitteproblemen, die de al krappe deadlines voor levering nog moeilijker te halen maken. De problemen zijn het ergst wanneer 72 Blackwell-GPU’s in een volledige rack geplaatst worden. Feitelijk gaat het dan om 144 chips, want elke Blackwell B200 bevat twee aan elkaar gekoppelde componenten.

Te ambitieus?

Nvidia heeft sinds de opkomst van de AI-hype de snelheid van releasecycli verhoogd. Eerder verscheen elke chipgeneratie van het bedrijf grofweg elke 18-24 maanden. Dat leidt tot problemen bij concurrenten Intel en AMD, die al een gigantische inhaalslag te maken hebben op de AI-chipmarkt. Maar ook leidde het al tot strubbelingen bij Nvidia zelf. Door een ontwerpfout werd Blackwell al uitgesteld naar eind dit jaar, met pas een volledige uitrol in 2025.

De aanvankelijke problemen draaiden om de interconnect tussen de twee Blackwell-onderdelen. Voor het eerst heeft Nvidia een dubbele chip vervaardigd met een zelf ontworpen koppeling. Het lag niet aan fabrikant TSMC, zo gaf Nvidia-CEO Jensen Huang al toe.

Verwachtingen blijven hoog

De verwachtingen rondom Blackwell blijven hoog, met een verwachting van 2,2x snellere AI-trainingstijden dan voorganger Hopper. Het belooft snellere innovatie voor AI-spelers als OpenAI en Anthropic.

Bij de analisten zijn de voorspellingen echter gevarieerd. Zo voorspelt Morgan Stanley dat Nvidia 450.000 Blackwell-GPU’s zal hebben verscheept eind december en tussen de 700.000 en 800.000 exemplaren in Q1 2025. Toch stelt analistenbureau Jefferies dat de ingeschatte prijs per Blackwell-chip te ambitieus zijn. Bij schattingen zouden andere analisten namelijk te vaak aannemen dat Nvidia volledige racks van de GB200 NVL zal verkopen, wat waarschijnlijk ook het zorgenkindje is met te hoge temperaturen.

Lees ook: Nvidia-uitdager Cerebras gaat naar de beurs