De Technische Universiteit Eindhoven (TU/e) neemt als één van de eerste Europese spelers het Nvidia DGX B200-systeem in gebruik. Naar verwachting is het platform in de eerste helft van 2025 operationeel om met name het AI-onderzoek aan de universiteit aanzienlijk meer paardenkracht te geven.
De TU/e heeft al diverse high-performance computers in gebruik, maar de toenemende behoefte aan geavanceerde rekenkracht voor AI-onderzoek vraagt om nieuwe hardware. Patrick Groothuis, vicevoorzitter van de TU/e, zegt daarover: “We zijn trots op deze nieuwe faciliteit. Dit zal de mogelijkheden voor onze onderzoekers en studenten om AI-onderzoek te doen, zoals baanbrekend kankeronderzoek, enorm vergroten. Dit laat ook onze toewijding zien om een koploper in AI te zijn, wat zal helpen om talent en middelen aan te trekken, en samenwerking te stimuleren.”
De opstelling bestaat aanvankelijk uit vier NVIDIA DGX B200-systemen, die elk zijn uitgerust met acht NVIDIA Blackwell GPU’s. Naar behoefte kan de universiteit deze configuratie opschalen. De systemen komen niet in Eindhoven te staan, maar in een duurzaam datacenter in Finland. De nieuwe infrastructuur krijgt de naam ‘SPIKE-1’ en is industrial grade. Behalve dat dit kwaliteit en robuustheid moet garanderen, vereenvoudigt dat onder meer samenwerking met het bedrijfsleven, een speerpunt voor de TU/e.
Kenniscentrum voor AI-vraagstukken
De belangrijkste gebruikers van de nieuwe AI-supercomputer zijn onderzoekers van het Eindhoven AI Systems Institute (EAISI) en de faculteit Mathematics & Computer Science (Wiskunde en informatica). Het EAISI is het kennis- en onderzoekscentrum van de universiteit op het gebied van AI-vraagstukken. Het TU/e Supercomputing Center, het interne adviescentrum voor supercomputing en alles wat daarbij komt kijken, helpt de onderzoekers praktisch op weg bij het uitvoeren van de juiste workloads op de juiste manier.
De overeenkomst met Nvidia omvat een geïntegreerde oplossing van zowel hardware als software en voorziet in een tweejaarlijkse technische refresh. Daarvoor maakt de TU/e gebruik van het Nvidia DGX-Ready Lifecycle Management-programma.
Opvolger van de Hopper-chip
De in maart aangekondigde B200 Blackwell ‘AI-superchip’ bevat 208 miljard transistoren. en geldt als de architecturele opvolger van Hopper, dat de oudere H100-chip aandrijft. Het is gebakken op TSMC’s 4 nanometerproces en is twee keer zo groot als diens voorganger. De beloofde snelheidsverbetering van de B200 (twee samengevoegde B100’s) ten opzichte van de H100 is 30 keer.
Eén van de belangrijkste features is dat de chip voortdurend bepaalde berekeningen vereenvoudigt waar mogelijk, zodat AI-training aanzienlijk sneller kan verlopen. De zogeheten ‘RAS-engine’ functioneert bovendien als een veiligheidscheck die fungeert als ‘on-board tester’ voor de AI-berekeningen. Daarnaast bieden security-opties de mogelijkheid om data te versleutelen at rest, in transit en tijdens berekeningen.
Lees ook: Nvidia brengt afgezwakte variant van B200 Blackwell-chip op Chinese markt