Intel heeft meer details gegeven over toekomstige Xeon-processoren voor servers en workstations. Terwijl de vijfde generatie van deze chips nog niet eens op de markt is, krijgen we nu al een goed idee van hoe de opvolgers daarvan eruit zullen zien. Klanten hebben sterk uiteenlopende wensen, zo blijkt. Daarom kiest Intel voor twee varianten: een processor gericht op brute kracht en een andere optie voor maximale efficiëntie.

Terwijl de hype rondom AI een onvoorstelbare vraag naar GPU’s heeft opgeleverd, haalt Intel aan dat server-CPU’s nog altijd tot veel in staat zijn. De zwaarste workloads vragen om sterke individuele CPU-cores, terwijl er volgens Intel ook klanten zijn die vooral veel verschillende eisen stellen aan servers die niet al te intensief zijn.

In plaats van een monolithische chip die tot van alles in staat is, kiest Intel voor twee specifieke oplossingen, op basis van één platform/socket. P (Performance)-cores voor de een, E (Efficiency)-cores voor de ander. Nu is deze terminologie niet nieuw voor Intel: ook consumentenchips bevatten momenteel veelal een mengelmoes van P- en E-cores. De processoren zullen bestaan uit een optelsom van chiplets en zijn daarmee dus modulair.

Gebakken op Intel 3

Beide soorten cores worden gebakken op Intel 3, het nieuwste productieproces dat het chipbedrijf inzet. De E-core variant heeft als codenaam Sierra Forest en zal in de eerste helft van 2024 uitkomen, terwijl de met P-cores gebouwde Granite Rapids-chips “kort daarna” arriveren. Daarmee lopen ze wel iets achter op eerder gestelde roadmaps: Intel 3 was namelijk gepland voor Q3 2023.

Hoe dan ook belooft men in beide gevallen een grote stap als het gaat om performance-per-watt, met name voor Sierra Forest. Opvallend is wel dat beide chips dezelfde firmware gaan draaien en dezelfde besturingssystemen ondersteunen. Het is dus echt de specifieke toepassing die leidend zal zijn voor de keuze tussen beide mogelijkheden. Wie de beste prestaties wil, kan voor Granite Rapids-producten kiezen. Sierra Forest is er voor klanten die vooral efficiëntie nodig hebben met zoveel mogelijk cores. Intel spreekt over een verbetering van 250 procent ten opzichte van de vierde generatie Xeons als het gaat om het aantal cores dat in een serverrack past. Eerdere geruchten spraken over maximaal 144 cores, hoewel er vooralsnog geen exact aantal genoemd wordt.

En AI-workloads?

Elk techbedrijf krijgt de vraag hoe het de AI-hype omzet tot resultaten. Intel prijst de prestaties op dit gebied van de al eerder aangekondigde vierde generatie Xeons. Tegenover de grote concurrent, AMD’s EPYC-producten, zou deze processor 5,6 keer sneller het AI-model BERT verwerken en daarmee 4,7 keer zo efficiënt zijn.

Verbeteringen voor de Xeons van 2024 richten zich met name op de grote bandbreedte wat geheugen betreft. AI-workloads zijn hier sterk van afhankelijk. Er zijn opties voor DDR5- of MCR-geheugen, met maximale snelheden van respectievelijk 6400 MT/s en 8000 MT/s. Een maximum van 12 channels zijn ondersteund met een theoretische bandbreedte van 614,4 tot 768 GB/s. Dat is meer dan een verdubbeling ten opzichte van de vierde generaties Xeons. Maximaal 136 PCIe 5.0-lanes kunnen aangesproken worden, voor alles van GPU’s tot NVMe-opslag.

Uiteindelijk heeft een server-systeem een CPU en GPU nodig om AI-workloads competent te draaien. Voor reusachtige generatieve AI-toepassingen zullen de meeste partijen naar Nvidia kijken voor bijvoorbeeld de GH200 Superchip. Wel is er voor sommige AI-taken geen optie tot parallelisatie: veel voorspellende capaciteiten zijn afhankelijk van opeenvolgende berekeningen, waar een CPU geschikter voor is. Er zal voor de nieuwe generatie Xeons dus zeker interesse zijn vanuit de AI-hoek, los van klanten die de bestaande taken van CPU’s sneller uit willen voeren. Dit kan van alles zijn, van het aansturen van grote hoeveelheden opslag tot het draaien van virtual machines.

