China probeert AI-opmars zonder Nvidia te redden, lukt dat?

China probeert AI-opmars zonder Nvidia te redden, lukt dat?

Vendor lock-in is een alomtegenwoordig probleem. Wie AI-chips zoekt, kan Nvidia maar moeilijk omzeilen. Toch probeert elke Big Tech-speler het. China, steeds verder afgesloten van Nvidia’s hardware door exportrestricties, vertrouwt op grootmachten Alibaba en Huawei om AI-zelfredzaam te zijn. Hoe succesvol zijn ze daarin?

Nvidia is vrijwel ongenaakbaar als leverancier van AI-chips. Hun Graphical Processing Units (GPU’s) zijn voornamelijk voor het trainen van grote taalmodellen verreweg het krachtigst, het meest schaalbaar en het makkelijkst te gebruiken. Het heeft Nvidia laten stijgen naar een marktwaarde van boven de 4 biljoen dollar. Hoewel met name AMD een goedkoper equivalent aanprijst, vormt Nvidia’s ecosysteem aan softwarelagen en -partners een onneembare vesting. Daarom leggen andere partijen de nadruk op inferencing, ofwel het dagelijks draaien van AI-modellen. Dit is veel minder veeleisend voor IT-hardware dan training en minder afhankelijk van een diepe kennis van de Nvidia-softwarestack. Groq en Cerebras zijn opkomende AI-spelers als alternatieven voor de AI-grootmacht op dit gebied, maar het wemelt daarnaast van de startups die goedkoop en/of efficiënt chips bieden voor inferencing. In China zijn het juist de techreuzen Alibaba en Huawei die een vuist maken tegen de Nvidia-dominantie.

Doorbraak

Gewoonlijk zal die ontwikkeling Nvidia weinig uitmaken. Zo lang als het is toegestaan, blijft het bedrijf GPU’s bouwen die voldoen aan VS-exportrestricties richting China. Er is een flinke markt voor de H20, de zwakkere broeder van de H100-chip die in het westen te koop is. De echte state of the art blijft echter buiten China: alle Blackwell-chips, de jongste Nvidia-generatie aan GPU’s, zijn niet voor Beijing bestemd. Tot juli waren zelfs H20’s verbannen voor AI-export; president Trump ging later alsnog overstag en nu mag China weer van het Nvidia-vaatje tappen.

Het frappante? De Chinese regering zegt nu juist tegen haar binnenlandse bedrijven dat ze moeten stoppen met Nvidia-orders. In plaats daarvan moeten zij vertrouwen op de chips van Alibaba, Huawei en een paar kleinere spelers zoals MetaX en Cambricon. De echte sensatie van dit moment is juist eerstgenoemde. Alibaba zou er namelijk volgens de Wall Street Journal in geslaagd zijn om haar AI-chips compatibel te maken met Nvidia’s software. Dat is een doorbraak van jewelste. Softwareontwikkelaars ervaren hierdoor namelijk minder frictie dan als men een geheel nieuwe AI-tooling moet begrijpen.

DeepSeek bewees begin dit jaar al dat die diepe kennis nodig is om AI-modellen te bouwen met een grote impact. Eén van de sterke punten van DeepSeek-R1, het open-source model dat bij release vriend en vijand verbaasde, is dat het met extreem hoge efficiëntie was getraind. Dit was mogelijk door dieper te duiken in de Nvidia-hardware en te programmeren op PTX, de laag onder CUDA. Dergelijke optimalisaties zullen alleen maar belangrijker zijn nu Chinese AI-bedrijven moeten vertrouwen op minder krachtige hardware. Voor training zal dit grote problemen veroorzaken. Dat lijkt al het geval te zijn geweest. DeepSeek-R2 zou vertraging hebben opgelopen doordat DeepSeek probeerde Chinese chips voor AI-training te gebruiken.

Wachttijd

In de chipindustrie is het uiterst gebruikelijk om eerder te denken in termen van meerdere jaren of zelfs een decennium en meer. De AI-wereld is dit sinds ChatGPT niet gewend. Nvidia zelf heeft die disbalans al ontdekt, waardoor het een vrij onvoorstelbare prestatie levert: elk jaar volgt een geheel nieuwe chipgeneratie. Normaliter is 18 maanden een snelle verversingssnelheid, met 24 of zelfs 36 maanden als traditionele golflengtes tussen betekenisvolle generationele verbeteringen. Daartussen kan er weleens een mid-cycle refresh plaatsvinden, waarbij dezelfde chiparchitectuur in geoptimaliseerde vorm het levenslicht ziet.

Dit is relevant, want om bij te blijven moet China dit tempo zien te verslaan of hopen dat Nvidia vertraagt. Dat laatste kan best wel gebeuren: kijk naar de voorbeelden van Intel en eerder AMD en zie hoe chipspelers ellenlang blijven steken op een bepaald prestatieniveau. Intel wist jaren maar niet een betekenisvolle CPU-vooruitgang te realiseren sinds de Sandy Bridge-architectuur uit 2011. AMD had een nagenoeg complete aftakeling voordat het in 2017 terugkwam met de CPU-architectuur Ryzen. Het verschil tussen deze voorbeelden en Nvidia is dat er enerzijds wél concurrentie is (zoals niet gold voor Intel) en géén existentiële crisis (zoals wel gold voor AMD). Met andere woorden: er zijn weinig factoren om Nvidia uit balans te brengen. De concurrentie is op gepaste afstand maar boekt progressie, waardoor Nvidia moet doorontwikkelen; het bedrijf beschikt over miljarden op miljarden aan vers kapitaal elk kwartaal, waardoor het zich fouten kan veroorloven.

De Chinese chipspelers zullen meer moeten doen dan Nvidia’s tempo bijbenen. Ook zijn zij afgesloten van ASML’s geavanceerde High-NA EUV-chipmachines, die al warm worden gedraaid voor toekomstige chipgeneraties vanuit TSMC’s fabrieken en die van Intel. Een vooruitgang op basis van ASML-apparatuur is de ‘eenvoudigste’ manier om efficiëntere en snellere processoren te bouwen. Dit zou goed het plafond kunnen bepalen voor China’s ambities. Zonder werknemers te lokken, IP-diefstal of andere onvoorziene doorbraken gaan Chinese chipmachinebouwers niet de komende jaren in de buurt komen van ASML. Dit betekent dat we een duizelingwekkend snelle verbetering van de AI-chips uit China met een korrel zout moeten nemen.

Lees ook: Hoe ASML de spil van de chipwereld werd