Naast AI-pc’s voor consumenten heeft Nvidia ook zijn nieuwe plannen voor grootschalige AI bekendgemaakt. Het bedrijf meldt dat zijn vlaggenschipplatform Vera Rubin in volle productie gaat; het neemt daarbij het stokje over van Blackwell. Daarnaast zullen DGX Station ‘deskside’-pc’s ontwikkelaars die aan AI werken ondersteunen met modellen met meer dan een biljoen parameters, terwijl een vernieuwde Agent Toolkit dat werk gemakkelijker zal maken. Nvidia zet ook haar fysieke AI-progressie voort met het open Cosmos 3-model en een robot als reference design.
Op GTC Taipei 2026, dat gelijktijdig met de Computex-beurs plaatsvindt, heeft Nvidia uiteengezet wat het de “infrastructuur van de volgende industriële revolutie” noemt. Aan ambitie zoals gebruikelijk geen gebrek voor het inmiddels meest waardevolle bedrijf ter wereld. De keynote van CEO Jensen Huang behandelde alles van AI-fabrieken op rackschaal tot een supercomputer ter grootte van een desktop voor Windows, een ontwikkelaarstoolkit voor autonome agents, een nieuw wereldmodel voor fysieke AI en een open referentieontwerp voor mensachtige robots voor academische onderzoekers.
Terwijl RTX Spark in zowel dunne laptops als kleine desktops consumenten weet te bekoren, wat Nvidia’s Apple M1-achtige intrede in volledig uitgeruste pc-systemen via OEM’s betekent, reikt het nieuws verder dan deze eigenlijk al verwachte en gelekte release. Zoals altijd breidt het bedrijf AI opnieuw uit.
Vera Rubin gaat in productie
Het middelpunt van deze andere aankondigingen van Nvidia is Vera Rubin, de opvolger van het Grace Blackwell-platform. Vera Rubin, dat eerder dit jaar voor het eerst beschreven, gaat nu in massaproductie met meer dan 350 partners in de toeleveringsketen in 30 landen. Partners zoals Dell, HPE, Lenovo en SuperMicro produceren in het najaar systemen die bestemd zijn voor cloud- en zakelijke klanten. OpenAI en Anthropic zijn al druk bezig met het benutten van de nieuwe architectuur.
De kern van het platform wordt gevormd door de Vera Rubin NVL72, een vloeistofgekoeld rack-scale systeem met 72 Rubin GPU’s en 36 Vera CPU’s die via NVLink 6 met elkaar zijn verbonden. Nvidia zegt dat het grote mixture-of-experts-modellen kan trainen met een kwart van de GPU’s in vergelijking met Blackwell, en tien keer de inferentie-doorvoer kan leveren tegen een tiende van de kosten per token. Bij het platform hoort een nieuwe Groq 3 Language Processing Unit (LPU), ontworpen voor de inferentie met lage latentie die agentische modellen met biljoenen parameters vereisen. Dit is een toevoeging die mogelijk is gemaakt door de feitelijke overname van Groq.
De Vera-CPU is op zichzelf al opmerkelijk. Deze is gebaseerd op een aangepaste core genaamd Olympus en beschikt over 88 kernen en 1,2 terabyte per seconde aan geheugenbandbreedte, speciaal gebouwd voor agentic workloads zoals Python-runtimes, orkestratielogica en databaseverwerking. Nvidia introduceerde ook Spectrum-X Ethernet Photonics, ’s werelds eerste in één pakket geleverde, op optica gebaseerde netwerkswitches, die een vijf keer hogere energie-efficiëntie beloven. BlueField-4 STX DPU’s verzorgen opslag-, netwerk- en beveiligingsfuncties, waardoor full-stack vertrouwelijke computing op rackschaal mogelijk wordt.
“Eén prompt kan een reis van duizend stappen in gang zetten, bestaande uit redeneren, ophalen, het gebruik van tools en het genereren van reacties”, zei Huang tijdens de Computex-keynote. “Vera Rubin is gebouwd voor dit moment — een AI-fabrieksmotor die intelligentie op schaal levert, met de prestaties, efficiëntie en beveiliging die nodig zijn om de volgende industriële revolutie aan te drijven.”
DGX Station brengt supercomputing naar Windows
Een andere aankondiging is de DGX Station voor Windows, door Nvidia omschreven als ’s werelds eerste AI-supercomputer voor op het bureau (of naast het bureau, zo u wilt). Het is ontwikkeld in samenwerking met Microsoft en wordt aangedreven door de GB300 Grace Blackwell Ultra Desktop Superchip, die 20 petaflops aan FP4-prestaties en tot 748 gigabyte aan geheugen levert. Dit is voldoende om ‘frontier’ modellen met, andermaal, tot wel een biljoen parameters lokaal uit te voeren.
Het doel is om te voorkomen dat enterprise-ontwikkelaars AI-workloads in een vroeg stadium naar de cloudinfrastructuur moeten sturen. Het systeem ondersteunt Nvidia’s OpenShell secure runtime, dat beveiligings- en privacybeleid afdwingt op besturingssysteemniveau met behulp van de native beveiligingsprimitieven van Windows in plaats van gedragsgerichte prompts. Nvidia werkt al aan lokale AI-supercomputing sinds de aankondiging van Project Digits (nu DGX Spark) op CES 2025, dat gericht was op modellen met 200 miljard parameters. De DGX Station breidt die ambitie aanzienlijk uit naar een meer vertrouwd formaat.
De systemen worden geleverd door productiepartners zoals Dell, HP, ASUS, MSI en Super Micro, en zullen naar verwachting voor het einde van 2026 beschikbaar zijn. Een optionele RTX Pro 6000 Blackwell Workstation GPU kan worden toegevoegd voor fysieke AI-workflows met ray-tracing en simulatie, terwijl meerdere eenheden via ConnectX-8 SuperNIC kunnen worden gekoppeld om desktop-rekenclusters te vormen.
Agent Toolkit, Cosmos 3 en een mensachtige robot
Voor ontwikkelaars die agents bouwen, heeft Nvidia een bijgewerkte Agent Toolkit uitgebracht, gericht op NemoClaw, een open framework voor het bouwen van agentische orchestration-lagen. Deze bevat Nemotron 3 Ultra, een ‘mixture-of-experts’-model met 550 miljard parameters, ontworpen voor langlopende autonome agents, dat vijf keer snellere inferentie en 30 procent lagere kosten belooft dan vergelijkbare modellen, en dat op 4 juni wordt gelanceerd. De OpenShell Secure Runtime, gezamenlijk ontwikkeld met Microsoft, Canonical en Red Hat, biedt agents sandbox-omgevingen met beleidsafdwinging op systeemniveau. Tot de early adopters behoren CrowdStrike, Palantir, Cadence en Siemens.
Nvidia lanceerde ook Cosmos 3, een open wereld-fundamentmodel voor fysieke AI, gebouwd op een ‘mixture-of-transformers’-architectuur. Het combineert visuele redenering, wereldgeneratie en actievoorspelling in één systeem. Cosmos 3 Super en Nano zijn vanaf vandaag beschikbaar via Hugging Face en Nvidia’s NIM-microservices; een Edge-variant voor realtime inferentie volgt binnenkort. Partners op het gebied van robotica, autonome voertuigen en industriële AI bouwen al voort op het platform.
Ten slotte kondigde Nvidia de Isaac GR00T Reference Humanoid Robot aan, een open referentieontwerp dat een Unitree H2 Plus-chassis combineert met Sharpa Wave-handen met vijf vingers en Jetson AGX Thor-rekenkracht aan boord. De robot is bijna twee meter hoog en heeft 75 vrijheidsgraden, en biedt academische onderzoeksinstellingen, waaronder ETH Zürich, het Stanford Robotics Center en UC San Diego, een Het is een uniform platform voor de ontwikkeling van humanoïde robots zonder dat men afhankelijk is van propriëtaire stacks. De robot zal naar verwachting eind 2026 via Unitree verkrijgbaar zijn.