AI-agents nemen robottraining over bij Nvidia

Nvidia zet een volgende stap in de automatisering van robotontwikkeling. Onderzoekers van het bedrijf hebben een systeem ontwikkeld waarmee AI-agents zelfstandig robots trainen, evalueren en verbeteren.

In experimenten leerden robots volgens Ars Technica onder meer GPU’s in moederborden plaatsen, tie-wraps doorsnijden en kleine onderdelen sorteren, zonder dat onderzoekers voortdurend hoefden in te grijpen.

Het onderzoek komt van Nvidia’s GEAR-lab (Generalist Embodied Agent Research) en is uitgevoerd in samenwerking met Carnegie Mellon University en de University of California, Berkeley. Centraal staat een framework genaamd ENPIRE, dat meerdere AI-codeeragents laat samenwerken aan het verbeteren van robotprestaties.

Waar robottraining traditioneel veel handmatig werk vereist, laat ENPIRE de agents zelf experimenten ontwerpen, trainingssoftware aanpassen, resultaten analyseren en verbeteringen doorvoeren. Het systeem combineert verschillende functies, waaronder foutanalyse, automatische validatie van resultaten en het parallel uitvoeren van experimenten op meerdere robots.

Robots leren van hun eigen experimenten

Voor de tests maakten de onderzoekers gebruik van AI-codeeragents van verschillende leveranciers, waaronder OpenAI, Anthropic en Moonshot AI. De agents ontwikkelden zelfstandig alternatieve trainingsmethoden en vergeleken de resultaten in de praktijk. Verbeteringen die tot hogere succespercentages leidden, werden vervolgens behouden voor volgende trainingsrondes.

Dat leverde opvallende resultaten op. Robots slaagden erin om met een succespercentage van circa 99 procent uiteenlopende taken uit te voeren. Naast het plaatsen van GPU’s in moederborden ging het onder meer om het sorteren van pinnen in een opbergdoos, het vastmaken en doorknippen van tie-wraps en het uitvoeren van standaard manipulatieoefeningen die vaak worden gebruikt in robotonderzoek.

Volgens de onderzoekers presteerden de AI-agents bij sommige taken zelfs beter dan bestaande trainingsmethoden waarbij menselijke experts actief betrokken blijven bij het optimaliseren van het leerproces.

Uit de experimenten blijkt dat grotere teams van AI-agents sneller vooruitgang boeken dan individuele agents. Een groep van acht agents bereikte bij een testopstelling binnen twee uur een succespercentage van 99 procent. Vier agents hadden daar ongeveer drie uur voor nodig, terwijl één agent bijna vijf uur nodig had om hetzelfde niveau te halen.

Die schaalvoordelen blijken echter niet onbeperkt. Naarmate meer agents samenwerken, neemt ook de onderlinge afstemming toe. De onderzoekers zagen dat agents steeds meer tijd besteedden aan het verwerken en samenvatten van elkaars bevindingen. Daarnaast stonden robots geregeld stil terwijl de AI-systemen code analyseerden, fouten onderzochten of wachtten op reacties van onderliggende taalmodellen.

Stap naar autonome robotlabs

Het project past binnen Nvidia’s bredere ambitie om AI niet alleen software te laten ontwikkelen, maar ook fysieke systemen zelfstandig te laten verbeteren. Volgens Jim Fan, directeur AI bij Nvidia, kan een deel van het onderzoekswerk inmiddels volledig geautomatiseerd verlopen. Onderzoekers beoordelen vooral nog de resultaten die de AI-agents gedurende de nacht hebben geproduceerd.

De onderzoekers hebben aangekondigd dat ENPIRE als open source beschikbaar zal worden gemaakt. Daarmee wil Nvidia het voor universiteiten, bedrijven en hobbyisten mogelijk maken om vergelijkbare zelfsturende robotlabs op te zetten.

Het onderzoek benadrukt hoe snel de grenzen tussen generatieve AI en robotica vervagen. Waar AI-codeeragents oorspronkelijk werden ontwikkeld om programmeurs te ondersteunen, worden ze nu steeds vaker ingezet als autonome onderzoekers die niet alleen software schrijven, maar ook fysieke machines leren hoe ze nieuwe taken moeten uitvoeren.

Lees meer over Infrastructure

Capgemini: AI zorgt voor investeringsgolf in IT-modernisering

De brede inzet van AI dwingt organisaties eerst hun IT-fundament op orde te brengen. Volgens Capgemini is nie...

Mels Dees 30 juli 2026

Koreaanse AI-aandelen herstellen na forse beurscorrectie

Na drie dagen van zware koersverliezen hebben Zuid-Koreaanse technologieaandelen vrijdag een krachtig herstel...

Mels Dees 3 dagen geleden

Topartikel

SCION wil de fundamenten van het internet veiliger maken

Het huidige internet is structureel gevoelig voor route-hijacks en ongewenste, stiekeme omleidingen. Daarom m...

Berry Zwets 30 juli 2026

Topartikel

Het water- en energieverbruik van datacenters in de juiste context

Datacenters liggen onder vuur vanwege hun energie- en waterverbruik, maar het beeld dat geregeld geschetst wo...

Sander Almekinders 21 juli 2026

Expert aan het woord

Tech calendar

AI-agents nemen robottraining over bij Nvidia

Robots leren van hun eigen experimenten

Stap naar autonome robotlabs

Blijf op de hoogte, abonneer!

SCION wil de fundamenten van het internet veiliger maken

AI is topprioriteit, maar AI SOC is nog ver weg

EU AI Act wordt menens op 2 augustus: wat verandert er?

What Pega's CTO revealed about AI's biggest enterprise traps

ServiceNow unveils Action Fabric AI platform architecture

How HPE brought two networking giants together in under one year

Why hyperscalers run containers in VMs: VKS deep dive

IMd Raadgevende Ingenieurs biedt werknemers cloudwerkplek met superzware reken- en tekenapplicaties

Je werkt je medewerkers in, doe je hetzelfde met je AI-agents?

AI in cybersecurity: van ondersteuning naar samenwerking

Een AI-agent die in negen seconden een productiedatabase wiste: vijf lessen

Dreamforce

GOTO Copenhagen 2026

NetApp INSIGHT 2026

Manhattan EMEA Exchange

Cyberrisico’s zetten bedrijfscontinuïteit het meest onder druk

Hoe bouw je veilig agentic AI-applicaties in enterprise-omgevingen?

De opkomst van de Managed Intelligence Provider

Hoe zet je AI veilig in binnen applicatieontwikkeling?