Nvidia zet een volgende stap in de automatisering van robotontwikkeling. Onderzoekers van het bedrijf hebben een systeem ontwikkeld waarmee AI-agents zelfstandig robots trainen, evalueren en verbeteren.
In experimenten leerden robots volgens Ars Technica onder meer GPU’s in moederborden plaatsen, tie-wraps doorsnijden en kleine onderdelen sorteren, zonder dat onderzoekers voortdurend hoefden in te grijpen.
Het onderzoek komt van Nvidia’s GEAR-lab (Generalist Embodied Agent Research) en is uitgevoerd in samenwerking met Carnegie Mellon University en de University of California, Berkeley. Centraal staat een framework genaamd ENPIRE, dat meerdere AI-codeeragents laat samenwerken aan het verbeteren van robotprestaties.
Waar robottraining traditioneel veel handmatig werk vereist, laat ENPIRE de agents zelf experimenten ontwerpen, trainingssoftware aanpassen, resultaten analyseren en verbeteringen doorvoeren. Het systeem combineert verschillende functies, waaronder foutanalyse, automatische validatie van resultaten en het parallel uitvoeren van experimenten op meerdere robots.
Robots leren van hun eigen experimenten
Voor de tests maakten de onderzoekers gebruik van AI-codeeragents van verschillende leveranciers, waaronder OpenAI, Anthropic en Moonshot AI. De agents ontwikkelden zelfstandig alternatieve trainingsmethoden en vergeleken de resultaten in de praktijk. Verbeteringen die tot hogere succespercentages leidden, werden vervolgens behouden voor volgende trainingsrondes.
Dat leverde opvallende resultaten op. Robots slaagden erin om met een succespercentage van circa 99 procent uiteenlopende taken uit te voeren. Naast het plaatsen van GPU’s in moederborden ging het onder meer om het sorteren van pinnen in een opbergdoos, het vastmaken en doorknippen van tie-wraps en het uitvoeren van standaard manipulatieoefeningen die vaak worden gebruikt in robotonderzoek.
Volgens de onderzoekers presteerden de AI-agents bij sommige taken zelfs beter dan bestaande trainingsmethoden waarbij menselijke experts actief betrokken blijven bij het optimaliseren van het leerproces.
Uit de experimenten blijkt dat grotere teams van AI-agents sneller vooruitgang boeken dan individuele agents. Een groep van acht agents bereikte bij een testopstelling binnen twee uur een succespercentage van 99 procent. Vier agents hadden daar ongeveer drie uur voor nodig, terwijl één agent bijna vijf uur nodig had om hetzelfde niveau te halen.
Die schaalvoordelen blijken echter niet onbeperkt. Naarmate meer agents samenwerken, neemt ook de onderlinge afstemming toe. De onderzoekers zagen dat agents steeds meer tijd besteedden aan het verwerken en samenvatten van elkaars bevindingen. Daarnaast stonden robots geregeld stil terwijl de AI-systemen code analyseerden, fouten onderzochten of wachtten op reacties van onderliggende taalmodellen.
Stap naar autonome robotlabs
Het project past binnen Nvidia’s bredere ambitie om AI niet alleen software te laten ontwikkelen, maar ook fysieke systemen zelfstandig te laten verbeteren. Volgens Jim Fan, directeur AI bij Nvidia, kan een deel van het onderzoekswerk inmiddels volledig geautomatiseerd verlopen. Onderzoekers beoordelen vooral nog de resultaten die de AI-agents gedurende de nacht hebben geproduceerd.
De onderzoekers hebben aangekondigd dat ENPIRE als open source beschikbaar zal worden gemaakt. Daarmee wil Nvidia het voor universiteiten, bedrijven en hobbyisten mogelijk maken om vergelijkbare zelfsturende robotlabs op te zetten.
Het onderzoek benadrukt hoe snel de grenzen tussen generatieve AI en robotica vervagen. Waar AI-codeeragents oorspronkelijk werden ontwikkeld om programmeurs te ondersteunen, worden ze nu steeds vaker ingezet als autonome onderzoekers die niet alleen software schrijven, maar ook fysieke machines leren hoe ze nieuwe taken moeten uitvoeren.