2min

Google maakt PlaNet, een AI-agent die het ontwikkelde, open-source. De technologie maakt gebruik van reinforcement learning en leert met behulp van afbeeldingen over de wereld. Google onthulde de AI in samenwerking met DeepMind en wil de software inzetten voor het maken van plannen.

Om die reden heeft Google de nieuwe kunstmatige intelligentie het Deep Planning Network (PlaNet) gedoopt. PlaNet leert een wereldmodel met behulp van de input die het van afbeeldingen krijgt. Die informatie gebruikt het vervolgens voor het maken van plannen. De software is volgens Google erg efficiënt bij het oplossen van afbeeldingen gerelateerde taken. Google heeft de broncode voor de kunstmatige intelligentie beschikbaar gemaakt op GitHub.

Dynamische modellen

Danjiar Hafner, een van de medeauteurs van een academisch paper waarin de architectuur van PlaNet omschreven wordt, legt uit hoe de software werkt. PlaNet leert volgens Hafner dynamische modellen en doet dat op basis van de input die het van afbeeldingen krijgt. Het maakt vervolgens met behulp van die modellen plannen om zo nieuwe ervaringen op te doen.

Met behulp van die dynamische modellen, kan de software een begrip krijgen van diverse abstracte begrippen. Denk daarbij onder meer aan de snelheid van objecten. De PlaNet-agent leert dit door beelden te voorspellen. Het kan dus een stel afbeeldingen nemen van een bewegend object en te voorspellen hoe volgende beeldjes eruit komen te zien.

Maar daarbij hoeft de PlaNet-software geen nieuwe beelden te genereren. “Stel je voor”, begint Hafner, “de agent kan zich voorstellen hoe de positie van een bal en de afstand van die bal tot het doel verandert door bepaalde handelingen, maar hoeft dat scenario niet te visualiseren. Dat stelt ons ertoe in staat 10.000 voorgestelde acties te vergelijken met een grote batch, elke keer als de agent een actie kiest. We voeren dan de actie uit op basis van de beste gevolgtrekking en maken bij de volgende stap opnieuw plannen.”