2min

Alphabet-dochterbedrijf DeepMind heeft een AI ontwikkeld die beter in staat is in onbekende situaties met nieuwe strategieën te komen. De AI, genaamd MuZero, beheerst Go, schaak, shogi en verschillende Atari-spellen zonder dat het ooit de regels uitgelegd heeft gekregen.

DeepMind legt de verbeteringen in MuZero uit in een blogpost. Het bedrijf geeft aan dat kunstmatige intelligentie tot op heden moeite had met omgevingen waarbij de regels en dynamiek onbekend en complex zijn. Door alleen te focussen op de belangrijkste aspecten van de omgeving, weet MuZero dit probleem op te lossen.

Uitdagingen als het spelen van Pac-Man waren voor eerdere versies nog lastig, maar MuZero heeft op deze Atari-benchmark een ‘state of the art’ resultaat behaald. Ook presteerde de AI vergelijkbaar met zijn voorganger AlphaZero in Go, schaak en shogi. Hierbij hoefden de onderzoekers de regels van het spel niet aan de AI uit te leggen.

Focussen op de belangrijkste aspecten

Met het focussen op de belangrijkste aspecten van de omgeving maakt DeepMind een vergelijking met menselijke inzichten. Wanneer een mens donkere wolken aan de hemel ziet, maakt die de voorspelling dat het gaat regenen en neemt hij een paraplu mee voordat hij naar buiten gaat. Dit is een vaardigheid die mensen al snel leren, maar waar AI nog altijd moeite mee heeft.

MuZero werkt op een manier die meer vergelijkbaar is met het menselijke voorbeeld. In plaats van het maken van een volledig model van de omgeving, probeert de AI zich alleen te richten op de elementen die voor de AI relevant zijn. DeepMind geeft hierbij als voorbeeld dat het nuttiger is om te weten dat een paraplu je droog houdt dan om een patroon van alle regendruppels in de lucht te maken.

Door deze andere aanpak is de AI beter in taken die niet zo afgebakend zijn als simpele bordspellen. De onderzoekers hebben de MuZero getest met 57 verschillende Atari-spellen, waarbij de AI al snel een hoog niveau bereikte.