2min

Een systeem van DeepMind, een dochterbedrijf van Alphabet, heeft drie van de meest complexe bordspellen ter wereld onder de knie gekregen. Dat meldt Silicon Angle. De kunstmatige intelligentie, AlphaZero, is de derde grote evaluatie van AlphaGo, dat drie jaar geleden de wereldkampioen in Go versloeg.

Het duurde maanden om AlphaGo te trainen en het had veel menselijke input nodig om het moeilijke spel te leren. De tweede iteratie, AlphaZero, wist na 30 uur het niveau van zijn voorganger te verbeteren via een nieuwe leermethode. Het nieuwste systeem gebruikte die methode ook om schaken en het Japanse shogi te leren.

AlphaZero lijkt weinig op traditionele computers voor gamen als Deep Blue. Deep Blue won in 1986 van de voormalige schaakkampioen Garry Kasparov. De traditionele engines vertrouwen op informatie van menselijke spelers, maar AlphaZero heeft geleerd om helemaal zelf te spelen. De kunstmatige intelligentie kreeg alleen de regels van de drie spellen die het moest leren.

Krachtiger

“Om ieder spel te leren, speelt een ongetraind neuraal netwerk miljoenen spelletjes tegen zichzelf via een trail-and-error-proces dat we reinforcement learning noemen. In eerste instantie speelt het volledig willekeurig, maar uiteindelijk leert het systeem van gewonnen en verloren spellen, en past het de parameters van het neurale netwerk aan waardoor het in de toekomst een grotere kans heeft om goede keuzes te maken”, aldus DeepMind.

Het systeem wist na slechts een paar uur aan training de voormalige recordhouder in schaken, Stockfish, te verslaan. In de helft van die tijd wist het de Elmo-engine, die recordhouder was bij shogi, te verslaan. Daarmee heeft het systeem zich krachtiger bewezen dan andere kunstmatige intelligenties.

Volgens DeepMind toont het feit dat AlphaZero drie verschillende bordspellen kon aanleren aan dat het systeem mogelijk in staat is om ieder informatiespel onder de knie te krijgen. Onder die categorie vallen schaken, Go en andere spellen die de aandacht van onderzoekers in het vakgebied van kunstmatige intelligentie vasthouden.