Wetenschappers van de University of Science and Technology in China hebben met kwantumfysica een antwoord gevonden op de veelomvattende vraag: “Als de mens zo slim is, waarom maken we dan allemaal zoveel domme keuzes?”

Psychologen en casino’s hebben door de jaren heen nogal wat kosten gemaakt om uit te zoeken waarom mensen niet altijd de juiste keuzes maken, zelfs als de gevolgen duidelijk zijn. Theoretisch zijn mensen in staat om eenvoudige, slimme keuzes te maken, maar wie heeft er in zijn leven niet een aantal minder optimale beslissingen genomen, en waarom is dat het geval?

Volgens de onderzoekers is antwoord onzekerheid, als in het soort onzekerheid dat in de kwantummechanica als concept gebruikt wordt. De onderzoekers gebruikten een bepaalde aanpak genaamd quantum reinforcement learning (QRL), die gebaseerd is op een techniek die zowel in de psychologie als in de ontwikkeling van kunstmatige intelligentie wordt gebruikt. Die techniek wordt simpelweg classic reinforcement learning (CRL) genoemd.

Quantum reinforcement learning

Quantum reinforcement learning houdt in dat een quantum agent interacteert met een klassieke omgeving. Dit moet tot gevolg hebben dat parameters aangepast worden via beloning of bestraffing. Klassieke reinforcement learning doet dit ook, maar dan zonder een quantum agent. In theorie zou dit alle voorspellingen die met behulp van QRL worden gedaan accurater moeten maken dan die met gebruik van CRL. Dit is het geval omdat modellen vanuit die theorie de onzekerheid in het kwantumuniversum verklaren, omdat nooit echt de uitkomst van een gebeurtenis op kwantumniveau kunt voorspellen.

Om dit aan te tonen hadden de onderzoekers wel een methode nodig waarmee ze konden aantonen dat de QRL-modellen beter presteerden dan de CRL-modellen. Om dit te kunnen doen vroegen de onderzoekers proefpersonen om zich tijdens het spelen van een spel dat bekend staat als de “Iowa Gambling Task” te laten fMRI-scannen.

De Iowa Gambling Task is ontwikkeld om te bepalen hoe gemakkelijk deelnemers van hun fouten kunnen leren. Wat bleek is dat mensen die gevoelig waren voor verslavingen vaker domme fouten maakten. Rokers presteerden bijvoorbeeld ondermaats bij de gambling task, in vergelijking met “gezonde” individuen. Deze uitkomst werd accurater voorspeld door de QRL-modellen dan door CRL-modellen, voor beide groepen.