Onderzoekers hebben een AI-framework ontworpen dat steden en regio’s lockdown- en thuisisolatie-strategieën aanbeveelt om verspreiding van het coronavirus tegen te gaan. Ze beweren dat hun AI superieur is aan de modelleertools die tot nu toe zijn gebruikt.
De kunstmatige intelligentie zou volgens de onderzoekers van Microsoft, het Indian Institute of Technology en TCS Research beleid automatisch aanleren en rekening houden met complexe zaken. Denk hierbij aan besmettelijkheid, draagtijd, duur van symptomen, kans op overlijden, bevolkingsdichtheid en bewegingsneiging.
De onderzoekers publiceerden hun bevindingen in een paper. Als het peer-reviewproces de beweringen van de onderzoekers ondersteunt, zou het framework nuttig kunnen zijn voor organisaties en overheden in landen die kampen met de verspreiding van het coronavirus.
Opzet AI-framework
Het framework gebruikt een model dat punten (nodes) aan elkaar koppelt, zoals onderstaande afbeelding aantoont. Elke node vertegenwoordigt een stad of regio, waarbij de grootte van een punt de populatie van een gebied aantoont. Gebieden die weinig inwoners hebben en ver van grote gebieden afliggen, zullen bijvoorbeeld niet snel in verbinding staan met zo’n groot gebied.
Vervolgens modelleerden de onderzoekers de beste ziekteparameters die op het moment beschikbaar zijn voor het coronavirus. Ze gingen uit van een incubatietijd van 5 tot 10 dagen, een geïnfecteerde periode van 7 tot 14 dagen, een 80 procent kans tot zichtbare symptomen, een sterftecijfer van 2 procent en 100 procent kans om de virus over te dragen indien een vatbaar persoon in contact komt met een besmet persoon.
De onderzoekers gingen ervan uit dat mensen van en naar andere gebieden konden reizen. Mensen met zichtbare symptomen van het coronavirus mochten niet naar naar andere nodes uit het model reizen, maar asymptomatische mensen konden dit wel. Tevens hielden ze rekening met het feit dat hoewel symptomatische mensen in quarantaine werden gezet binnen één node, enkele mensen zich niet aan de quarantaine hield en zich binnen de desbetreffende node verplaatste.
De onderzoekers stelden ook een aantal simpele beleidsvormen voor lockdowns op, waarbij ze er van uitgingen dat elke node de mogelijkheid had om één keer per week open of dicht te gaan. Vervolgens definieerden ze een reeks beleidsregels die ervoor zorgden dat de gebieden in lockdown gingen op het moment dat deze een vooraf bepaalde drempel van 5 procent, 10 procent, 20 procent of meer dan 100 procent overschreden.
Reinforcement learning
Ten slotte trainde het team een Deep Q Network reinforcement learning (een algoritme dat modellen aanspoort als ze goed werk verrichten) waardoor de modellen elke week per node de beslissing ‘open’ of ‘lockdown’ moeten maken door simulaties uit te voeren met betrekking tot de verspreiding van het coronavirus. Het algoritme identificeerde het optimale beleid voor lockdowns door middel van waarden. De rekenmethodes kenden bijvoorbeeld 1 punt toe voor een lockdowndag of een geïnfecteerde, terwijl een overleden persoon voor 2,5 punten staat.
Het onderzoeksteam draaide 75 simulaties die elk 52 weken (364) dagen duurden. Zo wisten ze vast te stellen dat gebieden zelfs met beperkte maatregelen minder besmettingen telden. De maatregelen houden er rekening mee dat besmettingen binnen een gebied oplopen, en dat de grootte van de populatie erbij bijdragen. Grotere gebieden gingen op slot zodra de infectie zich begon te verspreiden, om verspreiding naar andere gebieden af te vlakken.
De onderzoekers benadrukten dat ze geen expert zijn op het gebied van overdraagbare ziekten en dat het gebruikte AI-model geen rekening houdt met geografie. Ook zijn er geen echte data gebruikt voor de simulaties.