Microsoft wil AI gebruiken om te voorspellen of PC malware gaat krijgen

Microsoft heeft een nieuwe uitdaging voor data scientists gelanceerd op de crowdsourcing-site Kaggle. Deelnemers kunnen 25.000 dollar winnen door een algoritme te maken dat kan voorspellen welke types Windows-computers op korte termijn zeer waarschijnlijk geïnfecteerd worden met malware, meldt ZDNet.

De wedstrijd wordt gehouden door het Windows Defender Advanced Threat Protection (ATP) Research-team, met hulp van academische partners Northeastern University en Georgia Institute of Technology.

Het model dat gemaakt moet worden, moet veel geavanceerder zijn dan simpelweg voorspellen hoe groot de kans op een infectie is voor een Windows XP-machine of een Windows 10-machine. Het doel van de wedstrijd is namelijk om te voorspellen hoe groot de kans is dat een Windows-machine geïnfecteerd wordt door diverse malware-families, op basis van de verschillende aspecten van die machine.

“Niet alle machines hebben een even grote kans om malware te krijgen; deelnemers helpen met het bouwen van modellen om apparaten die een hoger risico op malware hebben, zodat er voorkomende acties ondernomen kunnen worden”, vertellen Chase Thomas en Robert McCann, leden van het Windows Defender Research-team.

Echte data

Onderzoekers krijgen 9,4 GB aan geanonimiseerde data uit de echte wereld van 16,8 miljoen apparaten, om de modellen te maken. De modellen worden vervolgens gejureerd op basis van hun mogelijkheid om correcte voorspellingen te doen. De data komt van instances van Windows Defender, het antivirusproduct van Microsoft.

Het detecteren van malware wordt “steeds gecompliceerder door de introductie van nieuwe machines, machines die online en offline gaan, machines die patches ontvang en machines die nieuwe besturingssystemen krijgen”. De data bevat verder details over de locatie van de machine, de geïnstalleerde en actieve antivirussoftware, de standaard browser, de CPU, het bouwnummer van het besturingssysteem en meer.

De wedstrijd begon afgelopen donderdag en heeft al 80 teams aangetrokken. De teams hebben drie maanden om het model te maken en in te dienen.