Microsoft haalt grote gezichtsherkenningsdatabase van het internet af

Microsoft heeft deze week stilletjes een database voor gezichtsherkenning van het internet verwijderd, meldt Silicon Angle. De database, MS Celeb, bevatte op een bepaald punt 10 miljoen beelden van ongeveer 100.000 mensen. Daarmee zou het de grootste database voor gezichtsherkenning zijn. 

De bedoeling was dat de database alleen beelden van beroemdheden bevatte. Een onderzoeker, Adam Harvey, stelt tegenover Vice echter dat er ook foto’s in de database zaten van journalisten, kunstenaars, muzikanten, activisten, politici, schrijvers en academici. Die foto’s kunnen onder de Creative Commons-licentie van het internet gehaald worden, wat betekent dat mensen zonder dat ze het wisten in de database terecht konden komen.

Diverse tech-experts stellen in The Financial Times dat Microsoft met de database mogelijk de Europese privacywetgeving GDPR geschonden heeft.  “Ze hebben het waarschijnlijk offline gehaald omdat hun advocaten zorgen uitten over dat ze geen reden hebben om speciale data als gezichten te verwerken volgens artikel 9 van de GDPR”, aldus Michael Veale, een technologisch beleidsonderzoeker bij het Alan Turing Instituut.

De database is door diverse organisaties gebruikt om kunstmatige intelligentie te trainen, onder meer door IBM, Panasonic, Nvidia, Alibaba en Microsoft zelf. Ook gebruikten twee Chinese bedrijven de software: Sensetime en Megvii. Volgens The New York Times kunnen die bedrijven gelinkt worden aan het gebruik van gezichtsherkenning door de Chinese staat. De overheid zou de software gebruikt hebben om ethnische minderheden te volgen.

Academische doeleinden

In een verklaring tegenover The Financial Times zegt Microsoft dat de website bedoeld was voor academische doeleinden. “Het werd gedraaid door een werknemer die niet langer bij Microsoft werkt en is inmiddels verwijderd.” Probleem is echter dat de database niet geheel verdwenen is. Hij bestaat namelijk nog steeds in diverse repositories op GitHub en de harde schijven van talloze onderzoekers.

Adam Harvey stelt dan ook dat de database waarschijnlijk gebruikt blijft worden in onderzoeksprojecten over de gehele wereld.