Salesforce bedenkt manier om AI-bias aan te pakken

Abonneer je gratis op Techzine!

Onderzoekers van Salesforce en de University of Virginia hebben een manier bedacht om gender bias (gendervooroordelen) te verminderen binnen zogeheten word embeddings. Word embeddings worden gebruikt om AI-modellen te trainen voor het samenvatten, vertalen en uitvoeren van andere voorspellingstaken.

Word embeddings leggen semantische en syntactische betekenissen van woorden vast, maar ook verbanden met andere woorden. Hierdoor worden ze vaak gebruikt voor Natural Language Processing (NLP). Er is echter ook kritiek op de manier waarop zij gendervooroordelen koppelen aan voorheen genderneutrale woorden. Bijvoorbeeld, de woorden ‘briljant’ en ‘geniaal’ zijn per definitie genderneutraal, maar ze worden wel gekoppeld aan ‘hij’, terwijl ‘naaien’ en ‘dans’ worden gekoppeld aan ‘zij’.

Double-Hard Debias

Double-Hard Debias transformeert word embeddings in een vorm van genderloze ‘subspaces’. De gendercomponent wordt dan langs deze dimensie geprojecteerd om tot vernieuwde embeddings te komen. Hierna wordt er een anti-bias operation uitgevoerd om tot het uiteindelijke resultaat te komen. Om deze resultaten te beoordelen hebben de onderzoekers de resultaten getest op de WinoBias dataset die bestaat uit zinnen die voor en tegen genderstereotypen zijn.

De prestatiekloof weerspiegelt hoe een algoritmesysteem presteert op de twee groepen en leidt uiteindelijk tot een gender bias score. De onderzoekers gebruikten het GloVe-algoritme om de bias score uit te rekenen en de score zakte van 15 naar 7,7 terwijl de semantische informatie in tact bleef. De resultaten zijn ook gelijkmatiger gemengd dan andere scenario’s op visualisaties (tSNE-projecties) die embedding visualiseren.

Vooroordelen zullen altijd bestaan

Er zijn genoeg experts die van mening zijn dat word embeddings nooit volledig vrij zullen zijn van vooroordelen. In een recente analyse van de Technische Universiteit van München beweren medewerkers dat natuurlijk overkomende neutrale tekst simpelweg niet bestaat, omdat de semantische inhoud van woorden altijd intrinsiek verbonden is met de sociale en politieke context van een samenleving.