Fluid Annotation van Google zet AI in om datasets met beelden snel te annoteren

Google heeft een oplossing gemaakt om annotaties voor kunstmatige intelligentie te versnellen. Het gaat om Fluid Annotation, dat machine learning gebruikt om labels voor klassen, ieder object en achtergrondgebied in een foto te annoteren. Dat schrijft het bedrijf in een mededeling.

Annoteren is een proces dat veel tijd kost, zeker in het geval van beelden. Op dit moment wordt ieder object in een afbeelding nog geannoteerd door mensen, wat soms wel 19 minuten per foto kan kosten. Een complete dataset van 164.000 beelden kan daardoor 53.000 uur werk vereisen.

Fluid Annotation vervangt dat menselijke werk door machine learning. Volgens Google zelf kan het daardoor de creatie van gelabelde datasets drie keer versnellen.

Werking

Fluid Annotation begint met de output van een eerder getraind semantisch segmentatiemodel, dat ongeveer 1.000 beeldsegmenten met labels van klassen en betrouwbaarheidsscores genereert. Het segment met de hoogste betrouwbaarheid wordt doorgestuurd naar menselijke werknemers om ze te labelen.

Annoteerders kunnen een foto ook aanpassen via een dashboard, waarbij ze zelf kiezen wat ze corrigeren en in welke volgorde. Ook kunnen ze een label van een bestaand segment wisselen met een ander label van een automatisch gegenereerde shortlist. Verder is het mogelijk om een segment toe te voegen om een missend object te verbergen, een bestaand segment te verwijderen en de volgorde van de diepte van overlappende segmenten aan te passen.

“Fluid Annotation is een eerste stap om het maken van annotaties voor beelden eenvoudiger en sneller te maken”, stellen Jasper Uijlings en Vittario Ferrari, onderzoekers van Google. “In de toekomst willen we de annotatie van object-grenzen verbeteren, de interface sneller maken door meer machine-intelligentie toe te voegen en uiteindelijk de interface uitbreiden om eerder gemiste klassen af te handelen.”

Scale

Google is echter niet de enige die AI inzet om data te annoteren. De startup Scale gebruikt een combinatie van menselijke data labelers en machine learning-algoritmes om rauwe, ongelabelde stromen te sorteren voor klanten als Lyft, General Motors, Zoox, Voyage, nuTonomy en Embark.