Google breidt TensorFlow uit met ‘similarity’-functionaliteit

Abonneer je gratis op Techzine!

Google heeft onlangs nieuwe functionaliteit toegevoegd aan zijn TensorFlow-technologie voor machine learning. TensorFlow Similarity moet overeenkomsten tussen items beter gaan herkennen. Ook kan de functionaliteit TensorFlow ML-modellen beter trainen om gelijkenissen te ontdekken.

De ontwikkelingen op het gebied van AI en in dit geval machine learning blijven maar toenemen. Met de komst van TensorFlow Similarity heeft Google weer een nieuwe stap gezet naar nog meer ML-mogelijkheden voor zijn klanten.

Concreet is TensorFlow Similarity een Python-pakket dat zogenoemde similarity-modellen moet trainen met het ML-framework van Google. Similarity-modellen helpen klanten te zoeken naar gerelateerde items, zoals kleding die er hetzelfde uitziet of het identificeren van muziek, zoals in Shazam.

Contrastive learning-technologie

Voor het trainen van de similarity-modellen, gebruikt de nu uitgebrachte functionaliteit onder meer de ‘contrastive learning’-technologie. Hierbij worden algoritmes in clusters ondergebracht die automatisch patronen in data identificeren op basis van de gedachte dat data points in groepen dezelfde eigenschappen hebben.

Contrastive learning maakt het mogelijk voor een model om items in zogenoemde ‘embedding spaces’ te stoppen wanneer deze op een dataset worden toegepast. De ruimte tussen deze embedding spaces moet dan indicatief zijn voor hoe gelijk de data input items zijn.

Gebruik van TensorFlow Similarity

Wanneer een model met TensorFlow Similarity wordt getraind, zijn de afstanden tussen gelijkwaardige items klein en tussen niet-gelijkwaardige items groot. Als dit model is getraind, maakt de software een index aan met de embeddings van de diverse items voor doorzoekbaarheid. Hiermee kunnen volgens Google miljoenen geïndexeerde items worden doorzocht, waardoor in een fractie van een seconde de belangrijkste gelijkenissen naar boven kunnen worden gehaald.

De software-oplossing kan ook een ongelimiteerd aantal nieuwe klassen aan de algemene index toevoegen, zonder dat het model opnieuw moet worden getraind. Alleen de embeddings voor de representatieve items in de nieuwe klassen worden berekend.

Met TensorFlow Similarity kunnen ML-specialisten en -ontwikkelaars in eerste instantie vooral onderdelen bouwen voor op contrastive learning gebaseerde similarity-modellen. In de nabije toekomst wordt ondersteuning voor andere modellen hieraan toegevoegd, zo geeft Google aan.

TensorFlow Similarity is nu als open-source beschikbaar via GitHub. Ook is een programming notebook beschikbaar met een tutorial over het basisgebruik van de nieuwe TensorFlow-functionaliteit.