2min

Tags in dit artikel

, , ,

Optische sensoren als camera’s en lidar (LIght Detection And Ranging) zijn ondertussen een belangrijk onderdeel van de moderne robotica voor ruimtelijke herkenning. Er is echter een nadeel, en dat is dat transparante objecten, denk aan glazen of flessen, de neiging hebben om de sensoren in verwarring te brengen. Google beweert een oplossing te hebben voor dit probleem met ClearGrasp AI.

Het probleem met transparante voorwerpen komt omdat de meeste algoritmen die de gegevens van die sensoren analyseren ervan uitgaan dat alle oppervlakken mat zijn, en dat ze licht gelijkmatig in alle richtingen en vanuit alle hoeken reflecteren. Transparante objecten breken natuurlijk een deel van het licht af, maar reflecteren het ook, waardoor de data voor sensoren ongeldig lijkt en waardoor er vaak erg veel ruis aanwezig is in die data.

Een team van Google-onderzoekers werkte samen met Columbia University en Synthesis AI, een data generation platform voor computer vision, om ClearGrasp te ontwikkelen. Het is een combinatie van algoritmes die in staat is om nauwkeurige 3D-gegevens van transparante objecten in te schatten, op basis van RGB-beelden. Het algoritme werkt overigens met input van elke standaard RGB-camera, waarbij AI wordt gebruikt om de diepte van transparante objecten te reconstrueren.

Drie algoritmen

ClearGrasp bestaat in uit een combinatie van drie machine learning-algoritmes. Het gaat om een netwerk dat de normale status van oppervlakken in kan schatten, een netwerk voor ‘occlusion boundaries’ (afwijkingen in diepte bij een oppervlak) en een netwerk dat transparante objecten maskeert. Dit ‘masker’ verwijdert alle pixels die bij transparante objecten horen. Op die manier kan de juiste diepte worden ingevuld, in plaats van de foutieve diepte die in eerste instantie werd gemeten door een ‘verward’ algoritme. Verder kan een module de gemeten diepte van het oppervlak optimaliseren, om de vorm van de reconstructie te verbeteren. De voorspelde occlusion boundaries helpen om de scheiding tussen de verschillende objecten te herkennen.