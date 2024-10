Zwitserse onderzoekers zijn erin geslaagd een AI-model te trainen dat in alle gevallen een CAPTCHA-puzzel weet op te lossen. Dat zou weleens kunnen betekenen dat deze methode om bots van menselijke websitebezoekers te onderscheiden, z’n langste tijd heeft gehad.

De onderzoekers van de technische universiteit ETH in Zurich (ook bekend van dit initiatief) hebben het bestaande YOLO (You Only Look Once)-model verder getraind met het doel te onderzoeken of deze de bekende CAPTCHA-puzzels kon oplossen die veel websites gebruiken voor het blokkeren van bots. Dergelijke puzzels verhinderen dat dergelijke scripts formulieren of surveys invullen, producten kopen of andere acties uitvoeren die voorbehouden moeten blijven aan menselijke sitebezoekers.

Turing-test voor websitebezoekers

CAPTCHA staat voor ‘Completely Automated Public Turing test to tell Computers and Humans Apart’ en dat is precies waarvoor het de afgelopen jaren is gebruikt. Internetbezoekers moeten op basis van een opdracht als ‘selecteer alle zebrapaden’ op verschillende plaatjes klikken –en op anderen juist niet–. Een bot wist deze test voorheen eigenlijk niet te halen, mensen doorgaans wel.

De meest gebruikte CAPTCHA-test is die van Google, bekend als reCAPTCHA versie 2. Dat is precies de versie die nu in 100 procent van de gevallen is gekraakt door een versie van het YOLO-image processing-model, dat voor deze taak is aangepast door de ETH-onderzoekers. Eerdere pogingen resulteerden in een succes-rate van ‘slechts’ 68 tot 71 procent.

Verschillende varianten van ReCAPTCHA. Links een 3×3-grid, in het midden een complexer 4×4-grid. Het grid rechts vervangt aangeklikte afbeeldingen met nieuwe tot er niets meer te klikken valt om aan de opdracht te voldoen.

Menselijk gedrag imiteren

Het model had ongeveer evenveel pogingen nodig om de puzzel op te lossen als menselijke proefpersonen, wat betekent dat het achterliggende CAPTCHA-systeem waarschijnlijk moeite gaat hebben met het onderscheiden van de twee. Hoe meer het model menselijk gedrag vertoont, hoe lastiger dat namelijk is. Het gaat er dus niet enkel om dat het model de puzzel zo snel mogelijk kan oplossen, maar dat dit gebeurt op een manier die lijkt op hoe mensen dat doen.

Daarnaast bleek uit het onderzoek dat reCAPTCHAv2 in hoge mate leunt op de browsergeschiedenis en aanwezige cookies om menselijke bezoekers te onderscheiden van bots. Dat betekent dat bots mogelijk aan detectie kunnen ontkomen door menselijk browsegedrag na te apen. Niet verwonderlijk adviseren de onderzoekers om slimmere CAPTCHA-systemen te ontwikkelen die rekening houden met de voortgang in AI-technologie.

