Kunstmatige intelligentie doet het op een aantal vlakken beter dan mensen. Denk bijvoorbeeld aan het klassieke Chinese bordspel Go, of aan schaken. Nu mogen we meer dan alleen spelletjes aan dat rijtje toevoegen. Kunstmatige intelligentie van Alibaba en van Microsoft wisten allebei beter te presteren op het vlak van begrijpend lezen dan mensen.
Dat lezen we op de site van de Stanford Question Answering Dataset (SQuAD). SQuAD is een dataset voor begrijpend lezen, specifiek gemaakt voor machine learning software. De dataset bestaat uit een reeks vragen die verwijzen naar een set Wikipedia-artikelen. Een antwoord op een vraag is gewoonlijk een bepaald stuk tekst op die sites.
Beter dan mensen
Op de site van SQuAD is een ranglijst te vinden met wie het beste gescoord heeft. De hoogste score van een mens op de lijst is 82.304. De software van Alibaba scoorde 82.44 en Microsoft wist op 82.65 uit te komen. Daarmee hebben de twee een gedeelde eerste plek gekregen. Heel verrassend is deze uitslag niet, want machines worden steeds geavanceerder.
“Het is een grote eer om de mijlpaal te bereiken waarbij machines beter begrijpend lezen dan mensen,” vertelt Luo Si, onderzoekswetenschapper van Alibaba in een statement tegenover de site CNet. “Dat betekent dat objectieve vragen als ‘wat veroorzaakt regen’ nu zeer accuraat beantwoord kunnen worden door machines. En we zijn vooral enthousiast omdat we geloven dat de onderliggende technologie mettertijd toegepast kan worden op talloze toepassingen, waaronder klantenservice, museumrondleidingen en online reacties op medische vragen van patiënten. Daarmee neemt de vraag naar menselijke input zienderogen af.”