AI voor het eerst beter in begrijpend lezen dan mensen

Kunstmatige intelligentie doet het op een aantal vlakken beter dan mensen. Denk bijvoorbeeld aan het klassieke Chinese bordspel Go, of aan schaken. Nu mogen we meer dan alleen spelletjes aan dat rijtje toevoegen. Kunstmatige intelligentie van Alibaba en van Microsoft wisten allebei beter te presteren op het vlak van begrijpend lezen dan mensen.

Dat lezen we op de site van de Stanford Question Answering Dataset (SQuAD). SQuAD is een dataset voor begrijpend lezen, specifiek gemaakt voor machine learning software. De dataset bestaat uit een reeks vragen die verwijzen naar een set Wikipedia-artikelen. Een antwoord op een vraag is gewoonlijk een bepaald stuk tekst op die sites.

Beter dan mensen

Op de site van SQuAD is een ranglijst te vinden met wie het beste gescoord heeft. De hoogste score van een mens op de lijst is 82.304. De software van Alibaba scoorde 82.44 en Microsoft wist op 82.65 uit te komen. Daarmee hebben de twee een gedeelde eerste plek gekregen. Heel verrassend is deze uitslag niet, want machines worden steeds geavanceerder.

“Het is een grote eer om de mijlpaal te bereiken waarbij machines beter begrijpend lezen dan mensen,” vertelt Luo Si, onderzoekswetenschapper van Alibaba in een statement tegenover de site CNet. “Dat betekent dat objectieve vragen als ‘wat veroorzaakt regen’ nu zeer accuraat beantwoord kunnen worden door machines. En we zijn vooral enthousiast omdat we geloven dat de onderliggende technologie mettertijd toegepast kan worden op talloze toepassingen, waaronder klantenservice, museumrondleidingen en online reacties op medische vragen van patiënten. Daarmee neemt de vraag naar menselijke input zienderogen af.”

Lees meer over Analytics

Expert aan het woord

AI voor het eerst beter in begrijpend lezen dan mensen

Beter dan mensen

Blijf op de hoogte, abonneer!

GitHub Copilot, AI-assistent van het eerste uur, staat zwaar onder druk

NIS2, CBW en cyberweerbaarheid: wat moet je weten?

OpenAI en Broadcom onthullen Jalapeño AI-inferentiechip

Claude-maker Anthropic lijkt OpenAI voor te zijn met beursgang

Cisco doubled down on compute for the AI and edge era

Why hyperscalers run containers in VMs: VKS deep dive

How vCluster virtualizes Kubernetes for GPU efficiency

How Atlassian designs AI products that users can trust

Hoe inconsistente AI een probleem is voor multinationals

Waarom een AI die ‘goed genoeg’ is vaak de slimste keuze is

Bewegend speelveld: vier datamanagementvaardigheden die Nederlandse bedrijven nu nodig hebben

AI-security begint in de boardroom

GITEX AI EUROPE 2026

GOTO Copenhagen 2026

Tijd om virtualisatie te evalueren

Klarrio: Architectuur is grootste knelpunt of grootste versneller

Zo gaat jouw IT-organisatie van reactief trainen naar roadmap-gedreven skills-opbouw