IBM test manieren om natural language processing te verbeteren

Onderzoekers van IBM beschrijven in vier verschillende papers manieren om natural language processing te verbeteren. Het gaat om nieuwe semantic parsing-technieken, een methode om onvolledige kennisbanken te integreren met corpora en een tool die vakdeskundigen rekruteert om interpreteerbare, op regels gebaseerde systemen te verfijnen.

Salim Roukos, senior manager bij IBM Reserach, stelt dat natural language processing-systemen van grootzakelijke bedrijven vaak uitdagingen tegenkomen vanwege meerdere factoren. Het gaat bijvoorbeeld om het gebruik van heterogene silos aan informatie, incomplete data en het trainen van accurate modellen met kleine hoeveelheden data, schrijft Venturebeat.

“We verkennen meerdere thema’s om deze uitdagingen het hoofd te bieden en natural language processing voor enterprise-doeleinden te verbeteren.”

AMR

Het eerste onderzoek draaide om een abstract meaning representation (AMR). Dat is een datastructuur waarmee vergelijkbare zinnen dezelfde representatie kunnen krijgen.

Bij het onderzoek gebruikten de wetenschappers reinforcement learning, wat een trainingstechniek voor kunstmatige intelligentie (AI) is dat beloningen gebruikt om softwarebeleid naar bepaalde doelen te begeleiden.

Daarmee wisten de auteurs van de studie de semantische accuraatheid van een doelgrafiek naar 75,5 procent te brengen. Eerder was dat maximaal 74,4 procent.

Meerdere kennisbanken

Een ander team van IBM schreef in een paper over een aanpak voor queries, waarbij semantic parsing verenigd wordt over meerdere kennisbanken. De techniek gebruikt de structurele gelijkenis tussen query-programma’s om door verschillende kennisbanken te zoeken.

Dat werk sluit aan bij dat van weer een ander team. Daarin bestudeerden IBM-wetenschappers onvolledige kennisbanken en hoe deze samengevoegd kunnen worden met een corpus van een tekst.

Dat is een aanpak die volgens hen tot betere antwoorden kan leiden op vragen die niet volledig in hun kennisbanken of individuele documenten behandeld werden.

HEIDL

In de laatste paper beschrijven de onderzoekers een tool genaamd Human-in-the-loop linguistic Expressions with Deep Learning (HEIDL). Deze tool sorteert door machine gegenereerde expressies op precisie en terugroepacties.

In één van de experimenten annoteerde advocaten van IBM in 20.000 zinnen van bijna 150 contracten zinnen gerelateerd aan belangrijke clausules, zoals beëindiging, communicatie en betalingen. HEIDL analyseerde die vervolgens om inzichten van hoog niveau te leveren.

Een team van data scientists gebruikten dit om gemiddeld zeven regels te identificeren die de contracten automatisch een label gaven in ongeveer een half uur tijd. Volgens de wetenschappers had het een week of meer gekost om dit met de hand te doen.

Lees meer over Analytics

Snowflake Cortex AI Gateway moet AI-agents in toom houden

Snowflake introduceert Cortex AI Gateway, een centrale laag waarmee bedrijven zowel eigen als externe AI-agen...

Berry Zwets 22 uren geleden

Topartikel

DevRev daagt SaaS uit: AI data-integratie moet (en kan) beter

De 'SaaSpocalypse' zou wel eens vanuit de SaaS-laag zelf kunnen komen

Sander Almekinders 23 juli 2026

Progress koopt AI- en dataplatform Domo voor 400 miljoen

Progress Software legt 400 miljoen dollar op tafel voor Domo. De overname moet de AI- en datamogelijkheden va...

Berry Zwets 24 juli 2026

Topartikel

VS blokkeert AI-model Anthropic Fable: wat betekent dit voor Europa?

De Verenigde Staten hebben voor het eerst een geavanceerd AI-model geblokkeerd voor niet-Amerikaanse gebruike...

Coen van Eenbergen 23 juni 2026

Expert aan het woord

Tech calendar

IBM test manieren om natural language processing te verbeteren

AMR

Meerdere kennisbanken

HEIDL

Blijf op de hoogte, abonneer!

Helios: AMD groeit naar rack-scale AI-systeem

Cisco komt met Antares SLM’s: hoe sporen deze modellen kwetsbaarheden in code op?

CPU’s beleven eindelijk hun AI-doorbraak

DevRev daagt SaaS uit: AI data-integratie moet (en kan) beter

How Mirantis helps neoclouds maximize GPU ROI with k0rdent AI

Why hyperscalers run containers in VMs: VKS deep dive

Why enterprises are running VMs on Kubernetes with Portworx

AI observability and container security with Wiz at KubeCon

AI in cybersecurity: van ondersteuning naar samenwerking

Een AI-agent die in negen seconden een productiedatabase wiste: vijf lessen

ODC-Noord: bouwstenen voor een overheidscloud die al draait

Cyberoperatie INTERPOL en Fortinet legt nieuwe vormen van online mensenhandel bloot

Dreamforce

GOTO Copenhagen 2026

NetApp INSIGHT 2026

Manhattan EMEA Exchange

Cyberrisico’s zetten bedrijfscontinuïteit het meest onder druk

Hoe bouw je veilig agentic AI-applicaties in enterprise-omgevingen?

De opkomst van de Managed Intelligence Provider

Hoe zet je AI veilig in binnen applicatieontwikkeling?