Domeinspecifieke AI verslaat generieke modellen in business apps

Domeinspecifieke AI verslaat generieke modellen in business apps

Het AI-team van Visma is stilletjes bezig met het herdefiniëren van documentverwerking in Europa. Met bijna tien jaar ervaring verwerkt Visma Machine Learning Assets nu meer dan 18 miljoen documenten per maand met zijn modellen. Uiteindelijk ondersteunt het belangrijke bedrijfsprocessen met behulp van zeer gespecialiseerde AI-modellen. Wat begon als een poging om boekhoudkundige workflows te stroomlijnen, is uitgegroeid tot een verstrekkend initiatief dat state-of-the-art AI combineert met praktische bedrijfsbehoeften.

Net als veel AI-teams in het midden van de jaren 2010 vertrouwde de groep van Visma aanvankelijk op traditionele deep learning-methoden, zoals recurrente neurale netwerken (RNN’s), vergelijkbaar met de systemen die in 2015 Google Translate aandreven. Maar rond 2020 besloot het team van Visma het roer om te gooien. “We hebben al onze ontwikkelingsplannen geschrapt en werken sindsdien uitsluitend met transformers”, zegt Claus Dahl, Director ML Assets bij Visma. “We realiseerden ons dat transformers de toekomst waren voor taal- en documentverwerking en besloten onze stack volledig opnieuw op te bouwen.”

Deze verschuiving vond plaats voordat op transformers gebaseerde systemen zoals ChatGPT mainstream werden. Het eerste product van het team op basis van transformers kwam in 2021 op de markt, waardoor Visma een waardevolle voorsprong kon nemen bij de invoering van geavanceerde NLP-technologieën.

Document extractie op grote schaal

Het vlaggenschipproduct van het team is een robuuste engine voor documentextractie die documenten verwerkt in de landen waar Visma-bedrijven actief zijn. De engine ondersteunt verschillende talen. De AI kan worden gebruikt voor documenten als facturen en bonnen. De engine identificeert belangrijke velden, zoals datums, totalen en klantreferenties, en voert deze rechtstreeks in de boekhoudkundige workflows in.

Dit wordt aangevuld met Auto Suggest, een tool die transacties automatisch labelt op basis van aangeleerd bedrijfsgedrag. Het systeem past zich aan individuele organisaties aan en suggereert de juiste rekeningnummers, afdelingscodes en andere noodzakelijke metadata op basis van eerdere activiteiten.

Wat gebruikers ervaren als een naadloze interface, is in feite een samenwerkingsverband van ongeveer 50 gespecialiseerde modellen die achter de schermen samenwerken. Elk model is afgestemd op specifieke taken of datastructuren en wordt dynamisch geselecteerd op basis van het type query. Deze modulariteit zorgt voor optimale prestaties zonder dat dit ten koste gaat van de gebruikerservaring.

Meertalig ontwerp

A man wearing glasses and a plaid shirt stands indoors in a modern building with large windows and natural light, reflecting the innovative environment at Visma.
Claus Dahl, directeur ML Assets bij Visma

Taaldiversiteit is vanaf dag één in het systeem ingebouwd. Het team heeft zijn modellen in ongeveer 20 verschillende talen getest en zelfs in contexten met minder middelen sterke resultaten behaald. Hoewel Engels vanwege de overvloedige trainingsdata nog steeds het meest robuust is, benadrukt Dahl dat het systeem goed omgaat met meertalige scenario’s, vooral voor eenvoudige informatie-extractietaken. “Als een document in het Vietnamees is, kunnen we nog steeds de datum en het bedrag vinden”, merkt hij op. “Het wordt complexer wanneer je iets als een projectreferentie wilt extraheren. Dan zijn een diepere context en taalspecifiek begrip nodig.”

Om dit te ondersteunen, maakt het team gebruik van meertalige basismodellen, waarmee gebruikers in hun eigen taal met het systeem kunnen communiceren, of ze nu documenten uploaden of de inhoud ervan doorzoeken.

Efficiënte training voor modellen met grote impact

Een aansprekend aspect van de aanpak van Visma is de trainingsstrategie. In plaats van enorme datasets na te jagen, geeft het team prioriteit aan kwaliteit boven kwantiteit. Elk jaar verwerken ze ongeveer 200 miljoen documenten uit ongeveer 100 landen. Deze documenten vormen de basis voor een groot algemeen model dat leert om verschillende documentformaten en lay-outs te begrijpen. Zodra deze basis is gelegd, kunnen kleinere, zeer gespecialiseerde modellen worden getraind met slechts 50 zorgvuldig geselecteerde voorbeelden.

“Hoogwaardige data is waardevoller dan grote volumes. We hebben geïnvesteerd in een toegewijd team dat deze datasets cureert om de nauwkeurigheid te waarborgen, waardoor onze modellen zeer efficiënt kunnen worden verfijnd”, legt Dahl uit. Deze strategie weerspiegelt de schaalwetten die worden gebruikt door grote taalmodellen, maar past deze aan voor gerichte bedrijfstoepassingen. Hierdoor kan het team snel itereren en hoge prestaties leveren in nichetoepassingen zonder buitensporige rekenkosten.

Automatisering en inzicht met elkaar verbinden

Naarmate AI volwassener wordt, gaat het bij documentverwerking niet langer alleen om automatisering. Het gaat steeds meer om het leveren van realtime inzichten. De systemen van Visma zijn nu in staat om foutpercentages tussen 1 en 3 procent te behalen, wat dicht in de buurt komt van menselijke prestaties. Deze nauwkeurigheid wordt bereikt door een tweeledige aanpak voor kwaliteitsbewaking. Het ene team houdt de prestatiestatistieken van gebruikers bij, terwijl het andere team de documentresultaten in realtime controleert. Samen zorgen ze voor het nodige toezicht om consistentie te garanderen in duizenden businesscases en formaten.

“Nauwkeurigheid is cruciaal, maar dat geldt ook voor aanpassingsvermogen”, merkt Dahl op. “Elk bedrijf is net iets anders, dus we richten ons erop om de AI flexibel genoeg te maken om van die context te leren.” Zo krijgt de klant een softwareoplossing die handmatige taken kan vervangen. Bovendien kunnen bedrijven door hulp bij het ontrafelen van documenten sneller beter geïnformeerde beslissingen nemen.

Omgaan met taal- en formaatuitdagingen

Ondanks het succes blijven er uitdagingen bestaan. Documenten in onbekende talen of met sterk gelokaliseerde formaten kunnen de extractie bemoeilijken. Standaardvelden, zoals datums en bedragen, kunnen goed worden vertaald, maar genuanceerde elementen, zoals contractreferenties of projectnummers, vereisen vaak een dieper semantisch begrip. Dit geldt met name wanneer het formaat niet consistent is.

“Er is een groot verschil tussen het lezen van een standaardfactuur en het interpreteren van een vrij opgesteld contract”, zegt Dahl. “Daarom zijn gespecialiseerde training en contextbewustzijn essentieel.” Om deze uitdagingen het hoofd te bieden, vertrouwt het team op het vermogen van transformatiemodellen om betekenis af te leiden uit structuur en context, in plaats van puur te vertrouwen op overeenkomsten met trefwoorden of sjablonen.

Op weg naar meer autonome AI-systemen

Een van de opkomende trends die het Visma-team onderzoekt, is het vergroten van de autonomie van hun AI-systemen. Terwijl de meeste AI in korte bursts werkt, bijvoorbeeld bij het verwerken van een document of het afhandelen van een transactie, is het doel om systemen te ontwikkelen die gedurende langere periodes coherent kunnen blijven werken. Dit komt overeen met ontwikkelingen in software agents, maar brengt ook hindernissen met zich mee. In tegenstelling tot openbare coderepositories die worden gebruikt om AI’s te trainen in coderen, zijn de meeste bedrijfsdata vertrouwelijk.

“Er zijn niet veel bedrijven die al hun boekhouding op internet zetten. Je moet dus creatieve manieren vinden om modellen te trainen met respect voor de privacy”, merkt Dahl op. Toch blijft de ambitie bestaan om AI te creëren die in de loop van de tijd kan redeneren, inzichten kan trekken uit documenten en als een echte zakenpartner kan fungeren.

In tegenstelling tot de vrees dat AI werknemers zal vervangen, stelt Dahl dat het tegenovergestelde gebeurt in het bedrijfsleven. Er is een tekort aan gekwalificeerde professionals en AI helpt die kloof te dichten. “Ik heb gehoord van accountants die klanten hebben laten vallen omdat ze hen niet winstgevend konden bedienen”, zegt hij. “Dankzij AI kunnen deze bedrijven meer klanten bedienen zonder in te boeten aan kwaliteit.”

Op weg naar AI-gereedheid

Het gesprek over AI in het bedrijfsleven is ook geëvolueerd. Risicobeoordelingen en juridische kwesties domineerden de vroege discussies. Tegenwoordig hebben veel professionals ervaring met AI via vertaaltools, apps voor het genereren van content of zelfs informele interacties. Bedrijven benaderen AI nu met praktische verwachtingen en beoordelen het op basis van prestaties, integratiegemak en rendement op investering. “We zijn de hype voorbij”, zegt Dahl. “Mensen vragen zich af: werkt het voor mijn bedrijf en hoe snel kan ik het gebruiken?”

De AI-reis van Visma laat zien hoe een gerichte, gespecialiseerde aanpak van machine learning op grote schaal resultaten kan opleveren. Door prioriteit te geven aan efficiëntie, meertalige ondersteuning en naleving van de wetgeving heeft het team een basis gelegd voor intelligente automatisering. Naarmate AI-systemen autonomer, contextueler en geïntegreerder worden, evolueren ze naar tools die bedrijven helpen slimmere beslissingen te nemen.

Tip: AI in softwareontwikkeling: van experiment naar standaard