Bijna alle bedrijfsgegevens zitten gevangen in documenten. Regelmatig zijn PDF’s echter slecht op te zoeken en met moeite te digitaliseren. Mistral belooft met een nieuwe OCR-tool betere prestaties op dit gebied te leveren dan voorheen mogelijk was.

Het Franse AI-bedrijf Mistral staat vooral bekend als een Europese bouwer van large language modellen, maar innoveert ook op andere gebieden. Met Mistral OCR wil het pagina’s kunnen doorzoeken en digitaliseren zodat de data bruikbaar wordt als markdown. Deze informatie is vervolgens te benutten in AI-training op bedrijfseigen data, iets dat voor organisaties met bergen aan PDF’s nog niet zo realistisch was.

Multimodale aanpak

Net als bij Mistral’s multimodale LLM’s, kiest het bedrijf voor een brede inzetbaarheid. De OCR-API kan overweg met tekst, tabellen, wiskundige formules en complexe layouts. Het model is meertalig en kan documenten in verschillende talen en lettertypen verwerken. Zowel Engels als Arabisch moet dus van handschrift naar digitale letters omgetoverd kunnen worden.

Prestaties en beschikbaarheid

Volgens benchmarks van Mistral AI presteert de OCR-API beter dan vergelijkbare oplossingen via Google Gemini of Microsoft Azure. Het model zou accurater zijn in het herkennen van tekst en kan tot 2.000 pagina’s per minuut verwerken op een enkele node.

De API is per direct beschikbaar via het developer-gerichte La Plateforme-platform van Mistral en wordt ook geïntegreerd in de Le Chat-app. Voor organisaties die gevoelige informatie verwerken, biedt Mistral de mogelijkheid om de technologie op eigen infrastructuur te draaien. De kosten bedragen ongeveer 1 dollar per 1.000 pagina’s, met korting bij batchverwerking.

Toepassingen

Mistral ziet verschillende toepassingen voor de OCR-API, waaronder het digitaliseren van wetenschappelijk onderzoek, het bewaren van historische documenten en het stroomlijnen van klantenservice. Natuurlijk blijft het verzamelen van fysieke informatie soms monnikenwerk, zeker als er gezocht moet worden in stoffige omgevingen. Maar de uiteindelijke leesfunctie kan als laatste struikelblok gelden, waarbij zelfs het menselijk oog de vele mogelijke handschriften soms niet kan ontwaren.

Dit geeft voor AI een kans om zowel dit laatste stapje digitalisering te vereenvoudigen, als de accuratesse hoger te krijgen dan zelfs mensen kunnen bereiken. We wachten de reactie vanuit eindgebruikers nog even af voordat we kunnen concluderen dat Mistral OCR werkelijk een doorbraak op dit gebied betekent. De benchmarks, beschikbaar op Mistral’s eigen blogpost, beloven veel.