2min

Microsoft heeft een reeks aan nieuwe machine learning-modellen onthuld voor zijn Cognitive Services-platform, meldt TechCrunch. Het gaat onder meer om een API voor het bouwen van personalisatiefuncties, een form recognizer voor het automatiseren van het invullen van data en een API om handschriften te herkennen. 

Allereerst is de Personalizer nieuw. Dit model helpt bij het bouwen van personalisatiefuncties. Dat is moeilijk, omdat het vaak gaat om het bouwen van modellen gebaseerd op data in verschillende silo’s. Met Personalizer zet Microsoft in op reinforcement learning, wat een techniek is waarbij er geen gebruik hoeft worden gemaakt van gelabelde trainingdata. In plaats daarvan probeert de agent constant de beste manier te vinden om een vooraf ingesteld doel te behalen, op basis van wat gebruikers doen.

Daarnaast is er dus een API om handschriften te herkennen, genaamd Ink Recognizer. Deze API kan automatisch handschriften, veelvoorkomende vormen en documenten herkennen. De dienst wordt al gebruikt in Microsoft Office 365 en Windows. De API laat ontwikkelaars deze mogelijkheden naar hun eigen applicaties brengen.

Verder voegt Microsoft Conversation Transcription toe aan zijn Cognitive Services. Dit transcribeert gesprekken en is onderdeel van de bestaande spraak-naar-tekstfuncties in de Cognitive Services. De tool kan verschillende sprekers labelen, het gesprek real-time uitschrijven en met wisselende sprekers omgaan.

Form recognizer

Form Recognizer is een geheel nieuwe API die het eenvoudiger maakt om text en data uit zakelijke formulieren en documenten te halen. De dienst heeft maar vijf monsters nodig om te begrijpen hoe het data moet verzamelen en gebruikers hoeven geen labels met de hand toe te voegen.

Form Recognizer komt ook naar cognitive services containers, waarmee ontwikkelaars de modellen buiten Azure kunnen gebruiken op hun edge-apparaten. Dit geldt ook voor de bestaande spraak-naar-tekst- en tekst-naar-spraakdiensten, evenals de bestaande anomaly detector.

Tot slot kondigde het bedrijf aan dat zijn Neural Text-to-Speech, Computer Vision Read en Text Analytics Named Entity Recognition API’s algemeen beschikbaar zijn.