2min

Amazon heeft een nieuwe aanpak ontwikkeld om deep learning te gebruiken, wat al nieuwe mogelijkheden voor spraak- en beeldherkenning heeft geproduceerd. De aanpak moet ontwikkelaars helpen om eenvoudiger natuurlijkere spraakervaringen te ontwikkelen.

De aanpak, Alexa Conversations, moet bovendien een derde minder regels code vereisen dan de huidige aanpak, en tien keer minder data vereisen om de algoritmische modellen te trainen, schrijft Silicon Angle. Het resultaat van Alexa Conversations is natuurlijkere en flexibelere dialogen binnen individuele vaardigheden, zoals de mogelijkheden en apps van Alexa genoemd worden. Daarnaast moeten meerdere vaardigheden redelijk naadloos ingezet kunnen worden in een enkel gesprek.

Demo

De nieuwe mogelijkheden zijn al beschikbaar als ontwikkelaarspreview, en werden tijdens de re:MARS-conferentie gedemonstreerd door vicepresident en hoofdwetenschapper voor Alexa Rohit Prasad. De nieuwe mogelijkheden bevatten onder meer een “cross-skill action predictor”.

In de demo vroeg een vrouw aan Alexa welke films in de buurt draaien, waarop Alexa suggereerde om tickets te boeken en eenvoudig omging met de gewenste filmtijden. Ook vroeg Alexa de vrouw of ze een restaurant in de buurt wilde boeken, gaf Alexa opties voor Chinees eten, boekte een reservering op OpenTable en vroeg of de vrouw een taxi of Uber nodig had. Het vervoer werd vervolgens ook geboekt.

Volgens Prasad is dat een grote stap voor klantgerichte AI. Eerder zou het 48 verzoeken van de gebruiker hebben gekost om dit alles voor elkaar te krijgen, terwijl dat nu slechts dertien verzoeken kostte. Daardoor gaat er dus weer werk naar Alexa toe, in plaats van naar de gebruiker.

Werking

Dit is allemaal mogelijk via een door kunstmatige intelligentie gedreven “dialog manager”, met een geavanceerde dialoogsimulatie-engine die automatisch synthetische trainingsdata genereert. Door API’s te gebruiken die door ontwikkelaars geleverd zijn voor een vaardigheid, samen met geannoteerde stukjes dialoog met verzoeken voor Alexa en acties die klanten waarschijnlijk ondernemen, genereert Alexa Conversations een dialoog-flow en variaties aan de hand van een terugkerend neuraal netwerk.

Het netwerk neemt de geschiedenis van de dialoog mee en voorspelt de optimale volgende actie of stap in die dialoog. Daarbij moet de accuraatheid verhoogd worden en het werk aan ontwerp en code verminderd worden, aldus Amazon.