2min

Tags in dit artikel

,

AWS heeft de Brand Voice-feature naar zijn Amazon Polly-dienst gebracht, waardoor bedrijven in staat zijn op maat gemaakte stemmen te ontwikkelen voor spraakassistent Alexa.

De AWS-afdeling Polly houdt zich bezig met onderzoek naar kunstmatige intelligentie (AI). Er wordt onder andere neural text-to-speech (NTTS)-technologie ontwikkeld om kunstmatige stemmen te laten klinken als een mens. Brand Voice maakt gebruik van deep learning-modellen om intonatiepatronen in natuurlijke spraak te ontdekken, waarna het de stem reproduceert. Het AI-model is hiertoe in staat door uit twee componenten te bestaan. In de aankondiging zijn al een aantal resultaten te beluisteren.

Resultaten

AWS helpt inmiddels bedrijven op maat gemaakte stemmen te ontwikkelen met behulp van Brand Voice. De National Bank Australia en fastfoodketen KFC horen bij de eerste lading klanten die de dienst testen. Zo wordt er bij KFC de stem van Colonel Sanders nagemaakt. De overleden iconische oprichter van de fastfoodketen zal gebruikt worden om te reageren op klantvragen. In een statement verklaart de KFC dat “de kolonel” gepassioneerd was over zijn gefrituurde kip, en dat Brand Voice bestellen op een “leuke en memorabele manier” mogelijk maakt. De National Bank Australia neemt Brand Voice zeer serieus, de organisatie ziet het als een mogelijkheid om de klantervaring te verbeteren.

AWS heeft eerder vergelijkbare features uitgebracht voor Alexa-apparaten. Het wist bijvoorbeeld de stem van Samuel L. Jackson na te maken. De acteur hoefde daar zelf niet uren zijn stem voor laten opnemen. De NTTS-modellen waren namelijk in staat om audio-opnames van Samuel L. Jackson om te zetten in een herproductie van zijn stem.

Andere inspanningen van Amazon tonen tevens aan dat het van Alexa steeds meer een technologie wil maken voor bedrijfstoepassing. Zo werd eerder de Alexa for Business Blueprints onthuld, waarmee werknemers gemakkelijk nieuwe skills voor Alexa moeten kunnen maken.