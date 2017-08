Apps & Software

De Cloud Speech API van Google krijgt vandaag een update. Met deze API kan spraak overgezet worden naar tekst. Dankzij de update komen er 30 talen bij, terwijl er voorheen al 89 verschillende talen beschikbaar waren. Google introduceert tevens een aantal nieuwe functie voor de Cloud Speech API.

Als het gaat om de beschikbare talen, is het overigens goed om op te merken dat verschillende dialecten van dezelfde taal ook als afzonderlijke talen worden gecategoriseerd. Dit geldt onder andere voor verschillende versies van Engels, Spaans en Arabisch.

De nieuwe versie voegt ondersteuning voor onder meer Bengaals, Lets en Swahili toe. Volgens Google worden er dankzij de update één miljard mensen bereikt. Ook Nederlands wordt door de API ondersteund.

Nieuwe functies

Eén van de nieuwe functies die Google introduceert is wat het zelf world-level timestamps noemt. Dat houdt bijvoorbeeld in dat ieder woord met zo’n stempel gemarkeerd kan worden, zodat ontwikkelaars gebruikers kunnen laten horen hoe een woord klinkt. Onder andere human-augmented transcriptie en vertaaldiensten die deze API gebruiken kunnen zo sneller te werk gaan. “Having the ability to map the audio to the text with timestamps significantly reduces the time spent proofreading transcripts”, zo laat André Bastie die de API gebruikte voor zijn transcriptiedienst Happy Scribe weten.

De soorten bestanden die ontwikkelaars uploaden naar de dienst kunnen voortaan ook drie uur lang zijn. In de vorige versie van de API lag die tijd nog op 80 minuten. Bovendien kunnen ontwikkelaars ook om uitbreiding van het quotum vragen, zodat bestanden die langer zijn ook geüpload kunnen worden.

Tijdsbesparing

De eerste 60 minuten audio zijn met de Cloud Speech API gratis om te zetten naar tekst. Daarna dienen ontwikkelaars 0,006 dollar te betalen voor iedere 15 seconden extra. Happy Scribe biedt uiteindelijk een dienst aan waarbij 0,09 euro per minuut gevraagd wordt. Onder meer grote nieuwsmerken, waaronder de Wall Street Journal, gebruiken deze transcriptietool al. Niet zo vreemd, aangezien zelf een transcriptie schrijven veel tijd kost.