Er is vaak maar weinig aandacht voor het werk dat het Chinese bedrijf Baidu verricht als het aankomt op kunstmatige intelligentie. Bedrijven als Google en Microsoft krijgen eigenlijk altijd meer aandacht. Toch blijkt het bedrijf vandaag weer een flinke stap voorwaarts gezet te hebben: een directe vertaalmachine.

Baidu heeft vandaag bekend gemaakt dat het voor het eerst een direct werkende vertaalmachine ontwikkeld heeft. Deze beschikt over een “controleerbare vertraging” die werkt door middels machine learning op de volgende woorden van een spreker te anticiperen. Het is een ontwikkeling met groot potentieel.

Direct vertalen

Baidu noemt het systeem Simultaneous Translation with Anticipation and Controllable Latency (STACL), dat directe vertalingen breed beschikbaar moet maken. Het systeem zou nuttig kunnen zijn, omdat vertalers meestal alleen een “volgende vertaling” kunnen verzorgen. Dat houdt in dat een vertaler moet wachten tot een spreker klaar is met zijn zin, waarop er gauw vertaald kan worden. Dat kan lang duren en soms ook een gesprek verstoren.

Om die reden geven veel regeringsleiders en andere belangrijke individuen voorkeur aan vertalers die direct kunnen vertalen. Dat is geen makkelijke taak, want ze moeten dan een paar seconden nadat iemand begint met spreken meteen gaan vertalen. Er zijn maar een paar mensen die dat kunnen doen en het werk vergt veel van mensen.

Ingewikkelde techniek

De meeste mensen die direct kunnen vertalen, kunnen dat hooguit twintig tot dertig minuten aan een stuk. Daarna worden ze moe en gaan ze fouten maken. Soms bestaan dit soort vertaalteams dan ook uit twee of drie mensen die elkaar afwisselen. “Om die reden is er een dringende behoefte aan geautomatiseerde systemen die het mogelijk maken om direct te vertalen”, aldus Baidu.

Ondanks dat tools als Google Translate steeds preciezer worden, is het direct vertalen van gesproken teksten ingewikkeld. Dat komt doordat de woordvolgorde moet kloppen en daarvoor moeten verschillen in talen gecompenseerd moeten worden.

Een voorbeeld van Baidu is de Chinese zin “Bùshí Zǒngtǒng zài Mòsīkē yǔ Pǔjīng huìwù”. Dat betekent zoiets als “President Bush ontmoet Poetin in Moskou”. Het Chinese werkwoord huìwù (ontmoet) staat aan het einde van de zin, terwijl het in de vertaling eerder staat. Daarvoor moet het systeem voorspellen dat de spreker van plan is het woord “ontmoeten” te gebruiken, zodat de tekst klopt.

Zelf kiezen wanneer

Het systeem van Baidu maakt het mogelijk voor gebruikers om in te stellen wanneer de vertaling van start moet gaan. Zo kunnen ze ervoor kiezen dat direct na een woord vertaald moet worden, of bijvoorbeeld vijf seconden later. Dat is handig, want zo kan rekening gehouden worden met verschillen in structuur van talen. Frans en Spaans lijken op elkaar en het vertalen daarvan is eenvoudig. Maar talen als Fins en Nederlands verschillen behoorlijk, waardoor een vertraging nuttig kan zijn.

STACL is nog een work in progess en nog niet getest in de praktijk. Baidu weet dus ook niet of het beter presteert dan menselijke vertalers.