2min

De Amerikaanse inlichtingendienst tapt wereldwijd telefoongesprekken af die vervolgens direct worden omgezet naar tekst zodat ze doorzoekbaar en indexeerbaar worden. Hierdoor kan de Amerikaanse inlichtingendienst in een hoog tempo verdachte activiteiten onderscheppen en daarop inspelen. Dit blijkt uit nieuwe documenten van Edward Snowden.

Uit de documenten blijkt dat de NSA al sinds de jaren 90 werkt aan een systeem om spraak om te zetten naar tekst. Zo werden de eerste grote vorderingen gemaakt bij het automatisch omzetten in tekst van nieuwsbulletins wereldwijd, maar na de aanslagen op 11 september werd er fors geïnvesteerd om beter en sneller telefoongesprekken om te zetten naar tekst. Op dat moment werden alle gesprekken nog handmatig afgeluisterd door personeelsleden van de inlichtingendiensten, maar ze kwamen simpelweg oren te kort om alles af te luisteren.

Sindsdien zijn er grote vorderingen gemaakt en nu is de NSA in staat om elke dag miljoenen gesprekken af te luisteren, om te zetten in tekst en vervolgens doorzoekbaar te maken. Er wordt dan gekeken naar bepaalde woorden, zinnen of combinaties die interessant kunnen zijn voor de NSA.

De NSA luistert telefoonlijnen, VOIP-gesprekken en mobiele verbindingen af en zet deze gesprekken direct om in spraak. Op dit moment zou het systeem van de NSA ondersteuning bieden voor het Arabisch, Engels, Farsi Mandarijn (Chinees), Russisch en Spaans, waarvan Spaans inmiddels het beste werkt bij het omzetten naar tekst. Intern wordt het systeem al jaren het "Google voor Spraak" genoemd.

Hoewel de Amerikaanse inlichtingendiensten dus massaal telefoongesprekken lijkt af te tappen en inzichtelijk te maken wordt hier officieel niet over gesproken. Op vragen over stemherkenningstechnologie bij de inlichtingendienst wordt gesteld dat deze zeer beperkt is.

In de Amerikaanse Freedom Act staat wat voor informatie de inlichtingendiensten mogen verzamelen en daarin staat dat er officieel alleen metadata van telefoongesprekken mag worden verzameld. Daaronder valt alleen de basisinformatie zoals wie met wie belt, hoelang het gesprek duurt en op welk moment. De inhoudt valt daar niet onder, maar bij deze spraak naar tekst technologie draait alles om de inhoud.