Google’s TensorFlow pakt spam in Gmail nog harder aan

Google pakt de hoeveelheid spam binnen Gmail nog meer aan. Daarvoor integreert het zijn machine learning framework TensorFlow met de mailapp. De nieuwe maatregelen dienen als aanvulling op reeds bestaande algoritmes van Google tegen spam, en dringen de mogelijkheden om Gmail-gebruikers te spammen nog veel verder terug.

In een blogpost over de nieuwe functies meldt productmanager Neil Kumaran van Google’s Counter Abuse Technology departement, dat het bedrijf nu al 99,99 procent van alle spam, phishingaanvallen en malware die zich een weg naar de inbox van gebruikers probeert te banen kan blokkeren. Maar Google is niet snel tevreden en blijft ambitieus.

Spammails definiëren

De maatregelen die Google tot nu toe genomen heeft om spam aan te pakken, omvatten onder meer machine learning algoritmes en bepaalde maatregelen die gebaseerd zijn op een vaste set regels. Gezamenlijk identificeren ze patronen in grote datasets die mensen niet zo snel zullen zien. Maar de machine learning maatregelen weten dankzij “veel verschillende factoren” relatief eenvoudig uit te zoeken hoe spammails eruit zien.

Maar, zo schrijft Kumaran, “alleen omdat een aantal kenmerken van een e-mail voldoen aan die van wat we gewoonlijk als spam zouden zien, wil dat nog niet zeggen dat het ook echt om spam gaat. Machine learning stelt ons ertoe in staat om alle signalen samen te nemen en op basis daarvan een beslissing te nemen.”

Nog meer ambitie

Toch is de 99,99 procent die Google er nu uitfiltert niet voldoende voor het bedrijf. Om die reden ontwikkelde het met TensorFlow een reeks nieuwe manieren om spam aan te pakken. Daardoor kan het bedrijf nog eens 100 miljoen spamberichten per dag blokkeren. “Aangezien we al de meerderheid van alle spamberichten in Gmail blokkeren, is het met precisie blokkeren van nog eens miljoenen extra berichten een hele prestatie”, aldus Kumaran.

TensorFlow maakt het bovenal mogelijk om de bestaande algoritmes aan te blijven passen. Zo wordt de boel steeds beter in het herkennen van spam. Ook helpt dit de snelheid waarmee dit soort algoritmes gebouwd worden te verhogen. Die kunnen dan ook sneller en makkelijker getraind worden en dat maakt het aanpakken van spam een stuk effectiever.