Google lanceert open source-versie van library gebruikt voor eigen producten

Google heeft een open source-variant van één van zijn libraries gelanceerd. De internetgigant gebruikt de Library om een aantal van zijn eigen kernproducten aan te sturen. De library zorgt ervoor dat er data verzameld kan worden, zonder dat er persoonlijk identificeerbare informatie binnen of buiten de bedrijven onthuld wordt.

Miguel Guevara, productmanager in de Privacy and Data Protection Office van Google, stelt dat privacybeschermingen belangrijk zijn om het vertrouwen van gebruikers en klanten te behouden, schrijft TechCrunch. Hij spreekt daarbij over ‘differentially-private data analysis’, wat hij een principiële aanpak noemt waarmee organisaties kunnen leren van het overgrote deel van hun data. Tegelijkertijd verzekeren ze zich ervan dat data van een individu niet opnieuw geïdentificeerd kan worden.

Functies in library

De library die nu als open source-versie beschikbaar is, richt zich op functies die vaak lastig vanaf de grond af aan op te bouwen zijn. Ook bevat de library veel van de standaard statische functies die een ontwikkelaar nodig heeft. Dat zijn bijvoorbeeld ‘count’, ‘sum’ en ‘mean’.

Daarnaast bevat de library een extra library voor “rigoureuze testen”. Dat is belangrijk om dat het lastig is om ‘differential privacy’ goed in te bouwen. Ook zit er een PostgreSQL-extensie in, evenals een aantal recepten om ontwikkelaars te helpen te beginnen.

De library is op GitHub beschikbaar onder een Apache-licentie en is geschreven in C++. De library is tot slot op zo’n manier ontworpen dat het uitgebreid kan worden om andere functies te bevatten, zoals extra mechanismen, verzamelfunctie en privacy-budgetmanagement.

Google duikt in open source

Google heeft dit jaar behoorlijk wat projecten open source gemaakt. Zo maakte het in augustus zijn spraak-engine voor Live Transcribe open source, zodat ontwikkelaars deze kunnen gebruiken om lange gesprekken te transcriberen. Met de tool is het mogelijk om audio in real-time om te zetten in tekst. Dit doet het aan de hand van algoritmes en machine learning.

In februari maakte het bedrijf ook zijn tool Clusterfuzz open source beschikbaar. Daarmee kunnen ontwikkelaars tijdens het ontwikkelproces geautomatiseerd applicaties testen op mogelijke bugs en eventuele kwetsbaarheden.