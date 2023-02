Om zijn concurrenten voor te blijven, heeft Google gekozen voor een proactieve aanpak om de kwaliteit en veiligheid van zijn AI-chatbot Bard te waarborgen voordat deze wordt vrijgegeven voor het publiek.

Google heeft naar verluidt duizenden van zijn werknemers gevraagd om elke dag twee tot vier uur te besteden aan stresstests van het systeem, in wat het bedrijf “dog fooding” noemt. Het is onduidelijk of dit een dagelijkse of wekelijkse vereiste zal zijn.

In een uitgelekte bedrijfsbrede e-mail riep Google CEO Sundar Pichai alle medewerkers op om “op een diepere manier bij te dragen” om het systeem onder druk te testen. Dit volgt op een tamelijk gênant incident tijdens een recente presentatie waarbij Bard een belangrijke fout maakte waardoor het bedrijf 100 miljard dollar aan waarde verloor op de beurs.

Meer tests noodzakelijk

Google voert verschillende tests uit op Bard. Dit omvat het controleren van zijn “groundedness” om ervoor te zorgen dat de door AI gegenereerde tekst leest als afkomstig van een mens.

Het ontwikkelen van AI-chatbots is echter een uitdagende taak die aanzienlijke middelen en inspanningen vergt. Microsofts nieuwe AI-aangedreven variant van Bing heeft bijvoorbeeld kritiek gekregen vanwege zijn onnauwkeurigheden en vreemde reacties op gebruikersvragen. Om dergelijke problemen te voorkomen, heeft OpenAI, de maker van de AI die Microsoft Bing gebruikt, laagbetaalde werknemers in Kenia ingehuurd om voorbeelden van vreselijke inhoud te doorzoeken, waaronder inhoud over seksueel misbruik van kinderen, moord, marteling en zelfmoord.

Bard is niet klaar, en Google is op de hoogte

Hoewel het onduidelijk is of het personeel van Google aan soortgelijke taken zal worden onderworpen, suggereert de investering van het bedrijf in Anthropic, een rivaal van OpenAI, dat het de ontwikkeling van AI-chatbots serieus neemt. Anthropic neemt een “prompt engineer” aan om manieren te ontwikkelen om grote taalmodellen specifieke taken te laten uitvoeren.

De inspanningen van Google om de prestaties van Bard op te poetsen laten zien dat AI nog (lang) niet klaar is voor productie-omgevingen. Maar door werknemers te vragen mee te doen aan de tests, laat het bedrijf zien dat het zijn producten wil verbeteren en dat het ervoor wil zorgen dat gebruikers toegang hebben tot nauwkeurige en betrouwbare informatie.