Verbod ChatGPT voor ambtenaren stap dichterbij: is opensource lekvrij?

Het Nederlandse kabinet geeft de voorkeur aan opensource-versies van generatieve AI. Demissionair staatssecretaris Alexandra Van Huffelen van Digitale Zaken neemt hierin het voortouw en zet zich zo opnieuw af tegen ChatGPT en DALL-E. Er is wel geweten dat ook de opensource-versies niet volledig risicovrij zijn, maar de voordelen van de technologie zouden te waardevol zijn om een algemeen verbod in te stellen. De voordelen blijken echter wel kleiner dan gehoopt.

In een voorlopig standpunt bij het gebruik van generatieve AI door ambtenaren, kiest het Nederlandse kabinet voor opensource. Dat besluit wordt beargumenteerd door de nadelen van commerciële varianten op te lijsten.

Inhoudelijke argumenten over de voordelen van opensource zijn er niet. Het lijkt er vooral om te draaien dat opensource de meest eenvoudige oplossing is. Deze versies voldoen, in de meeste gevallen, van nature al aan de wetten die overheden beperken in welke software zij mogen gebruiken.

Angst om geheimen te lekken

ChatGPT, Bard en Midjourney worden nog eens aangehaald als AI-toepassingen die niet zijn toegestaan door Rijksorganisaties. De tools zijn namelijk in strijd met de copyright-wetgeving. Dat is overigens wel een zaak die Europa gezamenlijk wil aanpakken in de AI Act.

Toch zal dat niet voldoende zijn om het kabinet te overtuigen van de tools, want ook de privacyschending wordt als een punt genoemd. Aangezien de regels ook gelden voor de Belastingdienst en het Ministerie van Defensie, is het van belang dat de informatie die ambtenaren in een prompt delen met het AI-model geheim blijven. Anders dreigt het AI-model een grote zoekmachine voor hackers te worden naar persoonlijke informatie over Nederlanders of naar staatsgeheimen.

Opensource eigen problemen

De controle op de privacy- en auteursrechtenwetgeving is volgens het voorlopig standpunt belangrijk om de accuraatheid van de AI-toepassing te bepalen. Deze trainingsdata zou de output van de tool vol ‘bias en onjuistheden’ zetten.

We merken echter op dat de output van opensource-versies niet per definitie zo veel beter zijn. Opensource-versies hebben hun eigen problemen die vaak het gevolg zijn van menselijke fouten. Zo is het mogelijk dat hackers met de API’s kunnen knoeien doordat de ontwikkelaar even vergeet de API tokens op ontzichtbaar te zetten bij het plaatsen van een code naar een publieke repository. Dat voorbeeld is overigens niet vergezocht, maar gewoon de realiteit. Via Hugging Face stonden meer dan 1.500 API tokens opengesteld, wat miljoenen gebruikers van Llama, Bloom en Pythia kwetsbaar maakte. Een hacker had via de tokens namelijk toegang tot de trainingsdata van de LLM’s en kon deze vol foute informatie zetten of ‘vergiftigen’. Deze modellen zullen daardoor evengoed de ene onwaarheid na de andere vertellen.

Lees ook: Hackers konden populaire LLM’s bewerken door open API tokens op Hugging Face

‘Veel potentie’

Het voorlopig standpunt duidt wel op een probleem dat alle generatieve AI-modellen momenteel nog hebben. Gebruikers van de tools krijgen namelijk bijna geen zeggenschap in handen. “De rechten van betrokkenen zoals de mogelijkheid tot inzage- en het eventueel verwijderen, of rectificeren van (onjuiste) persoonsgegevens zijn momenteel zeer beperkt.” Dat maakt het mogelijks logischer om generatieve AI in het algemeen te beperken. Gelekte belangrijke informatie van inwoners of staatsgeheimen zijn namelijk niet meer uit de dataset te krijgen. De technologie is volgens het voorlopig standpunt echter te waardevol om dat te bepalen.

Een voorkeur naar opensource-versies van generatieve AI is uitgebracht nadat bepaald werd dat het gebruik van generatieve AI door overheidspersoneel ‘veel potentie’ heeft. Dat is het besluit van een onderzoek naar de kansen van generatieve AI voor de publieke sector, die met onderbezetting kampt.

Daar wordt nu als antwoord op geformuleerd dat het onduidelijk is of de technologie het personeelstekort werkelijk zal oplossen. De voordelen van de technologie zijn dan wel weer groot genoeg om generatieve AI toe te laten: “Wel is de technologie veelbelovend en bestaat de kans dat het werk ten minste verandert.” Gezien de risico’s aan de technologie is het discutabel of deze voordelen voldoende zijn.

Naderend verbod op ChatGPT

Het voorlopig besluit van het Nederlandse kabinet komt niet als een verrassing. Eerder werd al bekend dat staatssecretaris Alexandra Van Huffelen, bevoegd voor Digitale Zaken, werkt aan een verbod op publieke AI-software voor ambtenaren. Op dat moment waren de onderzoeken waarin de gevaren van generatieve AI bekeken worden, nog lopende.

Op basis van het onderzoek is nu een voorlopig standpunt geformuleerd. Een definitief standpunt zal volgen na gesprekken met publieke organisaties. Wetgevingen rondom het gebruik zouden in 2024 moeten volgen, waarna ambtenaren ook opleidingen krijgen om de technologie optimaal en veilig te gebruiken.

Lees ook: Overheid wil publieke AI-software weren voor ambtenaren, maar heeft het zin?