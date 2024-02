Zowel de Europese Unie als individuele lidstaten hopen digitaal autonomer te worden. Voor AI-implementaties is men echter meermaals afhankelijk van niet-Europese bedrijven. Een zelfbeschikkende digitale infrastructuur dient dit te voorkomen. Nederland heeft al enkele stappen hiertoe gezet, maar wanneer kunnen we spreken over een volwaardige ‘Sovereign AI Infrastructure’ in?

Het streven naar Europese digitale onafhankelijkheid bestaat al een aantal jaar. Alleen al een soevereine clouddienst creëren blijkt lastig te zijn. Zo pogen Microsoft en AWS dit te bieden, maar zijn zij voor Europa slechts in beperkte zin nuttig. Immers zijn het niet-Europese spelers die mogelijk door Amerika gedwongen worden een kijkje te nemen in data op ons continent. Nu AI van kansrijke innovatie naar daadwerkelijke implementatie beweegt, zal Europa moeten voorkomen dat het ook op dit gebied van anderen afhankelijk is. Tevens zal het gegevens die hier worden gegenereerd, zoveel mogelijk moeten beschermen.

Maar wat is daarvoor nodig? Soevereine AI is op allerlei manieren te bevorderen, maar een volwaardige infrastructuur hiervoor heeft aardig wat vereisten. Het betekent namelijk controle over trainingsdata, software, toepassingen binnen sectoren en de hardware die nodig is om het te draaien. Dit is belangrijk omdat er alleen dan gegarandeerd kan worden dat AI-applicaties de goede richting op te sturen zijn met Europese en nationale wetgeving. Nederland heeft in ieder geval alvast uitgelegd hoe het in algemene zin dit met GenAI hoopt te bewerkstelligen.

Een overheidsbrede AI-visie

Ruim een maand geleden onthulde het demissionaire kabinet een “overheidsbrede visie op generatieve AI“. De nadruk lag daarbij op het zelf willen investeren in AI-innovaties zodat deze zich op een door Nederland gewenste manier ontwikkelen. De ondoorzichtigheid van huidige state-of-the-art implementaties van bijvoorbeeld GPT-4 maakt het onmogelijk te garanderen dat de gebruikte data en het LLM-gedrag naar wens is. Weliswaar zijn er open-source opties (zoals Meta’s Llama 2) die meer sturing bieden, maar volledige controle ontbreekt. De tijd dringt, want gemeente-ambtenaren laten al zien dat men AI simpelweg niet links kan laten liggen. Bij gebrek aan een geautoriseerde AI-oplossing om sneller te werken, grijpt men heimelijk naar ChatGPT.

Gemotiveerd om dit op te lossen presenteerden verschillende Nederlandse initiatiefnemers vorig jaar al GPT-NL, een taalmodel van eigen bodem. Een eigen LLM, getraind en ontwikkeld in het Nederlands, zou een solide basis kunnen zijn voor overheidsbrede implementaties van GenAI. Cruciaal daarbij is dat de trainingsdata volledig inzichtelijk kan zijn. Nederlandstalige bronnen kunnen de basis vormen, met duidelijke bescherming voor auteursrechten en wellicht compensatie voor het gebruik van nieuwsartikelen of archiefmateriaal. GenAI laat keer op keer zien dat de gebruikte data een reusachtige invloed heeft op de kwaliteit van de outputs, dus trainingsdata van eigen bodem is uiterst wenselijk. Op de lange termijn helpt dit het Nederlands tevens te waarborgen, zoals ook geldt voor andere talen.

Op Europees niveau zijn er al spelers die hier rekening mee houden. Zo ondersteunt het Franse Mistral AI al Frans, Engels, Duits, Spaans en Italiaans.

In praktische zin kan een AI-model getraind op deze data veel voor de overheid en daarbuiten betekenen. Denk hierbij aan tools die voor ambtenaren zijn toegestaan en voor een hogere productiviteit kunnen zorgen. AI kan helpen om documenten te doorzoeken en uitgebreide dossiers in korte tijd inzichtelijk te maken. Andere bekende voorbeelden zijn gericht op fraudepreventie, het formuleren van e-mails en het opstellen van concept-formulieren. Dergelijke AI-implementaties zullen menig lezer bekend zijn, maar zijn vooralsnog niet eenvoudig met vertrouwelijke documenten te verenigen. Wie dat nu wel doet, heeft dus geen idee of de gebruikte parameters en trainingsdata wel passen bij de soort AI-modellen die aan Nederlandse waarden voldoen. Ook zijn er geen garanties voor bijvoorbeeld het gebruik van ChatGPT dat de data niet bij OpenAI belandt. Kortom: geen controleerbaarheid, geen bescherming van gevoelige gegevens, dus geen soevereiniteit.

Wat die Nederlandse waarden precies zijn, is natuurlijk niet zomaar te beantwoorden. Wel kunnen we stellen dat gangbare wettelijke definities van veiligheid, rechtvaardigheid en duurzaamheid binnen Nederland sterk kunnen verschillen van de idealen van OpenAI, Microsoft of AWS. Dat er wellicht nieuwe wetgeving nodig zal zijn, doet er in feite niet toe. Het punt is dat Nederland en Europa een controlerende functie moeten kunnen innemen om AI-software, -data en -toepassingen te toetsen.

Infrastructuur: ook uitdagend, maar een minder groot probleem

GenAI heeft al gauw hoge systeemeisen, met lage latency als speerpunt. De Nederlandse digitale infrastructuur is al op veel fronten goed voorbereid hierop, gezien de ruime aanwezigheid van glasvezelverbindingen en uitrol van 5G. Energieverbruik is wel een pijnpunt, waardoor nieuwe datacenters niet zonder slag of stoot kunnen worden toegevoegd. Dat zal nodig zijn om AI optimaal te benutten, zeker als we Nvidia mogen geloven. Dat bedrijf geldt als de vooraanstaande facilitator van AI-workloads met krachtige GPU’s voor AI-training, -finetuning en -inferencing.

Nvidia spreekt over toekomstige “AI Factories” die overal ter wereld nodig zullen zijn. Denk hierbij aan datacenters die specifiek zijn ingericht om AI te versnellen, met een grotere focus op AI-accelerators en een modulaire opbouw waarbij hardware snel kan worden vervangen. De verwachting is namelijk dat nieuwe generaties GPU’s en andere AI-hardware reuzenstappen zullen maken op het gebied van efficiëntie en snelheid. Een soevereine infrastructuur moet meegroeien met deze versnelling om relevant te blijven.

Nvidia-CEO Jensen Huang is een groot evangelist van deze visie. Hij was recent aanwezig bij de World Governments Summit in Dubai, waarbij hij benadrukte dat elk land soevereine AI nodig heeft. Gunstig voor de chequebook van Nvidia, maar een zeker verdedigbaar standpunt. Hoe dan ook is Huang druk bezig om landen te overtuigen, inclusief bezoeken aan leiders in Canada, Frankrijk, India, Japan, Maleisië, Singapore en Vietnam. “Het is niet zo duur en ook niet zo moeilijk,” meent Huang. “Het eerste dat ik zou doen, is natuurlijk de taal codificeren. De data van jouw cultuur moet in je eigen LLM belanden.” Zelfs de topman van het voornaamste AI-hardwarebedrijf pleit dus voor een aanpak die software centraal plaatst. Het bouwen van een soevereine AI-infrastructuur zorgt ervoor dat de eigen cultuur, de eigen expertise en de eigen normen en waarden centraal staan. Daarvoor heeft Nederland alvast een solide visie voor gepresenteerd, maar nu volgt de lastige taak om dit in de praktijk te brengen.