De paniekzaaierij van Anthropic over AI is niet wat het lijkt

"Recursieve AI" blijft puur speculatief

De paniekzaaierij van Anthropic over AI is niet wat het lijkt

Hoewel het ogenschijnlijk goed bedoeld is, herhaalt Anthropic met zijn oproep tot een pauze in de ontwikkeling van frontier AI-modellen een gebrekkige logica waarvan we dachten dat we die achter ons hadden gelaten. Bovendien presenteert het AI-bedrijf zwakke argumenten om te suggereren dat AI binnenkort zichzelf zou kunnen verbeteren. Meer dan ooit lijkt de menselijke factor (en de daarmee gepaard gaande menselijke angsten) dominant te zijn.

In zijn blog met de onheilspellende titel “When AI builds itself” benadrukt Anthropic hoe de eerste op LLM gebaseerde chatbots door menselijke onderzoekers werden gemaakt, waarna autonoom werk hen in toenemende mate is gaan ondersteunen. De toekomst voorbij autonome agents (in wezen LLM-systemen of, nou ja, een stel AI-modellen die aangestuurd worden door andere tools en AI-modellen) is er een van “de cirkel rond maken”. “In de toekomst zouden agents in staat kunnen zijn om zelf modellen te bouwen en te trainen.” Het woord “zouden” is hier van cruciaal belang, en we kunnen de spanning tot in Silicon Valley voelen.

De belangrijkste AI-verbeteringen zijn door mensen gemaakt

De schrijvers van het stuk, Marina Favaro, hoofd van het Anthropic Institute, en Jack Clark, medeoprichter van Anthropic, geven toe dat ze vooral vragen opwerpen in plaats van ze te beantwoorden. Desondanks wijst het artikel op aanwijzingen voor iets, maar het is niet meer dan anekdotisch. Een voorbeeld hiervan is de 8-voudige toename van de hoeveelheid code die per kwartaal per persoon bij het AI-bedrijf is bijgedragen sinds begin 2025. Hoewel dit “vrijwel zeker een overdrijving is van de werkelijke productiviteitswinst”, is de enorme stijging in bijdragen volgens de auteurs ook “een versnelling”.

We willen de punten in het artikel niet één voor één betwisten, maar dit voorbeeld illustreert hoe de vragen die in het artikel worden gesteld niet meer zijn dan losse datapunten die op geen enkele manier correleren met een zichzelf verbeterende AI, de toekomst waar we zogenaamd naartoe gaan, mogelijk, ooit, in het jaar 20XX? zoals in het stuk staat geschreven.

Het belangrijke element om hier op te merken is dat er op geen enkele manier een lijn loopt van AI-chatbots naar zelfverbeterende AI. In plaats daarvan heeft bewijs aangetoond dat menselijk werk (waaronder dat van Anthropic zelf) de effectieve use cases voor LLM’s heeft verbeterd. We merken wel op dat nieuwe AI-modellen inderdaad een drastisch verbeterde nauwkeurigheid en consistentie en daarmee hogere kwaliteit van de output hebben laten zien. Mythos zou daarnaast een doorbraak kunnen betekenen voor de toepasbaarheid van LLM’s voor security. Het zou wel eens beter kunnen presteren dan welke menselijke beveiligingsonderzoeker dan ook. Niettemin, zoals Anthropic bevestigt, kent AI-ontwikkeling zelden “eureka”-momenten. Wat het bedrijf echter niet duidelijk maakt, is dat dergelijke momenten zich rondom AI-ontwikkeling voortdurend hebben voorgedaan.

RAG, het Model Context Protocol (een uitvinding van Anthropic(!)), agent-harnesses en inference-time compute (d.w.z. ‘redeneren’ voor modellen) zijn allemaal menselijke creaties bovenop AI. Deze hebben opmerkelijke sprongen voorwaarts laten zien voor AI-toepassingen en hebben robuustheid toegevoegd aan de fundamenteel probabilistische aard van Transformers. Deze infrastructuur rond AI-modellen lijkt te blijven zorgen voor door mensen geleide verbeteringen. Toegegeven, automatisering helpt dit proces weliswaar op weg, maar zelfs met de zogenaamd verbeterde suggesties voor volgende stappen en de daarmee gepaard gaande grotere vrijheid van de agents, is er hier geen sprake van daadwerkelijke zelfverbetering.

Voeg het toe aan de “niet-doen”-lijst

Spontane zelfverbetering van AI zal waarschijnlijk niet binnen bedrijfsomgevingen zelf plaatsvinden. Men mag verwachten dat dit gebeurt binnen een (hopelijk gecontroleerde) omgeving van een van de AI-labs, met Anthropic als kanshebber. “Het bewijs suggereert dat de rol van de mens bij elke stap in het AI-ontwikkelingsproces kleiner wordt”, stelt het artikel. Rekenkosten lijken de enige beperking te zijn voor modelsuggesties die consequent beter presteren dan menselijke codevoorbeelden.

Wat Anthropic beschrijft, is in feite de implementatie van AI zoals die nu is. Als samenleving en als wereldeconomie leren we wat de ethische, economische en praktische grenzen zijn van AI-toepassingen, terwijl we de technologie tot nu toe nauwelijks hebben vertrouwd om ook maar iets te doen. Angst voor algemene algoritmen in het dagelijks leven is over het algemeen een wantrouwen tegen het gebruik van een technologie, niet tegen de fundamenten van de technologie zelf. Iemand die wordt ontslagen door een managementteam dat denkt dat het banen kan vervangen door AI, wordt niet “door AI” ontslagen. De alternatieve visie is dat mensen wijdverbreide, gesubsidieerde toegang hebben gekregen tot AI-API-calls en nog niet hebben begrepen wat ze in handen hebben.

Nog een opmerking over de veronderstelde zelfverbetering die Anthropic benadrukt. Er is geen discussie of uitleg over het gedrag dat Claude vertoont en dat men zou kunnen omschrijven als zelfleren. Dit is enigszins verrassend. De enige aanwijzing hiervoor is dat Claude blijkbaar beter wordt in het voorstellen van volgende stappen, een ontwikkeling die evenzeer kan worden toegeschreven aan een steeds groeiende “niet-te-doen”-lijst als aan echte zelfreflectie.

2026 is 2023 deel 2

De volstrekt onhoudbare suggestie van Anthropic is om “de mogelijkheid te hebben om de ontwikkeling van grensverleggende AI te vertragen of tijdelijk te pauzeren”. We noemen dit onhoudbaar omdat geen enkel AI-lab volledig kan worden verhinderd om nieuwe LLM’s te ontwikkelen. DeepSeek zou een gecentraliseerd verzoek uit Washington gemakkelijk kunnen negeren, Anthropic zelf staat niet bepaald in de gunst van de VS, en Google en OpenAI werken al met een verhoogd niveau van geheimhouding rond nieuwe modellen. Hoe dan ook, het Anthropic Institute zal proberen ons hier ongelijk te bewijzen.

Al met al lijkt het erop dat Anthropic terugvalt op de gebrekkige en uiteindelijk mislukte campagne van diverse tech-leiders uit 2023, die een open brief ondertekenden om de ontwikkeling van AI te pauzeren voorbij wat toen de grens was: GPT-4. Bovendien suggereerde OpenAI-CEO Sam Altman destijds dat geavanceerde AI misbruikt zou kunnen worden. Hij verwoordde die angst op allerlei manieren, waaronder een voortdurende verwijzing naar “Artificiële Algemene Intelligentie” (AGI), terwijl hij pleitte tegen wettelijke beperkingen – zoals hij nog steeds doet. Als de door Anthropic en OpenAI geuite angsten gegrond zijn, dan versnellen ze ons actief in de richting van deze gevaren. Als dat niet het geval is, dienen ze vooral om de mogelijkheden van de technologie in de ogen van de wereld – en de publieke investeerders die binnenkort een kans krijgen bij de AI-bedrijven die op het punt staan naar de beurs te gaan – onder de aandacht te brengen.

Conclusie: een gebrek aan bewijs

Er is geen bewijs naar voren gekomen dat op Transformer gebaseerde AI-modellen zichzelf herhalen. Toch kan niemand uitsluiten dat schaalwetten zodanig van toepassing zijn dat een bepaald aantal parameters in combinatie met een voldoende grote dataset ons zelfverbeterende AI oplevert. Maar goed, er zijn veel dingen die we niet met zekerheid kunnen uitsluiten. Daarom wachten we op bewijs of duidelijke tekenen van een ontwikkeling.

Het volwassen wordende ecosysteem rond AI voegt steeds meer complexiteit, robuustheid, toepasbaarheid en algemene verbeteringen toe aan de kale LLM’s. Hoe dat op de lange termijn zal leiden tot economische winnaars in de AI-race, weten we nog niet. Wat wel duidelijk is, is dat Anthropic er alle belang bij heeft om zijn LLM’s tot het middelpunt van dat ecosysteem te maken, net zoals SaaS-leveranciers de controle- of implementatielaag centraal willen stellen en systeemintegrators enterprise-ready oplossingen willen bedenken bovenop commoditisering van technologieën.

Anthropic heeft tal van motieven voor zijn retoriek. Het bedrijf streeft er actief naar om het AI-beleid en -bestuur zodanig te sturen dat het zijn eigen explosief stijgende kosten onder controle kan houden, terwijl de toetredingsdrempel voor grensverleggende AI-ontwikkeling hoog blijft. OpenAI heeft rond de tijd dat GPT-4 op de markt kwam iets soortgelijks geprobeerd. De vorige keer bleek uit de praktijk dat de implementatie van AI door mensen een veel grotere uitdaging is dan de technologie zelf.

Lees ook: Anthropic brengt Claude Opus 4.8 uit en belooft een eerlijker model