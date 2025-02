AI-modelbouwer Anthropic onderzocht miljoenen gesprekken met de eigen chatbot Claude. Programmeurs blijken verreweg de meest fervente AI-gebruikers, terwijl werknemers met de laagste én de hoogste salarissen juist wegblijven.

Dit wijst Anthropic’s kersverse Economic Index uit, waarvan het de dataset open-source beschikbaar stelt voor anderen. Het is de eerste keer dat een AI-bedrijf open en bloot verkondigt wat hun gebruikers precies doen met hun chatbot. Voorheen konden we alleen kijken naar benchmarks voor bepaalde werktaken om te zien waar Claude, ChatGPT en Gemini voor bedoeld zijn, maar wisten we niet of alle genoemde vaardigheden werkelijk werden benut.

De dataset van deze Economic Index bestaat uit meer dan vier miljoen Claude-gesprekken die plaatsvonden in december 2024 en januari 2025. Een systeem genaamd Clio sloeg alle informatie op in geanonimiseerde vorm. Contact met de Claude API werd niet meegenomen in het onderzoek, waardoor veel zakelijk gebruik buiten de boot valt.

(Programmeer-)hulpje

De Index vergelijkt het AI-gebruik van verschillende beroepsvelden met het percentage werknemers dat in die respectievelijke velden actief is (in de VS). Of, anders gezegd: het laat zien of een bepaald beroep onevenredig vaak de Claude-chatbot raadpleegt of juist niet. Het opdelen in beroepen is gebaseerd op de teksten van outputs, niet door gebruikers aan hun beroep te koppelen. Omdat Anthropic de data op anonieme basis heeft onderzocht, men weet niet in welk werkveld iemand actief is. Het bedrijf volgt wel de O*NET-database om de werkvelden in kwestie te bepalen. Deze database brengt beroepen in kaart op basis van de individuele taken waaruit ze bestaan. O*NET biedt dit voornamelijk aan om werkzoekenden te koppelen aan banen met vaardigheden die ze al bezitten.

37,2 procent van alle Claude-gesprekken gaat over computer- en wiskundige taken. Dat is een enorme uitschieter: slechts 3,4 procent van de Amerikaanse beroepsbevolking werkt in velden waarin die specialisatie centraal staat. Oftewel: onder meer programmeurs, software engineers en wiskundigen. Niet geheel verrassend blijven praktische banen ver weg van GenAI: vrachtwagenchauffeurs, vissers, boeren en installateurs praten bijna nooit over hun werk met Claude.

Een andere belangrijke vondst van Anthropic is dat 57 procent van alle Claude-gebruikers de chatbot duidelijk voor hulp inschakelt (augmentatie), niet om een bepaalde taak volledig te automatiseren. Zelfs de resterende 43 procent moet met een korrel zout geïnterpreteerd worden. In die gevallen produceert Claude bijvoorbeeld zelfstandig tientallen lijnen aan code of een gehele lap tekst, maar het zal vaak voorkomen dat gebruikers het niet hierbij laten. Anthropic ziet flinke aanpassingen van de AI-output achteraf als augmentatie, maar kan dat niet meten.

Hulp versus automatisering

Augmentatie en automatisering worden nog verder onderverdeeld door Anthropic. Iteratie van taken (31,3 procent) en educatieve doeleinden (23,3 procent) behoren verreweg tot de meest voorkomende vormen van augmentatie. Wie Claude autonoom laat werken, geeft het vooral wat Anthropic een ‘richtlijn’ noemt (27,8 procent). Voorbeelden hiervan zijn, zoals de schrijvers van het paper uitleggen, het schrijven van een e-mail of een geometrische berekening. Feedback loops (14,8 procent) komen regelmatig voor, waarbij programmeurs bijvoorbeeld sleutelen aan een stukje code met meerdere opeenvolgende in- en outputs.

Anthropic omschrijft de eigen Economic Index als de duidelijkste weerspiegeling van werkelijk AI-gebruik tot nu toe. Daar valt wat voor te zeggen. Partijen als Cognizant en Capgemini hebben vooral gekeken naar de toekomstige impact van AI op werk. Ze benadrukken de potentie en een dreigend ‘hockeystick-moment’ wanneer AI dermate effectief wordt dat het volledige beroepen vervangt. Organisaties moeten daarop voorbereid zijn, benadrukken zij.

Als we het bij het hier en nu houden, zien we een voorzichtige introductie van AI. Vanuit een helikopterperspectief weten we al enigszins hoe verschillende beroepen omgaan met ChatGPT en zijn AI-soortgenoten Gemini, Claude en DeepSeek. In combinatie met de Anthropic Economic Index kunnen we al wat duidelijker zien hoe deze AI-tools het werkend leven aan het vormen is.

Dat wijst op AI als een assistent en geen banenschrapper, wat overigens al de karakterisering ervan was van Cognizant-CEO Ravi Kumar S vorig jaar tegenover Techzine. Sterker nog: AI zou juist banen creëren omdat het taken wegneemt die je eigenlijk niet meer wilt doen.

Maar… een beetje nuance

Hoe blij we ook zijn met Anthropic’s transparantie, moeten we met een paar zaken rekening houden. Alles wijst erop dat het gros van de AI-gebruikers elders zit dan bij Claude. ChatGPT is in de volksmond hetzelfde voor AI-chatbots als wat ‘googlen’ voor zoekmachines werd. En terwijl Claude nooit de populairste AI-app werd, waren ChatGPT en het Chinese DeepSeek dat wel (en Mistral in bepaalde landen recent ook).

Dit is belangrijk, want Claude bevindt zich in een niche. Werp een blik op online discussies en je komt Anthropic’s chatbot bijzonder vaak tegen onder programmeurs. Claude zou, zo meent men, codeerkwesties als een ‘echte expert‘ benaderen. Dit ondanks het feit dat benchmarks regelmatig andere AI-tools als betere codeerhulpjes aanwijzen. Of het nu Claude’s temperament of stijl is, het bevalt goed onder software-ontwikkelaars in het bijzonder.

Dit duwt de Anthropic Economic Index in een duidelijke richting. Dat is al bovenop het feit dat de API buiten beschouwing is gebleven, dat juist werkgerelateerde implementaties zal dekken. Hoe vertekenend dit beeld is, blijft onduidelijk. We zouden eigenlijk dezelfde cijfers moeten zien bij GitHub Copilot, ChatGPT, Microsoft’s Copilot-pakket, AI-tools in Google’s suite, enzovoort, en zo verder. Dat gaat niet gebeuren. Het enige dat we kunnen concluderen is dat Claude vooral wordt ingezet als AI-programmeerhulp en zeker niet als AI-agent om alle banen over te nemen.

Lees ook: Google frist Gemini op: 2.0 heeft troef tegen OpenAI en DeepSeek