Anthropic start instituut voor AI-risico’s

Anthropic start instituut voor AI-risico’s

Anthropic kondigt de oprichting aan van het Anthropic Institute. Dit is een nieuwe onderzoeksorganisatie die zich richt op de maatschappelijke gevolgen en risico’s van steeds krachtigere AI-systemen.

Met het initiatief wil het bedrijf inzichten delen over de impact van geavanceerde AI en samenwerken met onderzoekers, beleidsmakers en andere partijen om mogelijke risico’s beter te begrijpen.

Het nieuwe instituut brengt drie bestaande onderzoeksteams van Anthropic samen. Het komt onder leiding van medeoprichter Jack Clark te staan. Tegelijk krijgt Clark binnen het bedrijf een nieuwe rol als hoofd publieke belangen. Volgens Anthropic moet het instituut een centrale plek worden waar onderzoek naar de economische, maatschappelijke en veiligheidsaspecten van AI wordt samengebracht.

Een van de teams die onderdeel wordt van het instituut is het Frontier Red Team. Deze groep onderzoekt de veiligheidsrisico’s van AI-systemen, onder meer op het gebied van cybersecurity. In een recent project gebruikte het team het Claude-model om de broncode van Firefox te analyseren op kwetsbaarheden. Daarna werd getest of de AI zelfstandig methoden kon ontwikkelen om dergelijke kwetsbaarheden te misbruiken.

Ook het Societal Impacts-team wordt onderdeel van het instituut. Deze groep analyseert hoe gebruikers AI-systemen in de praktijk inzetten. Onlangs publiceerde het team onderzoek naar situaties waarin werknemers ervoor kiezen AI-agenten volledig autonoom taken te laten uitvoeren, zonder directe menselijke controle.

Het derde team binnen het nieuwe instituut is Economic Research. Dit team onderzoekt de economische impact van AI en publiceert onder meer de Economic Index van Anthropic. In dat rapport wordt geanalyseerd welke bedrijfsactiviteiten klanten automatiseren met behulp van Claude en hoe AI wordt toegepast in verschillende sectoren.

Anthropic trekt prominente onderzoekers aan

Naast het samenbrengen van de drie teams wil Anthropic het instituut verder uitbreiden met nieuwe onderzoekers. Daarbij zijn al enkele prominente namen aangetrokken. Matt Botvinick, eerder onderzoeksdirecteur bij Google DeepMind en professor aan Princeton, gaat leidinggeven aan onderzoek naar de relatie tussen AI en de rechtsstaat. Econoom Anton Korinek, afkomstig van de University of Virginia, gaat zich richten op onderzoek naar hoe transformerende AI de aard van economische activiteit kan veranderen. Zoë Hitzig, die eerder bij OpenAI werkte aan onderzoek naar de sociale en economische impact van AI, zal helpen om economisch onderzoek nauwer te verbinden met de ontwikkeling en training van AI-modellen.

Volgens Anthropic werkt het instituut daarnaast aan projecten die proberen toekomstige AI-ontwikkelingen beter te voorspellen. Ook wordt onderzocht hoe geavanceerde AI-systemen in de toekomst kunnen interageren met juridische systemen.

Parallel aan de lancering van het Anthropic Institute breidt Anthropic ook zijn public policy-organisatie uit. Dit team houdt zich bezig met beleidsthema’s rond AI, waaronder modelveiligheid, transparantie, infrastructuurinvesteringen en exportregels.

De beleidsafdeling komt onder leiding van Sarah Heck, die eerder bij Stripe verantwoordelijk was voor ondernemerschapsbeleid en daarvoor betrokken was bij economisch en diplomatiek beleid binnen de Amerikaanse National Security Council. Het bedrijf wil dit voorjaar een eerste kantoor openen in Washington D.C. om zijn beleidswerk dichter bij Amerikaanse besluitvormers te positioneren. Daarna wil Anthropic zijn beleidsactiviteiten ook internationaal verder uitbreiden.