Anthropic zit met een groot probleem. Verreweg hun krachtigste AI-model, Fable 5, mag alleen voor Amerikaanse gebruikers toegankelijk zijn, maar de maker van Claude koos ervoor om de LLM volledig terug te trekken. Weken later volgt Claude Sonnet 5, een op het oog ietwat anticlimactische release.
Benchmarks vanuit een AI-modelbouwer zetten veelal de toon. Later blijkt uit onafhankelijke tests hoe goed een nieuwe LLM werkelijk is. Dit geldt ook voor Claude Sonnet 5, dat op moment van schrijven een paar uur beschikbaar is. Sonnet 5 en Opus 4.8, een groter en duurder model, ontlopen elkaar nauwelijks op de benchmarks. Zowel coderen als redeneren en ook computergebruik en kenniswerk kan de een ongeveer zo goed als de ander. Anthropic benadrukt de agentic aard van het nieuwste model, dat beter dan ooit is.
Let vooral niet op security
Jarenlang heeft Anthropic de gewoonte opgebouwd om enige fear, uncertainty and doubt te genereren omtrent nieuwe modelreleases. Niets is minder waar deze keer: Sonnet 5 moet juist ongevaarlijk en banaal overkomen. De Amerikaanse overheid verbood het gebruik van Fable 5 en Mythos 5 voor niet-Amerikanen wegens een vermeende dreiging voor de nationale veiligheid. Een “cybersuperwapen”, zo omschreef Anthropic-CEO Dario Amodei de karakterisering die hij van vroege gebruikers van Mythos Preview meekreeg. Na talloze modellen die zonder al te veel argusogen op de markt kwamen, is die onbegrensde cadans onderbroken.
Met Sonnet 5 heeft Anthropic ogenschijnlijk weinig te vrezen. Ook al is er sprake van extra securityguardrails, meer dan bij voorganger Sonnet 4.6, deze stappen komen slechts overeen met de bescherming die Anthropic bood voor het gebruik van Opus 4.7 en 4.8.
Om terug te komen op de beperkignen: ook OpenAI voelt de gevolgen ervan, met een beperkte uitrol van GPT-5.6 in haar drie manifestaties. GPT-5.6 Sol Ultra is te zien als een soort Fable (en scoort op OpenAI’s eigen benchmarks hoger dan Mythos/Fable), Sol zelf is een soort Opus, Terra een mogelijke concurrent voor de Sonnet-reeks en Luna een compact model à la Gemini 3.5 Flash of Claude Haiku.
Net niet Opus en net niet aantrekkelijk genoeg?
Sonnet 5 dicht volgens Anthropic dus het gat met het krachtigere Opus 4.8, maar tegen een lagere prijs. Volgens Anthropic is het een flinke verbetering ten opzichte van voorganger Sonnet 4.6 op vlakken als complexe redeneringen, het gebruik van tools, coderen en kenniswerk. Het is vanaf vandaag het standaardmodel voor Free- en Pro-gebruikers en beschikbaar voor Max-, Team- en Enterprise-klanten, plus in Claude Code en op het Claude Platform. Met een pop-up gericht op alledaags AI-gebruik zoals het plannen van een vakantie lijkt Anthropic tegelijk met deze release ook een Gemini- of ChatGPT-achtige insteek te zoeken.
De prijsstelling, toch meer een zaak voor de professionele gebruikers die zich veelal richten op coderen, valt op. Tot en met 31 augustus rekent Anthropic een introductietarief van 2 dollar per miljoen input-tokens en 10 dollar per miljoen output-tokens. Daarna gaat dat naar 3 en 15 dollar. Ter vergelijking: Opus 4.8 kost 5 en 25 dollar per miljoen tokens. Tussen beide modellen kunnen gebruikers het effort-niveau aanpassen om kosten en prestaties te balanceren.
Dat zegt natuurlijk niet alles. Denk aan GLM-5.2 van het Chinese Z.ai, een open-source model dat op basis van de cijfers van het gerenommeerde Artificial Analysis op het niveau van enkele recente Claude Opus-modellen opereert. Deze is echter vijf keer goedkoper per token… maar verbruikt veel meer tokens per output dan Opus dat normaliter doet. Sonnet 5 kan wat dat betreft een interessante concurrent blijken via de API.
Veiliger in agentic context
Anthropic stelt dat Sonnet 5 minder ongewenst gedrag vertoont dan Sonnet 4.6 en beter bestand is tegen prompt injection-aanvallen. Ook hallucineert het model minder. Toch laat het op de interne audit een hoger percentage ‘misaligned’ gedrag zien dan het capabelere Opus 4.8 en Mythos Preview.
Op cybersecurity-taken presteert Sonnet 5 juist bewust zwak. Het is in zekere zin best komisch om te zien dat Anthropic dit onderwerp benadrukt: verwacht weinig van dit gloednieuwe model op dit specifieke gebied. In een samen met Mozilla ontwikkelde test om exploits te schrijven voor Firefox-kwetsbaarheden slaagde het model er nooit in een werkende exploit te bouwen. Daarbij heeft Anthropic cyber-safeguards standaard ingeschakeld, dezelfde als bij Opus 4.7 en 4.8.
Die voorzichtigheid komt natuurlijk niet uit de lucht vallen. Fable 5 en Mythos 5 zijn sinds medio juni geblokkeerd en hebben nog geen teken vertoond van een terugkeer. Inmiddels is het beleid wel verschoven naar gecontroleerde toegang voor Mythos 5 in het bijzonder, waarbij de Amerikaanse overheid bepaalt welke organisaties de zwaarste modellen mogen gebruiken.
Aangepaste tokenizer
De op papier zwakke prestaties van Sonnet 5 ten opzichte van Fable 5 en Opus 4.8 zijn te verwachten met dit kleinere formaat LLM. Desondanks hebben Sonnet-modellen een goede reputatie opgebouwd waarbij gebruikers eenvoudiger binnen hun vijfuurlijkse en wekelijkse token-budgetten blijven binnen hun abonnement. Nu lijkt de stap vooruit bovenal architectureel te zijn.
Sonnet 5 gebruikt namelijk een nieuwe tokenizer die tekst anders verwerkt. Daardoor kan dezelfde input meer tokens opleveren, ongeveer 1,0 tot 1,35 keer afhankelijk van het type content. Anthropic stelt dat de introductieprijs zo is gekozen dat de overstap grofweg kostenneutraal verloopt. Ook zijn de rate limits verhoogd in Chat, Cowork, Claude Code en het Claude Platform. Ontwikkelaars kunnen het model via de Claude API aanspreken als claude-sonnet-5.