Details over Anthropics veelbelovende Mythos-model uitgelekt

Details over Anthropics veelbelovende Mythos-model uitgelekt

Anthropic heeft bevestigd dat het Claude “Mythos” aan het testen is, een nieuw AI-model dat het omschrijft als een ‘stap voorwaarts’ qua vaardigheden, nadat een datalek onbedoeld conceptdocumenten over het model blootlegde. Het lek, veroorzaakt door een configuratiefout in het CMS van Anthropic, maakte bijna 3.000 niet-gepubliceerde bestanden openbaar toegankelijk.

Anthropic was niet degene die dit nieuws naar buiten bracht. Beveiligingsonderzoekers Roy Paz van LayerX Security en Alexandre Pauwels van de Universiteit van Cambridge ontdekten de blootgestelde gegevensopslag, die een conceptblogpost bevatte waarin het model in detail werd beschreven. Fortune bekeek de documenten en bracht Anthropic donderdag op de hoogte, waarna het bedrijf de openbare toegang beperkte. Anthropic schreef het incident toe aan “menselijke fouten” bij de configuratie van zijn contentmanagementsysteem (CMS) en beschreef het blootgestelde materiaal als “vroege concepten van inhoud die in aanmerking kwam voor publicatie.”

In totaal waren bijna 3.000 ongepubliceerde bestanden die gekoppeld waren aan de blog van Anthropic openbaar doorzoekbaar in de onbeveiligde gegevensopslag. Bestanden die via het CMS worden gepubliceerd, worden standaard ingesteld op openbaar en krijgen een openbaar toegankelijke URL toegewezen, tenzij een gebruiker die instelling expliciet wijzigt.

Een nieuw niveau boven Opus

In het uitgelekte concept wordt Claude Mythos beschreven onder de productnaam “Capybara”. Dit zou een nieuw modelniveau vertegenwoordigen dat boven de huidige vlaggenschip-Opus-lijn van Anthropic staat. “Capybara is een nieuwe naam voor een nieuw modelniveau: groter en intelligenter dan onze Opus-modellen — die tot nu toe onze krachtigste waren”, aldus het concept. De twee namen lijken te verwijzen naar hetzelfde onderliggende model.

Anthropic biedt momenteel modellen aan in drie niveaus: Opus (meest capabel), Sonnet (sneller en goedkoper) en Haiku (kleinst en snelst). Capybara zou een vierde, duurdere klasse toevoegen boven deze drie. Volgens het concept scoort het “aanzienlijk hoger” dan Claude Opus 4.6 bij tests op het gebied van programmeren, academisch redeneren en cybersecurity. Opus 4.6 had pas onlangs de Terminal-Bench 2.0 aangevoerd met 65,4 procent, waarmee het GPT-5.2-Codex overtrof, zoals we eerder meldden.

Toen Anthropic hier rechtstreeks naar werd gevraagd, bevestigde het bedrijf het model: “We ontwikkelen een model voor algemeen gebruik met aanzienlijke verbeteringen op het gebied van redeneren, coderen en cyberbeveiliging. Gezien de kracht van de mogelijkheden, gaan we zorgvuldig te werk bij de release ervan. We beschouwen dit model als een grote stap voorwaarts en het meest capabele model dat we tot nu toe hebben gebouwd.”

Ongekende cyberbeveiligingsrisico’s

Cyberbeveiliging is het aspect waar Anthropic zich het meest zorgen over lijkt te maken. Dat is enigszins ironisch, gezien het feit dat details hierover zijn uitgelekt als gevolg van een verkeerde configuratie. Misschien kan Mythos ingrijpen om herhaling in de toekomst te voorkomen. Hoe dan ook, in het concept wordt het model beschreven als “momenteel ver vooruitlopend op elk ander AI-model wat betreft cybercapaciteiten” en wordt gewaarschuwd dat het “een voorbode is van een komende golf van modellen die kwetsbaarheden kunnen uitbuiten op manieren die de inspanningen van verdedigers ver overstijgen.”

Vanwege deze zorgen beperkt Anthropic de vroege toegang tot organisaties die zich richten op cyberverdediging, zodat zij de tijd krijgen om hun systemen te versterken. Het bedrijf heeft eerder te maken gehad met misbruik van de eigen modellen. Anthropic heeft eerder het misbruik van Claude voor cybercriminaliteit geblokkeerd en heeft in één gedocumenteerd geval een door de Chinese staat gesponsorde campagne ontdekt en verijdeld die al gebruik had gemaakt van Claude Code om ongeveer 30 organisaties te infiltreren. Het risicoprofiel van Mythos voegt een nieuwe dimensie toe aan die zorgen. In een eerdere beveiligingstest werd Claude binnen acht uur omgevormd tot een malwarefabriek.

De gelekte documenten bevatten ook een pdf over een aanstaande tweedaagse retraite, uitsluitend op uitnodiging, voor Europese CEO’s in een 18e-eeuws landhuis op het Engelse platteland. Dario Amodei, CEO van Anthropic, zal hieraan deelnemen. Een woordvoerder omschreef het als “onderdeel van een doorlopende reeks evenementen die we het afgelopen jaar hebben georganiseerd.”