Claude Opus 4.7 is geen Mythos, en dat is maar goed ook

Claude Opus 4.7 is geen Mythos, en dat is maar goed ook

Anthropic heeft Claude Opus 4.7 uitgebracht. Het is een drop-in upgrade van Opus 4.6 met verbeteringen op het gebied van software-engineering, visie en agentic taken. De prijs blijft 5 dollar per miljoen input tokens en 25 dollar per miljoen output tokens. Dit is echter niet het veelbesproken Mythos-model, aangezien Anthropic het te riskant vindt om die LLM volledig vrij te geven.

Anthropic omschrijft Claude Opus 4.7 als een aanzienlijke verbetering ten opzichte van Opus 4.6. Het zou bijzonder goed moeten presteren voor geavanceerde software engineering. Het bedrijf zegt dat vroege gebruikers nu met vertrouwen hun moeilijkste codeertaken aan het model toevertrouwen, iets wat voorheen nauwlettend toezicht vereiste. Niet alleen dat, het leek recentelijk juist een zwakke plek in het pantser van Anthropic te zijn.

Nog maar enkele dagen geleden hadden ontwikkelaars zich uitgesproken over inconsistenties in Opus 4.6 en Claude Code, waarbij sommigen melding maakten van betrouwbaarheidsproblemen bij complexe engineering-taken. Opus 4.7 is het antwoord van Anthropic op die feedback en moet verbetering brengen.

Het is echter niet bedoeld als de volledig uitgebrachte versie van Mythos, de LLM die volgens Anthropic te gevaarlijk is om vrij te geven. De reden is vrij eenvoudig, en indien waar onheilspellend: het kan kwetsbaarheden zo snel detecteren dat voorheen onbenutte zwakke plekken in software na decennia van vergetelheid de kop op kunnen steken en het internet ten val kunnen brengen. Dat is in ieder geval wat Anthropic en enkele vroege testers hebben gesuggereerd.

Scherper zicht en betere instructie-uitvoering

Naast codering biedt de daadwerkelijk uitgebrachte Opus 4.7 een drievoudige verbetering in beeldresolutie. Het verwerkt afbeeldingen tot 2.576 pixels aan de lange zijde (~3,75 megapixels). Dit maakt het mogelijk voor agents die computers aansturen om gedetailleerde screenshots te lezen, zegt Anthropic, evenals het extraheren van data uit complexe diagrammen en accurate visuele referenties.

Het is noemenswaardig dat het verbeterde opvolgen van instructies onverwachte resultaten kan opleveren voor prompts die voor eerdere modellen zijn geschreven. Waar eerdere modellen instructies losjes interpreteerden of delen oversloegen, neemt Opus 4.7 ze letterlijk. Anthropic raadt aan om prompts en AI-harnesses aan te passen waar nodig. Eerlijk gezegd is dit altijd een aanbeveling bij het wisselen van modellen.

Cyberbeveiligingsmaatregelen en de Mythos-context

Opus 4.7 is het eerste model dat wordt geleverd met nieuwe security maatregelen uit Project Glasswing. Anthropic verklaarde vorige week dat het zijn Claude Mythos Preview beperkt zou houden vanwege de ongekende cybercapaciteiten ervan, en nieuwe beveiligingsmaatregelen eerst zou testen op minder krachtige modellen. Opus 4.7 is dat testplatform, of in ieder geval het eerste van dergelijke modellen.

De cybercapaciteiten zijn bewust onder het Mythos-niveau gehouden en het model detecteert en blokkeert automatisch verzoeken voor verboden of risicovolle cybertoepassingen. De Nederlandse overheid had haar bezorgdheid geuit over de risico’s van het Mythos-model en de gefaseerde uitrol van Anthropic is een erkenning van dit soort kritische blikken. Security professionals kunnen zich aanmelden voor het nieuwe Cyber Verification Program om Opus 4.7 te gebruiken voor legitieme doeleinden, zoals pentesten en red-teaming.

Nieuwe ontwikkelaarstools en migratie-opmerkingen

Naast het model levert Anthropic verschillende updates voor ontwikkelaars. Een nieuw inspanningsniveau ‘xhigh’ bevindt zich tussen ‘high’ en ‘max’ en biedt meer controle over de afweging tussen redenering en latency. In Claude Code is het standaard inspanningsniveau voor alle abonnementen verhoogd naar ‘xhigh’. Taakbudgetten gaan in openbare bèta op de API, wat ontwikkelaars helpt bij het beheren van tokenuitgaven over langere periodes. Het nieuwe /ultrareview-commando in Claude Code markeert bugs en ontwerpproblemen; Pro- en Max-gebruikers krijgen om te beginnen drie gratis “ultrareviews”.

Developers die migreren vanuit Opus 4.6 moeten rekening houden met twee wijzigingen die van invloed zijn op het tokengebruik: een bijgewerkte tokenizer die dezelfde invoer kan toewijzen aan ongeveer 1,0–1,35x meer tokens, en een toename van het aantal output tokens bij hogere inspanningsniveaus voor agentic taken. Anthropic heeft een migratiegids gepubliceerd met verder advies.