Deze maand pakte Anthropic al uit met de Opus- en Sonnet-versies van Claude 4.6. Het versloeg Google’s Gemini 3 Pro op meerdere fronten. Een reactie heeft kort op zich laten wachten, met het nieuwe, sterker redenerende Gemini 3.1 Pro.
Google rolt vanaf vandaag 3.1 Pro uit. Het zal in de Gemini-app verschijnen, NotebookLM voor betalende gebruikers en in preview via de Gemini API. Hoewel Google spreekt over een update van 3 Pro, zijn de verbeteringen aanzienlijk. In een vroeger stadium van GenAI zou dit een volledig nieuw nummer hebben gekregen, met aanzienlijk sterker redeneervermogen. Dat blijkt uit de benchmark ARC-AGI-2, waarin 3 Pro een score van 31,1 procent haalt en 3.1 Pro dat in tweevoud overtreft: 77,1 procent.
Bijna altijd beter
De release van Llama 4-model in april vorig jaar liet het al zien: benchmarks zeggen niet alles. Destijds leek Meta competitief met Google, OpenAI en Anthropic, maar daadwerkelijke gebruikers waren regelmatig teleurgesteld. Vanuit Google hebben we nog niet een dergelijk contrast tussen theorie en praktijk gezien. Daarom lijken de scores van 3.1 Pro, veelal een stukje beter dan die van 3 Pro, een betekenisvolle upgrade op meerdere fronten te kenmerken. Opvallend is dat multimodaal begrip en redeneren, getest via MMMU Pro, lager uitvalt dan voorheen: 80,5 procent om 81,0 procent. Van deze test waren de antwoorden geheim gehouden tot een week geleden. Het is de enige winst van 3 Pro ten opzichte van 3.1 Pro, dus al te veelzeggend is het resultaat vermoedelijk niet.
Consistenter is de uitdaging van Claude, waarbij Opus 4.6 praktisch even goed codeert als 3.1 Pro. Het SWE-Bench Verified voor agentic coding is namelijk 80,6 procent voor 3.1 Pro en 80,8 procent voor Opus 4.6. Het gebruiken van tools gaat dit Claude-model tevens eenvoudiger af dan het nieuwste Gemini-model, terwijl experttaken door Sonnet 4.6 het best worden uitgevoerd. De boodschap is helder: verwacht niet dat Anthropic zich al te veel zorgen maakt over Google’s nieuwste model, ook al is Gemini 3.1 Pro een veel beter agentic model dan haar voorganger.
Multimodaal en praktisch inzetbaar
De verbeterde intelligentie van 3.1 Pro moet zich vertalen naar praktische toepassingen. Google noemt voorbeelden als visuele uitleg van complexe onderwerpen, het samenvoegen van data tot een overzicht, of het tot leven brengen van creatieve projecten. Een concrete feature is code-based animatie: 3.1 Pro genereert animated SVG’s direct vanuit een tekstprompt. Die blijven helder op elke schaal en kennen kleinere bestandsgroottes dan traditionele video. Wie de resultaten bekijkt, ziet (al is het subjectief) duidelijk een verbetering.

Sinds de release van Gemini 3 Pro in november heeft feedback van gebruikers geleid tot deze snelle verbeteringen. Google rolt 3.1 Pro nu uit in preview om updates te valideren. Het bedrijf wil verder doorontwikkelen op het gebied van agentic workflows voordat het model algemeen beschikbaar komt. Normaliter veranderen de benchmarks in de aankondigingen niet, maar het wordt interessant om te zien of het toolgebruik verbetert bij de werkelijke release.
Uitrol en toegang
Vanaf vandaag is Gemini 3.1 Pro dus beschikbaar voor verschillende doelgroepen. Ontwikkelaars krijgen preview-toegang via de Gemini API in Google AI Studio, Gemini CLI, Google Antigravity en Android Studio. Bedrijven kunnen het model gebruiken via Vertex AI en Gemini Enterprise. Voor consumenten rolt het uit in de Gemini-app en NotebookLM. Gebruikers van Google AI Pro en Ultra-plannen krijgen hogere limieten voor 3.1 Pro in de Gemini-app. NotebookLM krijgt toegang exclusief voor Pro en Ultra-gebruikers. De brede uitrol volgt de koers die Google eind 2024 inzette met de Gemini 3-serie. Het bedrijf ziet feedback als een belangrijk middel om snelle iteraties op zijn AI-modellen mogelijk te maken.