Google heeft een nieuwe versie van Gemini Deep Research uitgebracht. Dit is een agent die complexe onderzoekstaken moet automatiseren.
De agent draait op Gemini 3 Pro. Het model kan handschriften, grafieken en wiskundige notatie verwerken. Het neemt deze visuele informatie direct mee in rapportages en zoekopdrachten. Daardoor kan het systeem niet alleen tekstuele bronnen doorzoeken, maar ook data terugvinden die eerder moeilijk te automatiseren waren, oordeelt SiliconANGLE.
De agent werkt iteratief en plant zijn onderzoeksstappen zelfstandig. Het formuleert zoekopdrachten, beoordeelt de gevonden resultaten en bepaalt waar informatie ontbreekt. Google stelt dat de webnavigatie in deze release beter in staat is om diep in sites door te dringen. Gebruikers kunnen documenten uploaden die vervolgens automatisch worden gescand op relevante passages. De agent kan deze documenten samenvatten, interpreteren of combineren met informatie uit openbare bronnen.
Interactions API als centraal toegangspunt
Deep Research is nu beschikbaar via de nieuwe Interactions API. Die API fungeert als een centraal toegangspunt voor zowel de Gemini-modellen als vooraf gebouwde agents. Google wil op termijn extra agents toevoegen en ondersteuning bieden voor maatwerkagents. De API neemt bovendien een deel van het databeheer uit handen, wat betekent dat ontwikkelaars minder tijd kwijt zijn aan het verwerken en structureren van bestanden. Ook kunnen modellen via MCP worden gekoppeld aan externe systemen.
Google meldt dat de agent beter presteert op benchmarks dan eerdere versies. Op Humanity’s Last Exam, een benchmark met meer dan 2.500 vragen waarin vooral wiskunde, fysica en programmeren centraal staan, scoorde de agent 46,4 procent.
Op DeepSearchQA, een dataset die Google heeft vrijgegeven, presteerde het systeem eveneens beter dan voorgangers. Deze benchmark bestaat uit meerstaps informatietaken die afhankelijk zijn van eerdere analyses en is ontworpen om zowel precisie als volledigheid te meten. Google gebruikt de dataset ook intern om te onderzoeken hoe extra redeneerstappen en langere verwerkingstijd de prestaties beïnvloeden.
Uit berichtgeving van SiliconANGLE blijkt dat Google Deep Research vooral wordt gepositioneerd als een hulpmiddel voor sectoren waarin veel documentanalyse en bronverzameling voorkomt. In die context moet de agent vooral repetitieve en tijdrovende taken overnemen, terwijl de Interactions API de integratie in applicaties vereenvoudigt. Met de introductie van deze versie wil Google laten zien hoe taalmodellen steeds beter overweg kunnen met onderzoekstaken die verder gaan dan traditionele zoek- of samenvattingsfuncties.