Google maakt doorbraak in efficiëntie voor AI-agents

Google maakt doorbraak in efficiëntie voor AI-agents

Google-onderzoekers hebben samen met de University of California, Santa Barbara een nieuw framework ontwikkeld dat AI-agents helpt om efficiënter om te gaan met rekenkracht en toolgebruik. 

Dat blijkt uit een recente paper op arXiv, waarover VentureBeat schrijft. Het onderzoek richt zich op een groeiend probleem bij agentic AI: hoe schaal je het gebruik van externe tools zonder dat kosten en latency onbeheersbaar worden.

Test-time scaling verschuift bij AI-agents steeds meer van langer nadenken naar het beheersen van tool-calls. In veel praktische toepassingen, zoals websearch en documentanalyse, bepaalt het aantal externe acties hoe diep een agent kan graven. Elke tool-call vergroot het contextvenster, verhoogt het tokenverbruik en brengt extra API-kosten met zich mee. Voor bedrijven kan dat snel oplopen.

De onderzoekers constateren dat meer budget toekennen aan een agent lang niet altijd leidt tot betere prestaties. Volgens de auteurs missen veel agents elk besef van hun beschikbare middelen. Ze volgen één spoor te lang, besteden tientallen tool-calls aan een ogenschijnlijk relevante richting en ontdekken pas laat dat het een doodlopende weg is. Het gevolg is dat extra rekenbudget wordt verbruikt zonder noemenswaardige kwaliteitswinst.

Als eerste stap introduceren de onderzoekers Budget Tracker, een eenvoudige module die de agent continu informeert over het resterende budget. Deze aanpak werkt volledig op promptniveau en is geen hertraining nodig. De agent krijgt expliciete signalen over resourcegebruik en kan zijn strategie hierop aanpassen. In Google’s implementatie bevat de tracker ook richtlijnen die aangeven welk gedrag past bij verschillende budgetniveaus.

Experimenten met zoekagents die werken volgens een ReAct-achtige methode laten zien dat deze aanpak effect heeft. Uit de paper blijkt dat Budget Tracker het aantal search calls met ruim 40 procent en browse calls met bijna 20 procent kan verminderen, terwijl de totale kosten met meer dan 30 procent dalen. Tegelijkertijd blijft de prestatie verbeteren bij hogere budgetten, waar traditionele agents juist vastlopen.

Verificatie en budgetbewustzijn in één iteratief proces

Naast deze lichtgewicht oplossing beschrijft de paper een uitgebreider framework genaamd Budget Aware Test-time Scaling, of BATS. BATS combineert planning, verificatie en budgetbewustzijn in één iteratief proces. De agent past zijn gedrag dynamisch aan op basis van het resterende budget en beslist of hij verder onderzoek doet of juist van koers verandert.

Tests op benchmarks zoals BrowseComp en HLE-Search, met onder meer Gemini 2.5 Pro als onderliggend model, laten zien dat BATS hogere nauwkeurigheid behaalt tegen lagere kosten dan bestaande methoden.