Anthropic vormt zijn chatbot om tot een AI-agent die zelfstandig kan werken met een computer. De enige input die vereist is van gebruikers is een vraag.
De laatste update voor Claude laat de chatbot zelfstandig taken uitvoeren op een computer. Om een vraag te beantwoorden kan Claude dus zoeken op het internet en lokale bestanden bekijken. Het heeft ook de mogelijkheid op knoppen te klikken, zodat de AI-tool programma’s of bestanden op een computer zal kunnen openen voor de gebruiker.
De update voert Anthropic door aan het model Claude 3.5 Sonnet. Dit model werd in juni uitgegeven en zette in op multimodaliteit en efficiënte prestaties. De geüpdatete versie haalt betere prestaties op LLM-benchmarks. Het redeneert en programmeert beter, haalt betere resultaten op testen voor multimodale modellen en kan beter wiskundeproblemen oplossen. Dit terwijl het vorige model reeds werd geprezen voor betere resultaten dan GPT-4o, Gemini 1.5 Pro en Llama-400b.

Bron: Anthropic
Beperkingen
Op de nieuwe tool staan verschillende beperkingen. Zo is ‘computer use‘ voorlopig alleen beschikbaar in API waardoor alleen ontwikkelaars toegang hebben. Het bedrijf geeft aan op die manier feedback te kunnen verzamelen over de tool, zodat de mogelijkheden snel verbeteren.
Daarnaast staan er beperkingen op het gebruik van de tool voor het creëren van social media-berichten en is het niet mogelijk Claude op overheidswebsites te laten werken. Op deze manier probeert Anthropic de veiligheid van de tool te garanderen. Anthropic is de eerste in het AI-veld om een AI-agent te lanceren die volledig zelfstandig kan werken met heel de computer.
Claude 3.5 Haiku
In de testen worden ook de resultaten van Claude 3.5 Haiku gepresenteerd. Het bedrijf geeft voor dit model aan dat op de meeste vlakken de prestaties van Claude 3 Opus worden geëvenaard. Haiku is op prijsvlak interessanter dan de vorige generatie van het topmodel.
Tip! AI-expert ML6: ‘Onze AI-agents geven handen en voeten aan LLM’s’