Claude 3.5 Sonnet kan je volledige computer gebruiken na update

Anthropic vormt zijn chatbot om tot een AI-agent die zelfstandig kan werken met een computer. De enige input die vereist is van gebruikers is een vraag.

De laatste update voor Claude laat de chatbot zelfstandig taken uitvoeren op een computer. Om een vraag te beantwoorden kan Claude dus zoeken op het internet en lokale bestanden bekijken. Het heeft ook de mogelijkheid op knoppen te klikken, zodat de AI-tool programma’s of bestanden op een computer zal kunnen openen voor de gebruiker.

De update voert Anthropic door aan het model Claude 3.5 Sonnet. Dit model werd in juni uitgegeven en zette in op multimodaliteit en efficiënte prestaties. De geüpdatete versie haalt betere prestaties op LLM-benchmarks. Het redeneert en programmeert beter, haalt betere resultaten op testen voor multimodale modellen en kan beter wiskundeproblemen oplossen. Dit terwijl het vorige model reeds werd geprezen voor betere resultaten dan GPT-4o, Gemini 1.5 Pro en Llama-400b.

Een vergelijkingsgrafiek toont prestatiegegevens van verschillende AI-modellen: Claude 3.5 (Sonnet, Haiku), GPT-4o-varianten en Gemini 1.5 (Pro, Flash) voor verschillende taken en mogelijkheden.

Bron: Anthropic

Beperkingen

Op de nieuwe tool staan verschillende beperkingen. Zo is ‘computer use‘ voorlopig alleen beschikbaar in API waardoor alleen ontwikkelaars toegang hebben. Het bedrijf geeft aan op die manier feedback te kunnen verzamelen over de tool, zodat de mogelijkheden snel verbeteren.

Daarnaast staan er beperkingen op het gebruik van de tool voor het creëren van social media-berichten en is het niet mogelijk Claude op overheidswebsites te laten werken. Op deze manier probeert Anthropic de veiligheid van de tool te garanderen. Anthropic is de eerste in het AI-veld om een AI-agent te lanceren die volledig zelfstandig kan werken met heel de computer.

Claude 3.5 Haiku

In de testen worden ook de resultaten van Claude 3.5 Haiku gepresenteerd. Het bedrijf geeft voor dit model aan dat op de meeste vlakken de prestaties van Claude 3 Opus worden geëvenaard. Haiku is op prijsvlak interessanter dan de vorige generatie van het topmodel.

Tip! AI-expert ML6: ‘Onze AI-agents geven handen en voeten aan LLM’s’

Keuze van de redactie

Insight: SentinelOne

Lees meer over Applications

Citrix keert terug naar de mainstream hypervisormarkt

Citrix probeert opnieuw voet aan de grond te krijgen in de markt voor algemene hypervisors. Het bedrijf grijp...

Mels Dees 14 uren geleden

OpenAI gaat concurrentie aan met Google Chrome

OpenAI bereidt zich voor op de lancering van een eigen webbrowser die concurreert met Google Chrome. De brows...

Mels Dees 17 uren geleden

Expert aan het woord

Volledig vertrouwen – waarom het succes van agentic AI begint bij leiderschap

Nu organisaties AI niet alleen testen, maar écht grootschalig inzetten, is het dichten van de AI-vertrouwens...

Cathy Mauzaize 2 dagen geleden

Top story

Domeinspecifieke AI verslaat generieke modellen in business apps

Het AI-team van Visma is stilletjes bezig met het herdefiniëren van documentverwerking in Europa. Met bijna ...

Berry Zwets 19 uren geleden

Tech calendar

Claude 3.5 Sonnet kan je volledige computer gebruiken na update

Beperkingen

Claude 3.5 Haiku

Blijf op de hoogte, abonneer!

Cybersubsidie keert terug: 1 miljoen euro beschikbaar in 2025

Wat weten we over SafePay, de Ingram Micro-aanvallers?

Ingram Micro krabbelt langzaam op na ransomware-aanval

Domeinspecifieke AI verslaat generieke modellen in business apps

CyberArk en SentinelOne bundelen krachten voor betere identiteitsecurity

SentinelOne XDR-platform en Security Data Lake krijgen Gen AI boost

SentinelOne neemt PingSafe over en zet grote stap in cloud security

Krijg Volledig Inzicht van Gebruiker tot Cloud met Cisco ThousandEyes

GITEX DIGI_HEALTH 5.0 - Thailand

IT Arena

Innovation Week 2025

Luxembourg Venture Days

Appdevcon

Verbeter je digitale ervaringen met de Cisco AI Assistant

Ervaar gratis Synology’s nieuwste enterprise backup-oplossing

Versnel je AI-succes met NVIDIA AI Computing van HPE

Versterk je cybersecurity met DNS best practices