xAI presenteert nieuw topmodel Grok 3  

xAI presenteert nieuw topmodel Grok 3  

Het AI-bedrijf van Elon Musk, xAI, lanceerde zijn nieuwste AI-model, Grok 3. Ook onthulde de onderneming nieuwe functies voor Grok iOS- en webapps.

Grok, xAI’s antwoord op modellen zoals OpenAI’s GPT-4o en Google’s Gemini, kan afbeeldingen analyseren en vragen beantwoorden. Ook ondersteunt het verschillende functies op Musks sociale netwerk, X. Grok 3, dat al enkele maanden in ontwikkeling is, stond gepland voor release in 2024, maar miste die deadline. Dit meldt TechCrunch.

Uitgebreide trainingsdataset

xAI gebruikte een gigantisch datacenter in Memphis om Grok 3 te trainen. Dit beschikt over ongeveer 200.000 GPU’s. In een post op X beweerde Musk dat Grok 3 ontwikkeld is met tien keer meer rekenkracht dan zijn voorganger, Grok 2. En met een uitgebreidere trainingsdataset, die naar verluidt ook juridische documenten bevat. Niet alle modellen en functies van Grok 3 zijn al beschikbaar. Sommige bevinden zich nog in bèta. Maar de uitrol is inmiddels begonnen.

Volgens Musk is Grok 3 veel capabeler dan Grok 2. Het gaat volgens hem om AI die maximaal naar waarheid streeft, zelfs als die waarheid soms ingaat tegen wat politiek correct is.

xAI beweert dat Grok 3 beter presteert dan GPT-4o op benchmarks zoals AIME (dat de prestaties van een model op wiskundevragen beoordeelt) en GPQA (dat modellen test met natuurkunde-, biologie- en scheikundeproblemen op PhD-niveau). Een vroege versie van Grok 3 scoorde ook hoog in de Chatbot Arena. Dit is een door gebruikers beheerde test waarin men AI-modellen tegenover elkaar zet en gebruikers stemmen op hun favoriete antwoorden, volgens xAI.

Twee nieuwe reasoning-modellen  

Grok 3 is feitelijk een familie van modellen. Een kleinere versie, Grok 3 mini, kan sneller reageren op vragen, maar levert in op nauwkeurigheid. Twee modellen in de Grok 3-familie, Grok 3 Reasoning en Grok 3 mini Reasoning, kunnen problemen beter doordenken. Ze zijn vergelijkbaar met redeneermodellen zoals OpenAI’s o3-mini en DeepSeek’s R1. Deze modellen proberen hun antwoorden te controleren voordat ze worden gegeven. Dit helpt om veelvoorkomende fouten van AI-modellen te vermijden.

Deze redeneermodellen zijn toegankelijk via de Grok-app. Gebruikers kunnen Grok 3 vragen om na te denken. Of ze kunnen voor complexere vragen de Big Brain-modus inschakelen, die extra rekenkracht gebruikt. Volgens xAI zijn de reasoning-modellen vooral geschikt voor wiskunde-, wetenschaps- en programmeervragen.

Musk zei dat sommige gedachten van de reasoning-modellen verborgen worden in de Grok-app om distillatie te voorkomen, een methode waarmee AI-ontwikkelaars kennis uit andere modellen kunnen halen. Recentelijk werd DeepSeek beschuldigd van het distilleren van OpenAI’s modellen om hun eigen AI te verbeteren.

Nieuwe functies en prijsplannen

De reasoning-modellen vormen de basis voor een nieuwe functie in de Grok-app, genaamd DeepSearch. Dit is xAI’s antwoord op AI-gestuurde onderzoeksinstrumenten zoals OpenAI’s deep research. DeepSearch scant het internet en X om informatie te analyseren en een samenvatting te geven in antwoord op een vraag.

Abonnees van X’s Premium+ tier ($50 per maand) krijgen als eersten toegang tot Grok 3. Andere functies worden beschikbaar via een nieuw abonnement genaamd SuperGrok. Volgens gelekte informatie kost SuperGrok $30 per maand of $300 per jaar en biedt het extra redeneer- en DeepSearch-vragen, plus onbeperkte beeldgeneratie.

Binnen een week zal de Grok-app naar verwachting een spraakmodus krijgen, aldus Musk, waarmee Grok-modellen een gesynthetiseerde stem krijgen. Een paar weken later worden de Grok 3-modellen beschikbaar via de zakelijke API van xAI, samen met de DeepSearch-functionaliteit. xAI is ook van plan Grok 2 in de komende maanden open-source te maken, zei Musk.

Politieke bias en controverses  

Toen Musk Grok ongeveer twee jaar geleden aankondigde, presenteerde hij het AI-model als edgy, ongefilterd en anti-woke. Ofwel: een AI die bereid is controversiële vragen te beantwoorden waar andere systemen voor terugdeinzen. Tot op zekere hoogte heeft hij dat waargemaakt. Als het algoritme werd gevraagd om grof taalgebruik te gebruiken, deden Grok en Grok 2 dat zonder aarzeling. Dit in tegenstelling tot AI-modellen zoals ChatGPT.

Toch bleven eerdere Grok-modellen voorzichtig bij politieke onderwerpen en overschreden ze bepaalde grenzen niet. Een studie wees zelfs uit dat Grok een linkse politieke neiging vertoonde op thema’s zoals transgenderrechten, diversiteitsprogramma’s en ongelijkheid.

Musk schreef die bias toe aan de trainingsdata van Grok — openbare webpagina’s — en beloofde Grok politiek neutraler te maken. Het is nog onduidelijk of xAI dat doel heeft bereikt en wat de gevolgen daarvan zullen zijn.