Nvidia werkt aan chip voor AI-inferencing met Groq-technologie

Naast GPU’s die het leeuwendeel van AI-training verwerken, wil Nvidia een chip introduceren voor het dagelijks draaien van AI-workloads. Dankzij de overgenomen expertise van startup Groq hoopt het bedrijf AI-spelers zoals OpenAI te voorzien van zuinige processoren om hun AI-diensten te draaien.

De chip zou de komende maand tijdens Nvidia GTC ten tonele kunnen verschijnen. OpenAI zou volgens de Wall Street Journal vroege toegang tot de nieuwe processor hebben gekregen. Vrijdagavond meldde het nieuwsmedium dat Nvidia hiermee de opkomende concurrentie wil dwarsbomen. Op het gebied van AI-training lijkt het ongenaakbaar, alhoewel Google met de Tensor Processing Unit en AMD met haar GPU’s reële alternatieven zijn.

Wat inferencing betreft zijn de opties talrijk. Zo hebben AWS en Google Cloud hier chips voor in de public cloud, terwijl menig startup poogt een goedkoper en efficiënter alternatief te leveren voor inferencing. Dat Nvidia zelf nu een dedicated inferencing-platform ontwikkelt, is dan ook geen verrassing. Het bedrijf sloot in december een licentiedeal van 20 miljard dollar met Groq, waarbij het ook oprichter Jonathan Ross en president Sunny Madra in dienst nam. Groq’s zogenoemde Language Processing Units (LPU’s) zijn gebouwd op een volledig nieuwe architectuur die inferencing met aanzienlijk minder energieverbruik uitvoert.

Hoe Nvidia de technologie precies integreert, heeft het bedrijf nog niet bekendgemaakt. De GTC 2026-conferentie start op 16 maart in San Jose, dus dan zullen we meer duidelijkheid verwachten. Het is opvallend dat OpenAI een vroege klant is, want het was al langere tijd op zoek naar snellere alternatieven voor Nvidia’s GPU’s vanwege onvrede over de inferencing-snelheid bij specifieke taken, waaronder softwareontwikkeling. Vorige maand sloot het nog een deal met Cerebras voor inferencing-chips. Die twee zaken staan naast elkaar.

OpenAI als vroege gebruiken

Tegelijkertijd ontving OpenAI vorige week 30 miljard dollar van Nvidia als onderdeel van een mega-investering van in totaal 110 miljard dollar. Het lijkt er dus op dat de rust tussen beide partijen is wedergekeerd. De nieuwe inferencing-chip zou OpenAI willen gebruiken voor Codex, de eigen programmeertool waarmee het strijdt met Anthropic’s Claude Code. Coding is een van de meest winstgevende use cases voor generatieve AI, en een terrein waarop OpenAI momenteel tweede staat. Claude Code is in feite de standaard voor programmeurs die met AI werken, afgezien van oplossingen die bedrijven intern hebben ontwikkeld of afnemen.

Lees meer over Devices

Vertiv introduceert KVM-switch voor gecentraliseerd beheer van datacenters

Vertiv introduceert een nieuwe generatie KVM-switch, gericht op veilig beheer van IT-infrastructuur op afstan...

Mels Dees 23 februari 2026

Geheugenprijzen blijven de pan uit rijzen, Q1-groei van 95 procent

TrendForce heeft zijn prognose voor de geheugenprijzen voor het eerste kwartaal van 2026 drastisch naar boven...

Erik van Klinken 2 februari 2026

Topartikel

ClickShare combineert MDEP met gebruiksgemak voor videoconferencing

Organisaties zijn ingesteld op videoconferencing, maar volwassen zijn hun oplossingen nog niet altijd. ClickS...

Erik van Klinken 17 februari 2026

Review

Review ASUS NUC 15 Pro: maakt rekenkracht beschikbaar op onmogelijke plekken

We ontvingen van ASUS een ASUS NUC 15 Pro, een hele kleine mini-pc die voldoende rekenkracht levert voor alle...

Coen van Eenbergen 19 februari 2026

Expert aan het woord

Nvidia werkt aan chip voor AI-inferencing met Groq-technologie

OpenAI als vroege gebruiken

Blijf op de hoogte, abonneer!

Licentiechaos Oracle en SAP: Weet wat je hebt voordat je overstapt

Anthropic Claude versnelt COBOL-modernisering met AI

HPE geeft datacenters nieuwe netwerkbasis met Juniper PTX12000-serie

VAST Data zet unieke marktpositie in om full-stack AI-infrastructuur te ontwikkelen

Sophos CEO sees "cybersecurity poverty line": what to do about it?

SAP Business Network: $6.5 trillion B2B collaboration platform

Atlassian CTO on realistic AI: Rovo, data privacy & adoption

SAP's AI workforce strategy: upskilling 100,000 employees

Hybride dreigingen: van abstract risico naar bestuurlijke realiteit

Van huddle tot boardroom: hoe ClickShare vergaderen herdefinieert

De balans tussen AI-innovatie en de EU AI Act

Hoe Nokia wereldwijde netwerklabs inzet voor AI-ready infrastructuur

Appdevcon

Webdevcon

Dutch PHP Conference

De IT Afdeling van de toekomst

GITEX ASIA 2026

Southeast Asia AI Application Summit 2026

Platform engineering als versneller van de energietransitie

Het pakketprobleem in de logistiek; van claims naar kostenbesparing

Axis maakt met camerasensors de werkomgeving veiliger en efficiënter