Anthropic overweegt eigen AI-chip met Samsung

Anthropic overweegt eigen AI-chip met Samsung

Anthropic onderzoekt de ontwikkeling van een eigen AI-chip en zou daarover gesprekken voeren met Samsung Electronics. De stap past in een bredere trend waarbij AI-bedrijven steeds meer controle willen krijgen over hun eigen hardware en minder afhankelijk willen worden van Nvidia.

Volgens The Information bevinden de gesprekken met Samsung zich nog in een vroeg stadium. Veel technische keuzes zijn nog niet gemaakt. Zo is nog onduidelijk of de chip uitsluitend bedoeld wordt voor AI-inferentie of ook geschikt zal zijn voor het trainen van modellen. Ook is nog niet vastgesteld hoe de processor binnen de serverarchitectuur wordt ingezet en welke prestaties de chip uiteindelijk moet leveren.

Reactie op chiptekorten

Dat Anthropic een eigen processor onderzoekt, komt niet geheel onverwacht. Reuters meldde al in april dat het bedrijf deze mogelijkheid verkende als reactie op de aanhoudende schaarste aan AI-chips. Met een eigen accelerator kan Anthropic de hardware beter afstemmen op zijn eigen modellen en tegelijkertijd de afhankelijkheid van externe leveranciers verkleinen.

De uiteindelijke rol van de processor is nog onduidelijk. Sommige AI-processoren, zoals Nvidia’s Rubin-GPU, zijn ontworpen voor zowel het trainen van AI-modellen als inferentie. Andere richten zich juist op een veel specifieker deel van de AI-workload. Startup Etched ontwikkelde bijvoorbeeld een accelerator die uitsluitend voor inferentie is bedoeld, terwijl Nvidia eerder dit jaar de LPU 30 introduceerde voor een specifieke categorie berekeningen binnen inferentieworkloads.

De ontwikkeling past in een bredere beweging binnen de AI-sector. OpenAI presenteerde vorige week zijn eerste eigen inferentieprocessor, Jalapeño, die samen met Broadcom werd ontwikkeld. Broadcom hielp eerder ook Google bij de ontwikkeling van diens TPU-processoren. Mocht Anthropic daadwerkelijk een eigen chip ontwikkelen, dan ligt samenwerking met een gespecialiseerde chipontwerper eveneens voor de hand.

Samsung als productiepartner

The Information meldt niet welke productietechnologie Anthropic wil inzetten. Samsung beschikt momenteel over meerdere geavanceerde productieprocessen, waaronder een 4-nanometerproces en het nieuwere SF2P-proces op 2 nanometer. Dat laatste is specifiek ontwikkeld voor krachtige datacenterchips en moet later dit jaar in productie gaan.

SiliconANGLE voegt daaraan toe dat het SF2P-proces gebruikmaakt van zogenoemde gate-all-around-transistors. Daarbij omsluit de gate het geleidingskanaal volledig, waardoor stroomlekken worden beperkt en de energie-efficiëntie verbetert. Ook de verbindingen tussen de transistoren zijn verder geoptimaliseerd om de prestaties te verhogen.

Daarnaast produceert Samsung HBM (High Bandwidth Memory), het snelle gestapelde geheugen dat in veel moderne AI-processoren wordt toegepast om grote hoeveelheden modeldata met een zeer hoge bandbreedte beschikbaar te houden. Of Anthropic hiervan gebruik gaat maken, is nog niet bekend, maar het ligt wel voor de hand wanneer het bedrijf een krachtige AI-accelerator ontwikkelt.

Een eigen chip betekent niet dat Anthropic afscheid neemt van bestaande leveranciers. In een reactie aan TechCrunch wilde het bedrijf de berichtgeving over de gesprekken met Samsung niet bevestigen of ontkennen. Wel benadrukte Anthropic dat chips van Amazon Web Services, Google en Nvidia een belangrijk onderdeel van zijn infrastructuur blijven. Een eigen processor lijkt daarmee vooral bedoeld als aanvulling op de bestaande hardwarestrategie.

Dat sluit aan bij de nauwe samenwerking met AWS. In april maakte Anthropic bekend zich voor de komende tien jaar te hebben gecommitteerd aan meer dan 100 miljard dollar aan AWS-infrastructuur.

Onderdeel van bredere datacenterstrategie

De mogelijke chipontwikkeling past binnen de uitbreidingsplannen van Anthropic. Vorig jaar kondigde het bedrijf een initiatief van 50 miljard dollar aan voor de bouw van AI-datacenters in de Verenigde Staten, samen met infrastructuurspecialist Fluidstack.

De verwachting is dat een eigen processor uiteindelijk in die infrastructuur wordt ingezet. Daarmee krijgt Anthropic meer controle over prestaties, energieverbruik en de beschikbaarheid van rekenkracht. Nu de vraag naar AI-compute sneller groeit dan het aanbod, investeren steeds meer AI-bedrijven niet alleen in modellen, maar ook in het silicium waarop die modellen draaien.