Microsoft introduceert Maia 200, een AI-chip die volgens het bedrijf fors sneller is dan concurrerende producten. De accelerator is specifiek ontworpen voor het draaien van grote AI-modellen en biedt 30 procent betere prestaties per dollar.
De chip is gefabriceerd op TSMC’s 3-nanometerproces en bevat meer dan 140 miljard transistors. Microsoft positioneert Maia 200 als de krachtigste first-party silicium van alle hyperscalers. Naast de snelheidswinst op Trainium 3 in FP4-berekening (3x sneller) claimt Microsoft dat de chip ook beter dan Google’s zevende generatie TPU bij FP8-berekeningen (5.072 voor Microsoft versus 4.614 voor Google) presteert.
Elke Maia 200-chip levert meer dan 10 petaFLOPS aan rekenkracht in 4-bit precisie en ruim 5 petaFLOPS in 8-bit precisie. Dit alles binnen een vermogensbudget van 750 watt. Het geheugensubsysteem bestaat uit 216GB HBM3e-geheugen met een bandbreedte van 7 TB/s en 272MB on-chip SRAM.
Systeem- en netwerkontwerp
Microsoft kiest voor een tweelaagsarchitectuur gebaseerd op standaard Ethernet. Elk Maia 200-systeem biedt 2,8 TB/s bidirectionele bandbreedte en kan clusters van maximaal 6.144 accelerators ondersteunen. Binnen elke tray zijn vier Maia-chips volledig verbonden via directe, niet-geschakelde links.
De chip integreert naadloos met Azure en wordt al ingezet voor services als Microsoft 365 Copilot en Azure Foundry. OpenAI gebruikt Maia 200 voor GPT-5.2-modellen, terwijl Microsoft’s Superintelligence-team de hardware inzet voor synthetische datageneratie en reinforcement learning.
Maia 200 draait momenteel in het US Central-datacentergebied bij Des Moines, Iowa. Het US West 3-gebied nabij Phoenix, Arizona, volgt binnenkort. Over andere regio’s meldt Microsoft nog niets in de aankondiging. Microsoft biedt nu een preview van de Maia SDK aan, compleet met PyTorch-integratie, een Triton-compiler en toegang tot een low-level programmeertaal.
De SDK bevat ook een Maia-simulator en kostencalculator om ontwikkelaars vroeg in het ontwikkelproces te helpen optimaliseren. Ontwikkelaars, AI-startups en academici kunnen zich aanmelden voor vroege toegang tot de tools.
Tip: AWS werkt aan nieuwe Graviton- en Trainium-chips als Nvidia-alternatief