Waarom Ethernet dé netwerkarchitectuur voor AI-innovatie is

Man met kort haar en een snor, gekleed in een colbert en een blauw overhemd, poserend tegen een effen witte achtergrond.
Waarom Ethernet dé netwerkarchitectuur voor AI-innovatie is

AI-toepassingen vragen om de verwerking van reusachtige datavolumes en ongebreidelde rekenkracht. De keuze van de netwerkinfrastructuur groeit daarmee uit tot een kritieke succesfactor. InfiniBand (IB) genoot traditioneel de voorkeur binnen bepaalde omgevingen. Deze netwerktechnologie pint organisaties echter vast aan een specifieke leverancier. En ondertussen blijft de flexibiliteit beperkt vanwege operationele problemen. Ethernet groeit daarentegen in rap tempo uit tot de universele keuze voor netwerkarchitecturen vanwege zijn openheid, schaalbaarheid, prestatievermogen en kostenefficiëntie.

Waarom Ethernet aan terrein wint en InfiniBand achterblijft

Diverse factoren wijzen op een toekomst waarin geavanceerde graphic processing units (GPU’s) en AI accelerators gebruikmaken van Ethernet. Organisaties gaan daarmee de kosten en complexiteit van InfiniBand uit de weg. Om een paar voorbeelden te geven:

Vendor lock-in voorkomen

De niet-open technologie van InfiniBand pint organisaties vast aan een specifieke leverancier. De open standaard van Ethernet draagt daarentegen bij aan ecosystemen waaraan meerdere leveranciers deelnemen. Dit brengt meer flexibiliteit naar het netwerkontwerp. Organisaties kunnen een beroep doen op GPU’s en AI accelerators van uiteenlopende leveranciers om afhankelijkheid van één partij te voorkomen.

Ethernet is de beste keuze voor bedrijven die flexibiliteit vooropstellen vanwege zijn compatibiliteit met systemen van uiteenlopende leveranciers. En die is hard nodig met het oog op de komst van specialistische GPU’s en AI accelerators van bedrijven als AMD, Intel en innovatieve startups. Organisaties kunnen op die manier innoveren en hun AI-toepassingen opschalen zonder beknot te worden door de connectiviteit.

Schaalbaarheid en topprestaties

Ethernet biedt de schaalbaarheid en het prestatievermogen die nodig zijn om tegemoet te komen aan de groeiende eisen van AI-workloads. De technologie biedt snelheden tot 800G, en ondertussen tekent 1,6T zich al aan de horizon af. Uiterst geavanceerde functies zoals RDMA over Converged Ethernet versie 2 (RoCE v2) en Global Load Balancing (GSLB) zorgen voor lage latency en een hoge doorvoercapaciteit. Ethernet kan daarmee de mogelijkheden van InfiniBand evenaren of zelfs overtreffen.

Dit alles maakt Ethernet tot de ideale keuze voor geavanceerde AI accelerators. Organisaties kunnen hiermee hun AI-projecten opschalen, complexe en diverse gegevensbronnen integreren en zorgen voor ongeremde innovatie. Voortdurende verbeteringen van Ethernet-standaarden vergroten daarnaast het vermogen van de technologie om netwerkopstoppingen te verhelpen, fouttolerantie te bieden en de netwerkprestaties in real time te optimaliseren. Het resultaat: een soepel functionerend netwerk, zelfs in de meest veeleisende AI-omgevingen.

Kostenefficiëntie en operationele eenvoud

Organisaties schalen hun AI-toepassingen in hoog tempo op. Daarvoor hebben zij betaalbare en eenvoudig inzetbare netwerkoplossingen nodig. De reeds sterke aanwezigheid van Ethernet in datacenters draagt bij aan lagere implementatiekosten en stroomlijnt de integratie met hybride cloudomgevingen. Dit maakt naadloze communicatie mogelijk tussen hardware op locatie en GPU’s in de cloud. De grootschalige inzet van Ethernet waarborgt bovendien toegang tot een uitgebreide pool van technisch talent en tools, waardoor operationele struikelblokken voor AI-projecten tot een minimum beperkt blijven. Het open ecosysteem van Ethernet jaagt innovatie aan, draagt bij aan aanpasbare netwerkontwerpen en reduceert de operationele complexiteit rond moderne AI-workloads.

En last but not least kent Ethernet een lange geschiedenis van overwinningen op concurrerende technologieën zoals Token Ring, FDDI, ATM en SONET. Dat is het ultieme bewijs voor zijn eerdergenoemde kwaliteiten. De consensus binnen de technologiesector is dat Ethernet ook als winnaar uit de bus zal komen als het om AI-netwerken gaat.

De impact van Ethernet op AI-workloads

Ethernet vormt met zijn razendsnelle verbindingen, lage latency en beheer van netwerkopstoppingen de beste connectiviteitsoptie voor grootschalige AI-omgevingen. De technologie heeft bewezen de ideale netwerkinfrastructuur te zijn voor AI en biedt de bandbreedte, het prestatievermogen en de flexibiliteit die nodig zijn voor:

De training van AI-toepassingen: AI-modellen hebben een infrastructuur nodig die ondersteuning biedt voor reusachtige datasets en iteratief leren. De schaalbaarheid van Ethernet (met poortsnelheden tot 800G) zorgt ervoor dat het trainen van AI-toepassingen zonder bottlenecks verloopt. Ethernet biedt daarnaast met geavanceerd beheer van netwerkopstoppingen en RDMA schaalbare ondersteuning voor het trainen van grote AI-modellen, inference (het voorspellen of voltooien van taken door AI) en gedistribueerde systemen.

Inference en real-time besluitvorming: Lage latency is van cruciaal belang voor toepassingen zoals zelfrijdende auto’s, financiële handel en medische diagnostiek. De architectuur van Ethernet zorgt met snelle en betrouwbare gegevensoverdracht in kortere tijd voor nauwkeuriger resultaten.

Grootschalige gegevensverwerking: AI-toepassingen verwerken bergen aan data. Ethernet is vanwege zijn hoge doorvoercapaciteit een ideale match voor high performance computing (HPC)-clusters en gedistribueerde AI-systemen die vragen om de soepele overdracht van grote datavolumes.

Diagram met netwerkarchitectuur: Front End Network verbindt met Shared Storage Nodes, GPU Cluster en Dedicated Storage Nodes. GPU Cluster verbindt met Backend GPU Training Network en Backend Dedicated Storage Network.
Afbeelding 1: De logische structuur van een AI-datacenter van een grote onderneming

Marktleiders kiezen voor Ethernet

Volgens een recente enquête door ZK Research en theCUBE Research prefereert 59 procent van alle respondenten Ethernet boven InfiniBand. Redenen voor deze voorkeur: de aanwezigheid van een op Ethernet bestaande netwerkomgeving en relevante interne vaardigheden, een cloud provider die voor AI-toepassingen gebruikmaakt van Ethernet, een hoger kapitaalrendement en zorgen om InfiniBand.

Cirkeldiagram en staafdiagram vergelijken netwerktechnologieën: 69% geeft de voorkeur aan Ethernet, 3% geeft de voorkeur aan InfiniBand, 28% is onzeker. Staafdiagram toont Ethernet- en InfiniBand-gebruik in verschillende netwerkcontexten.
Afbeelding 2: Netwerktechnologie waarmee de respondenten hun al dan niet geclusterde AI-workloads het liefste ondersteunen

Bedrijven als Meta, NVIDIA en Oracle hebben Ethernet al ingezet voor grootschalige AI-toepassingen:

Meta’s Llama 3.1-model: Meta heeft zijn uiterst geavanceerde AI-model getraind met behulp van een reusachtig Ethernet RoCE v2-cluster van 24.000 GPU’s. Dit is te danken aan het vermogen van Ethernet om ondersteuning te bieden voor grootschalige training zonder pakketverlies.

Oracle ruilt IB in voor Ethernet: Oracle heeft zijn Exadata-systeem overgezet van IB naar een Ethernet-netwerk om veeleisende workloads te kunnen verwerken. Nog een bewijs voor de schaalbaarheid en eenvoud van Ethernet.

NVIDIA gaat voor Ethernet: NVIDIA, een lid van het Ultra Ethernet Consortium, heeft Ethernet-oplossingen omarmd om efficiënte ondersteuning te bieden voor grootschalige multi-GPU-clusters.

Ethernet als motor voor de AI-markt

AI vraagt om de verwerking van enorme datavolumes, de inzet van complexe algoritmes en real-time besluitvorming. Dit valt alleen te realiseren met een robuuste en schaalbare netwerkstructuur. Ethernet heeft zijn positie als platform voor AI-innovatie verstevigd. Zijn in de praktijk bewezen prestatievermogen, schaalbaarheid en operationele flexibiliteit maken de technologie geknipt voor de ondersteuning van snelgroeiende AI-workloads. In tegenstelling tot InfiniBand biedt Ethernet een toekomstbestendige oplossing die zich kan aanpassen aan de steeds hogere eisen van AI-toepassingen en een soepele uitbreiding van de netwerkinfrastructuur mogelijk maakt.

Ethernet blijft met functionaliteit als RoCE v2 garant staan voor lage latency en snelle netwerkprestaties voor geavanceerde AI accelerators. Zijn open ecosysteem, razendsnelle connectiviteit en innovatieve beheer van netwerkopstoppingen stellen organisaties in elke sector in staat om met vertrouwen baanbrekende AI-toepassingen te ontwikkelen, het volledige potentieel van AI te benutten en ongestoord te innoveren.

Dit is een ingezonden bijdrage van Juniper Networks. Via deze link vind je meer informatie over de mogelijkheden van het bedrijf.

Lees verder: 2024 is het jaar van Ethernet, mede dankzij AI