Amazon Web Services (AWS) heeft een nieuwe G4 instance-familie algemeen beschikbaar gemaakt. De instances zijn geoptimaliseerd voor machine learning inference en grafiek-intensieve workloads.

Met de G4-familie introduceert AWS instances die de G3-serie opvolgen. Tussen de twee varianten zit een behoorlijk verschil in prestaties. De nieuwe instances draaien het populaire image recognition-model ResNet50 twee keer sneller dan hun voorgangers, schrijft Silicon Angle.

T4-GPU

De G4 instances gebruiken de Tesla T4-GPU van Nvidia, die in september 2018 onthuld werden. In deze chip zitten bijna 3.000 processing cores, waaronder 320 Tensor Cores die ontworpen zijn om kunstmatige intelligentie (AI)-modellen te helpen sneller data te verwerken.

Vijf van de virtuele machines in de G4-familie krijgen een enkele T4-kaart per instance. De zesde is de g4dn .12xlarge en krijgt vier chips, samen met 192 GB aan geheugen. Bij dit model krijgt de Nvidia-GPU ondersteuning van CPU’s van Intel die de algemene computing-taken afhandelen, om zo meer rekenkracht vrij te maken voor het verwerken van AI-gerelateerde taken.

De T4-chips zijn niet alleen geschikt voor AI-workloads, maar ook voor grafische workloads. Naast de 320 Tensor Cores zitten er namelijk ook 40 RT Cores in de GPU, om visuele verwerkingen te bespoedigen. Dit komt bijvoorbeeld van pas bij een AI-toepassing als computer vision.

Eerste instance

AWS introduceerde in maart dit jaar overigens ook al een EC2 instance met Tesla T4-GPU’s, die beschikbaar werd gemaakt voor G4 instances. Deze instance is net als de nu aangekondigde G4-familie ontworpen voor machine learning. De instance uit maart kan in totaal acht T4-GPU’s tegelijkertijd in de cloud inzetten.

De nieuwe G4-familie is in acht van de 22 global datacenter clusters van AWS beschikbaar gemaakt. Later moet de ondersteuning uitgebreid worden naar andere regio’s. Daarnaast moet er een zevende instance komen met acht T4-GPU’s, 93 CPU-kernen en 384 GB aan geheugen.