2min

Amazon Web Services (AWS) kondigt aan nieuwe compute-instances te introduceren voor ontwikkelaars. Zij kunnen applicaties bouwen die gebruik kunnen gaan maken van Nvidia’s nieuwe generatie Volta GPU’s. Deze nieuwe high-performance GPU’s kunnen voor de broodnodige rekenkracht zorgen bij bijvoorbeeld AI-berekeningen. 

Door Volta aan te bieden via de AWS-cloud kunnen bedrijven instances draaien met maximaal acht V100 GPU’s. De meest uitgebreide versie beschikt over 128 GB GPU-memory, 64 vCPU’s en netwerk-bandbreedte van 25 Gbps. Bij de kleinste optie draaien instances met één Nvidia Tesla V100 GPU en is er een GPU-geheugen van 16 GB.

GPU Cloud

Nvidia lanceerde tevens een nieuwe GPU Cloud die ontworpen is om bedrijven een geoptimaliseerde omgeving te leveren voor het draaien van deep learning in een public cloud bovenop de hardware van Nvidia. Ontwikkelaars kunnen zich gratis aanmelden voor een GPU Cloud-account en vervolgens verbinden met de Amazon Machine Image (AMI) die Nvidia ontwikkelde voor machine learning.

Met AMI kunnen ontwikkelaars containers inzetten op AWS die geoptimaliseerd zijn voor het gebruik van verschillende machine learning-frameworks met CUDA. Dat is een bibliotheek van Nvidia voor machine learning-berekeningen met zijn hardware.

De containers die op deze manier gemaakt worden zijn hetzelfde als containers die Nvidia machine learning-hardware voor private datacenters draaien. Dat betekent dat het voor ontwikkelaars mogelijk is om applicaties te testen in AWS en ze on-premises in te zetten of vice versa.

Beschikbaarheid

De GPU Cloud-software is compatible met zowel Nvidia’s Volta GPU als de oudere Pascal-series die al ingezet wordt op AWS en andere cloudomgevingen. De Volta moet uiteraard beter zijn dan zijn voorgangers. In het begin zal er een beschikbaarheid in de AWS-regio’s Northern Virginia, Oregon, Ireland en Tokyo-datacenters zijn.

AWS is de eerste cloud-provider die de nieuwe compute instances aanbiedt. Nvidia heeft de ambitie om GPU Cloud-software naar andere providers te brengen, al zijn er geen specifieke data gecommuniceerd. De kans dat het relatief snel gaat gebeuren, achten we echter groot.