NVIDIA Ampere A100 250W TDP GPU på PCIe 4.0 Gjord för AI, datavetenskap och superdatorlansering med utlovad prestanda på 90 procent av 400W-modellen

Hårdvara / NVIDIA Ampere A100 250W TDP GPU på PCIe 4.0 Gjord för AI, datavetenskap och superdatorlansering med utlovad prestanda på 90 procent av 400W-modellen 2 minuter läst

Nvidia



NVIDIA har officiellt lanserat A100, en PCIe 4.0-kompatibel GPU baserad på nästa generations Ampere-arkitektur. Även om den har en lägre 250 W TDP-profil, lovar NVIDIA att PCIe 4.0 Ampere A100 GPU kommer att kunna erbjuda upp till 90 procent av prestandan för hela 400 W A100 HGX GPU. Den tredje varianten till den växande Ampere A100 GPU-familjen, A100 PCIe, är avsedd för servrar som kör Artificial Intelligence (AI), Data Science och Supercomputing-kluster.

NVIDIA avslöjade en PCI-Express 4.0-variant av A100 GPU. GPU: n är baserad på 7nm Ampere mikroarkitektur. Dessutom tillkännagav företaget flera A100-drivna system från ledande servertillverkare, inklusive Asus, Dell, Cisco, Lenovo och mer. 250W A100 PCIe 4.0 GPU-acceleratorn liknar den fullständiga 400W TDP-varianten, och NVIDIA lovar också nästan identisk prestanda trots den betydande nedgången i TDP-profilen.



NVIDIA A100 Ampere GPU In PCIe 4.0 Form-Factor With Same 400W A100 HGX GPU Configuration But at 250W:

NVIDIA har meddelat sin PCIe 4.0 A100 PCIe GPU-accelerator. Ampere GPU är tillgänglig för en mängd olika industriella användningsfall med system som sträcker sig från en enda A100 PCIe GPU till servrar som använder två kort samtidigt genom de 12 NVLINK-kanalerna som levererar totalt 600 GB / s av sammankopplingsbandbredd. 250 W TDP A100 PCIe GPU-accelerator förändras inte mycket när det gäller kärnkonfiguration jämfört med 400 W A100 HGX GPU.



GA100 GPU har specifikationerna för 400W A100 HGX-varianten med 6912 CUDA-kärnor ordnade i 108 SM-enheter, 432 Tensor-kärnor och 40 GB HBM2-minne som ger samma minnesbandbredd på 1,55 TB / s (avrundat till 1,6 TB / s). Emellertid distribuera GPU-paketet på PCIe 4.0-standard hade sin egen nackdel att avsevärt minska TDP. Detta innebär enligt uppgift en prestationsstraff på 10 till 50 procent baserat på arbetsbelastningen. Dessutom är 250 W TDP-varianten av A100 GPU mer lämpad för korta skurar snarare än för långvariga belastningar.

NVIDIA A100 Ampere GPU In PCIe 4.0 Form-Factor Performance:

På grund av den betydande minskningen av TDP-profilen kan man anta att kortet skulle ha lägre klockor för att kompensera för mindre TDP-ingång. Prestandamätvärdena som NVIDIA har släppt är dock verkligen överraskande eftersom de kommer ganska nära 400 W TDP-varianten. FP64-prestandan är fortfarande rankad till 9,7 / 19,5 TFLOP, FP32-prestandan är betygsatt till 19,5 / 156/312 TFLOP (Sparsity), FP16-prestandan är rankad till 312/624 TFLOP (Sparsity) och INT8 är rankad till 624/1248 TOP ( Gleshet).



Enkel matematik indikerar och NVIDIA försäkrar att den Ampere-baserade PCIe 4.0 250W A100 GPU kan leverera 90 procent av A100 HGX-kortets (400W) prestanda i toppserverapplikationer. Detta är motiverat eftersom det tar mindre tid för den nya varianten att slutföra de ovannämnda uppgifterna. Siffrorna bör dock endast gälla för korta intervaller. I komplexa situationer som kräver långvarig GPU-kapacitet kan 250W PCIe 4.0 GPU leverera var som helst från upp till 90 procent till ner till 50 procent av 400 W A100 HGX GPU.

Ampere-mikroarkitekturen kommer säkert att gynna den nya A100. NVIDIA lovar åtminstone en 20X prestandaförstärkning jämfört med den Volta-baserade föregångaren. PCIe 4.0 A100 GPU har GPU med flera instanser. Detta innebär att en enda A100 kan delas upp i så många som sju separata GPU: er för att hantera olika datoruppgifter. Medan detta ökar segmenteringen finns det tredje generationens NVLink, som gör det möjligt att ansluta flera GPU: er till en gigantisk GPU.

Taggar nvidia