NVIDIA Tesla V100 – pierwsza karta graficzna na architekturze Volta

0

Jensen Huang przedstawił światu kartę Tesla V100 podczas konferencji GTC 2017. Jest to pierwszy model na architekturze Volta, wyprodukowany przez tajwańskie fabryki TSMC w procesie technologicznym 12 nm FinFET. Układ posiada 5120 rdzeniu CUDA, 16 GB pamięci HMB2, 6MB pamięci podręcznej oraz 20 MB SM RF. Należy również wspomnieć o złączu NVLink, które ma zapewniać przepustowość 300 GB/s.

NVIDIA Volta, Tesla V100

Rdzeń składa się z 21 miliardów tranzystorów, które upakowano na powierzchni 815 mm2. Wydajność w obliczeniach pojedynczej precyzji to 15 TFLOPS, a w podwójnej – 7,5 TFLOPS. Jeżeli spojrzeć na poprzednią generację Pascal, jest to aż 40 procentowy wzrost wydajności. Do tego dochodzi bardzo szybka pamięć HBM2.

NVIDIA Tesla V100NVIDIA Tesla P100
Wielkość rdzenia815 mm2610 m2
Wydajność FP3215.0 TFlops10.6 TFlops
Rdzenie CUDA51203584
Zegar rdzenia1455 MHz1480 MHz
Typ pamięci4096-bit 16 GB HBM24096-bit 16GB HBM2
InterfejsNVLink 2.0NVLink 1.0 / PCI-e 3.0
Przepustowość pamięci900 GB/s720 GB/s
TDP300W300W

NVIDIA Volta GV100

Razem z prezentacją Tesla V100, NVIDIA przedstawiła rdzeń graficzny GV100. Jest to obecnie największa jednostka, jaka kiedykolwiek powstała. Na pokładzie znajduje się aż 5376 rdzeni CUDA.

NVIDIA Volta, rdzeń GV100

Do tego dochodzi nowa typ Procesorów Strumieniowych zwanych Volta SM, wyposażonych w rdzenie Tensor Core. Są to specjalistyczne macierze 4x4x4, które są w pełni zoptymalizowane do obliczeń związanych z głębokim uczeniem. Ich maksymalna teoretyczna wydajność może wynosić nawet 120 TFLOPSów.

NVIDIA Volta, Tensor Core