NVIDIA Tesla V100, czyli architektura Volta przetestowana w Geekbench

0

Akcelerator graficzny NVIDIA Volta V100 został oficjalnie przetestowany w aplikacji Geekbench 4. Wykorzystano w tym celu jednostkę o nazwie NVIDIA DGX-1, która jest swojego rodzaju superkomputerem w obudowie. Maszyna posiada dwa procesory Intel Xeon E5-2698 V4, 512 GB pamięci DDR4, cztery dyski SSD o łącznej pojemności 1.92 TB, spięte w RAID 0 oraz 8 kart Tesla V100.

NVIDIA Tesla V100

Ta ostatnia wartość jest bardzo ważna. Każdy z akceleratorów graficznych posiada 5120 rdzeni CUDA, co łącznie daje imponujące 40 960 rdzeni CUDA oraz Tensor Cores. Prócz tego każda z kart posiada 16 GB pamięci HBM2. Cały system zasilany jest przez 3.2 kW zasilacz komputerowy.

Karta graficznaTesla K40
(PCI-Express)
Tesla M40
(PCI-Express)
Tesla P100
(PCI-Express)
Tesla P100
(PCI-Express)
Tesla V100 (PCI-Express)
RdzeńGK110 (Kepler)GM200 (Maxwell)GP100 (Pascal)GP100 (Pascal)GV100 (Volta)
Technologia28nm28nm16nm16nm12nm
Tranzystory7.1 Billion8 Billion15.3 Billion15.3 Billion21.1 Billion
Rozmiar rdzenia551 mm2601 mm2610 mm2610 mm2815mm2
Jednostki cieniujące1524565680
Rdzenie CUDA28803072358435845120
FP64 CUDA Cores / SM644323232
FP64 CUDA Cores / GPU96096179217922560
Zegar bazowy745 MHz948 MHzTBDTBDTBD
Zegar Boost875 MHz1114 MHz1300MHz1300MHz1370 MHz
Obliczenia FP16N/AN/A18.7 TFLOPs18.7 TFLOPs28.0 TFLOPs
Obliczenia FP325.04 TFLOPs6.8 TFLOPs10.0 TFLOPs10.0 TFLOPs14.0 TFLOPs
Obliczenia FP641.68 TFLOPs0.2 TFLOPs4.7 TFLOPs4.7 TFLOPs7.0 TFLOPs
Jednostki teksturujące240192224224320
Interfejs pamięci384-bit GDDR5384-bit GDDR54096-bit HBM24096-bit HBM24096-bit HBM2
Wielkość pamięci12 GB GDDR5 @ 288 GB/s24 GB GDDR5 @ 288 GB/s12 GB HBM2 @ 549 GB/s16 GB HBM2 @ 732 GB/s16 GB HBM2 @ 900 GB/s
L2 Cache1536 KB3072 KB4096 KB4096 KB6144 KB
TDP235W250W250W250W250W