Akcelerator graficzny NVIDIA Volta V100 został oficjalnie przetestowany w aplikacji Geekbench 4. Wykorzystano w tym celu jednostkę o nazwie NVIDIA DGX-1, która jest swojego rodzaju superkomputerem w obudowie. Maszyna posiada dwa procesory Intel Xeon E5-2698 V4, 512 GB pamięci DDR4, cztery dyski SSD o łącznej pojemności 1.92 TB, spięte w RAID 0 oraz 8 kart Tesla V100.

NVIDIA Tesla V100

Ta ostatnia wartość jest bardzo ważna. Każdy z akceleratorów graficznych posiada 5120 rdzeni CUDA, co łącznie daje imponujące 40 960 rdzeni CUDA oraz Tensor Cores. Prócz tego każda z kart posiada 16 GB pamięci HBM2. Cały system zasilany jest przez 3.2 kW zasilacz komputerowy.

Karta graficzna Tesla K40
(PCI-Express)
Tesla M40
(PCI-Express)
Tesla P100
(PCI-Express)
Tesla P100
(PCI-Express)
Tesla V100 (PCI-Express)
Rdzeń GK110 (Kepler) GM200 (Maxwell) GP100 (Pascal) GP100 (Pascal) GV100 (Volta)
Technologia 28nm 28nm 16nm 16nm 12nm
Tranzystory 7.1 Billion 8 Billion 15.3 Billion 15.3 Billion 21.1 Billion
Rozmiar rdzenia 551 mm2 601 mm2 610 mm2 610 mm2 815mm2
Jednostki cieniujące 15 24 56 56 80
Rdzenie CUDA 2880 3072 3584 3584 5120
FP64 CUDA Cores / SM 64 4 32 32 32
FP64 CUDA Cores / GPU 960 96 1792 1792 2560
Zegar bazowy 745 MHz 948 MHz TBD TBD TBD
Zegar Boost 875 MHz 1114 MHz 1300MHz 1300MHz 1370 MHz
Obliczenia FP16 N/A N/A 18.7 TFLOPs 18.7 TFLOPs 28.0 TFLOPs
Obliczenia FP32 5.04 TFLOPs 6.8 TFLOPs 10.0 TFLOPs 10.0 TFLOPs 14.0 TFLOPs
Obliczenia FP64 1.68 TFLOPs 0.2 TFLOPs 4.7 TFLOPs 4.7 TFLOPs 7.0 TFLOPs
Jednostki teksturujące 240 192 224 224 320
Interfejs pamięci 384-bit GDDR5 384-bit GDDR5 4096-bit HBM2 4096-bit HBM2 4096-bit HBM2
Wielkość pamięci 12 GB GDDR5 @ 288 GB/s 24 GB GDDR5 @ 288 GB/s 12 GB HBM2 @ 549 GB/s 16 GB HBM2 @ 732 GB/s 16 GB HBM2 @ 900 GB/s
L2 Cache 1536 KB 3072 KB 4096 KB 4096 KB 6144 KB
TDP 235W 250W 250W 250W 250W