Jensen Huang przedstawił światu kartę Tesla V100 podczas konferencji GTC 2017. Jest to pierwszy model na architekturze Volta, wyprodukowany przez tajwańskie fabryki TSMC w procesie technologicznym 12 nm FinFET. Układ posiada 5120 rdzeniu CUDA, 16 GB pamięci HMB2, 6MB pamięci podręcznej oraz 20 MB SM RF. Należy również wspomnieć o złączu NVLink, które ma zapewniać przepustowość 300 GB/s.
Rdzeń składa się z 21 miliardów tranzystorów, które upakowano na powierzchni 815 mm2. Wydajność w obliczeniach pojedynczej precyzji to 15 TFLOPS, a w podwójnej – 7,5 TFLOPS. Jeżeli spojrzeć na poprzednią generację Pascal, jest to aż 40 procentowy wzrost wydajności. Do tego dochodzi bardzo szybka pamięć HBM2.
NVIDIA Tesla V100 | NVIDIA Tesla P100 | |
---|---|---|
Wielkość rdzenia | 815 mm2 | 610 m2 |
Wydajność FP32 | 15.0 TFlops | 10.6 TFlops |
Rdzenie CUDA | 5120 | 3584 |
Zegar rdzenia | 1455 MHz | 1480 MHz |
Typ pamięci | 4096-bit 16 GB HBM2 | 4096-bit 16GB HBM2 |
Interfejs | NVLink 2.0 | NVLink 1.0 / PCI-e 3.0 |
Przepustowość pamięci | 900 GB/s | 720 GB/s |
TDP | 300W | 300W |
NVIDIA Volta GV100
Razem z prezentacją Tesla V100, NVIDIA przedstawiła rdzeń graficzny GV100. Jest to obecnie największa jednostka, jaka kiedykolwiek powstała. Na pokładzie znajduje się aż 5376 rdzeni CUDA.
Do tego dochodzi nowa typ Procesorów Strumieniowych zwanych Volta SM, wyposażonych w rdzenie Tensor Core. Są to specjalistyczne macierze 4x4x4, które są w pełni zoptymalizowane do obliczeń związanych z głębokim uczeniem. Ich maksymalna teoretyczna wydajność może wynosić nawet 120 TFLOPSów.