Сравнение NVIDIA A100 PCIe и NVIDIA A40 PCIe

В чем разница между NVIDIA A100 PCIe и NVIDIA A40 PCIe. Узнайте, какая видеокарта имеет лучшую производительность.

Графический процессор (GPU)

GA100Кодовое название графического процессораGA102
AmpereАрхитектураAmpere
TSMCПроизводительSamsung
7 nmТехнологический процесс8 nm
54,200 millionЧисло транзисторов28,300 million
826 mm²Площадь кристалла628 mm²

Видеокарта

Jun 22nd, 2020Дата выходаOct 5th, 2020
Tesla
(Axx)
СемействоTesla
(Axx)
ActiveПроизводствоActive
PCIe 4.0 x16Интерфейс шины данныхPCIe 4.0 x16

Память

40 GBМакс. объем памяти48 GB
HBM2eТип памятиGDDR6
5120 bitРазрядность шины памяти384 bit
1,555 GB/sПропускная способность памяти695.8 GB/s

Производительность

225.6 GPixel/sПиксельная скорость заполнения194.9 GPixel/s
609.1 GTexel/sТекстурная скорость заполнения584.6 GTexel/s
77.97 TFLOPS (4:1)Производительность FP1637.42 TFLOPS (1:1)
19.49 TFLOPSПроизводительность FP3237.42 TFLOPS
9.746 TFLOPS (1:2)Производительность FP641,169 GFLOPS (1:32)

Частоты

765 MHzШтатная частота работы видеочипа1305 MHz
1410 MHzТурбочастота1740 MHz
1215 MHz
2.4 Gbps effective
Частота работы памяти1812 MHz
14.5 Gbps effective

Конфигурация рендера

6912Потоковые процессоры / Ядра CUDA10752
432Текстурные блоки336
160Блоки растеризации112
192 KB (per SM)Кэш L1128 KB (per SM)
40 MBКэш L26 MB
108Потоковые мультипроцессоры84
432Тензорные ядра336

Совместимость и размеры

Dual-slotСовместимый слотDual-slot
267 mm
10.5 inches
Длина267 mm
10.5 inches
250 WЭнергопотребление (TDP)300 W
600 WРекомендуемый блок питания700 W
No outputsВидеоразъемы3x DisplayPort
8-pin EPSДополнительный разъем питания8-pin EPS

Поддержка API

N/ADirectX12 Ultimate (12_2)
N/AOpenGL4.6
3.0OpenCL3.0
N/AVulkan1.2
N/AШейдерная модель6.6
8.0CUDA8.6