NVIDIA A100 PCIe contre NVIDIA A40 PCIe
Quelle est la différence entre NVIDIA A100 PCIe et NVIDIA A40 PCIe. Découvrez quelle carte graphique a les meilleures performances.
Processeur graphique (GPU)
GA100 | Nom du GPU | GA102 |
Ampere | Architecture | Ampere |
TSMC | Fabricant | Samsung |
7 nm | Gravure | 8 nm |
54,200 million | Transistors | 28,300 million |
826 mm² | Taille du die | 628 mm² |
Carte graphique
Jun 22nd, 2020 | Date de lancement | Oct 5th, 2020 |
Tesla (Axx) | Famille | Tesla (Axx) |
Active | État de la production | Active |
PCIe 4.0 x16 | Interface du bus | PCIe 4.0 x16 |
Mémoire
40 GB | Taille de la mémoire | 48 GB |
HBM2e | Type de la mémoire | GDDR6 |
5120 bit | Bus mémoire | 384 bit |
1,555 GB/s | Bande passante | 695.8 GB/s |
Performance
225.6 GPixel/s | Taux de remplissage pixel | 194.9 GPixel/s |
609.1 GTexel/s | Taux de remplissage texture | 584.6 GTexel/s |
77.97 TFLOPS (4:1) | Performance FP16 (moitié) | 37.42 TFLOPS (1:1) |
19.49 TFLOPS | Performance FP32 (simple) | 37.42 TFLOPS |
9.746 TFLOPS (1:2) | Performance FP64 (double) | 1,169 GFLOPS (1:32) |
Fréquences
765 MHz | Fréquence de base | 1305 MHz |
1410 MHz | Fréquence Boost | 1740 MHz |
1215 MHz 2.4 Gbps effective | Fréquence de la mémoire | 1812 MHz 14.5 Gbps effective |
Configuration de rendu
6912 | Processeurs de flux / Cœurs CUDA | 10752 |
432 | TMUs | 336 |
160 | ROPs | 112 |
192 KB (per SM) | Cache L1 | 128 KB (per SM) |
40 MB | Cache L2 | 6 MB |
108 | Clusters SM | 84 |
432 | Cœurs Tensor | 336 |
Compatibilité et dimensions
Dual-slot | Format | Dual-slot |
267 mm 10.5 inches | Longueur | 267 mm 10.5 inches |
250 W | Consommation typique de la carte | 300 W |
600 W | Bloc d’alimentation recommandé | 700 W |
No outputs | Connecteurs d’affichage standard | 3x DisplayPort |
8-pin EPS | Connecteur d'alimentation additionnel | 8-pin EPS |
Support de API
N/A | DirectX | 12 Ultimate (12_2) |
N/A | OpenGL | 4.6 |
3.0 | OpenCL | 3.0 |
N/A | Vulkan | 1.2 |
N/A | Shader | 6.6 |
8.0 | CUDA | 8.6 |