Template:Nvidia Tesla
外观
型号 | 微架構 | 发布时间 | 芯片 | 核心 频率 |
渲染器 | 内存 | 算力[a] | CUDA 运算能力[b] |
热设计功耗 | 注释/ 外形尺寸 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CUDA核心 (总数) |
基础 频率 |
最大 增强 频率[c] |
总线 类型 |
总线字长 | 容量大小 | 频率 | 带宽 | 半精度 Tensor Core FP32 累加 | 單精度 (MAD或FMA) |
雙精度 (FMA) | ||||||||
单位 | MHz | MHz | MHz | bit | GB | MT/s | GB/s | GFLOPs | GFLOPs | GFLOPs | W | |||||||
C870 GPU Computing Module[d] | Tesla | 2007年 5月2日 |
1× G80 | 600 | 128 | 1350 | 不適用 | GDDR3 | 384 | 1.5 | 1600 | 76.8 | 否 | 345.6 | 否 | 1.0 | 170.9 | Internal PCIe GPU (full-height, dual-slot) |
D870 Deskside Computer[d] | 2007年 5月2日 |
2× G80 | 600 | 256 | 1350 | 不適用 | GDDR3 | 2× 384 | 2× 1.5 | 1600 | 2× 76.8 | 否 | 691.2 | 否 | 1.0 | 520 | Deskside or 3U 19-inch rack external GPUs | |
S870 GPU Computing Server[d] | 2007年 5月2日 |
4× G80 | 600 | 512 | 1350 | 不適用 | GDDR3 | 4× 384 | 4× 1.5 | 1600 | 4× 76.8 | 否 | 1382.4 | 否 | 1.0 | 1U 19-inch rack external GPUs, connect via 2× PCIe (×16) | ||
C1060 GPU Computing Module[e] | 2009年 4月9日 |
1× GT200 | 602 | 240 | 1296[2] | 不適用 | GDDR3 | 512 | 4 | 1600 | 102.4 | 否 | 622.08 | 77.76 | 1.3 | 187.8 | Internal PCIe GPU (full-height, dual-slot) | |
S1070 GPU Computing Server "400 configuration"[e] | 2008年 6月1日 |
4× GT200 | 602 | 960 | 1296 | 不適用 | GDDR3 | 4× 512 | 4× 4 | 1538.4 | 4× 98.5 | 否 | 2488.3 | 311.0 | 1.3 | 800 | 1U 19-inch rack external GPUs, connect via 2× PCIe (×8 or ×16) | |
S1070 GPU Computing Server "500 configuration"[e] | 1440 | 不適用 | 否 | 2764.8 | 345.6 | |||||||||||||
S1075 GPU Computing Server[e][3] | 2008年 6月1日 |
4× GT200 | 602 | 960 | 1440 | 不適用 | GDDR3 | 4× 512 | 4× 4 | 1538.4 | 4× 98.5 | 否 | 2764.8 | 345.6 | 1.3 | 1U 19-inch rack external GPUs, connect via 1× PCIe (×8 or ×16) | ||
Quadro Plex 2200 D2 Visual Computing System[f] | 2008年 7月25日 |
2× GT200GL | 648 | 480 | 1296 | 不適用 | GDDR3 | 2× 512 | 2× 4 | 1600 | 2× 102.4 | 否 | 1244.2 | 155.5 | 1.3 | Deskside or 3U 19-inch rack external GPUs with 4 dual-link DVI outputs | ||
Quadro Plex 2200 S4 Visual Computing System[f] | 2008年 7月25日 |
4× GT200GL | 648 | 960 | 1296 | 不適用 | GDDR3 | 4× 512 | 4× 4 | 1600 | 4× 102.4 | 否 | 2488.3 | 311.0 | 1.3 | 1200 | 1U 19-inch rack external GPUs, connect via 2× PCIe (×8 or ×16) | |
C2050 GPU Computing Module[4] | Fermi | 2011年 7月25日 |
1× GF100 | 575 | 448 | 1150 | 不適用 | GDDR5 | 384 | 3[g] | 3000 | 144 | 否 | 1030.4 | 515.2 | 2.0 | 247 | Internal PCIe GPU (full-height, dual-slot) |
M2050 GPU Computing Module[5] | 2011年 7月25日 |
不適用 | 3092 | 148.4 | 否 | 225 | ||||||||||||
C2070 GPU Computing Module[4] | July 25, 2011 | 1× GF100 | 575 | 448 | 1150 | 不適用 | GDDR5 | 384 | 6[g] | 3000 | 144 | 否 | 1030.4 | 515.2 | 2.0 | 247 | Internal PCIe GPU (full-height, dual-slot) | |
C2075 GPU Computing Module[6] | 2011年 7月25日 |
不適用 | 3000 | 144 | 否 | 225 | ||||||||||||
M2070/M2070Q GPU Computing Module[7] | 2011年 7月25日 |
不適用 | 3132 | 150.336 | 否 | 225 | ||||||||||||
M2090 GPU Computing Module[8] | 2011年 7月25日 |
1× GF110 | 650 | 512 | 1300 | 不適用 | GDDR5 | 384 | 6[g] | 3700 | 177.6 | 否 | 1331.2 | 665.6 | 2.0 | 225 | Internal PCIe GPU (full-height, dual-slot) | |
S2050 GPU Computing Server | 2011年 7月25日 |
4× GF100 | 575 | 1792 | 1150 | 不適用 | GDDR5 | 4× 384 | 4× 3[g] | 3 | 4× 148.4 | 否 | 4121.6 | 2060.8 | 2.0 | 900 | 1U 19-inch rack external GPUs, connect via 2× PCIe (×8 or ×16) | |
S2070 GPU Computing Server | 不適用 | 4× 6[g] | 否 | |||||||||||||||
K10 GPU accelerator[9] | Kepler | 2012年 5月1日 |
2× GK104 | 不適用 | 3072 | 745 | ? | GDDR5 | 2× 256 | 2× 4 | 5000 | 2× 160 | 否 | 4577 | 190.7 | 3.0 | 225 | Internal PCIe GPU (full-height, dual-slot) |
K20 GPU accelerator[10][11] | 2012年 11月12日 |
1× GK110 | 不適用 | 2496 | 706 | 758 | GDDR5 | 320 | 5 | 5200 | 208 | 否 | 3524 | 1175 | 3.5 | 225 | Internal PCIe GPU (full-height, dual-slot) | |
K20X GPU accelerator[12] | 2012年 11月12日 |
1× GK110 | 不適用 | 2688 | 732 | ? | GDDR5 | 384 | 6 | 5200 | 250 | 否 | 3935 | 1312 | 3.5 | 235 | Internal PCIe GPU (full-height, dual-slot) | |
K40 GPU accelerator[13] | 2013年 10月8日 |
1× GK110B | 不適用 | 2880 | 745 | 875 | GDDR5 | 384 | 12[g] | 6000 | 288 | 否 | 4291–5040 | 1430–1680 | 3.5 | 235 | Internal PCIe GPU (full-height, dual-slot) | |
K80 GPU accelerator[14] | 2014年 11月17日 |
2× GK210 | 不適用 | 4992 | 560 | 875 | GDDR5 | 2× 384 | 2× 12 | 5000 | 2× 240 | 否 | 5591–8736 | 1864–2912 | 3.7 | 300 | Internal PCIe GPU (full-height, dual-slot) | |
M4 GPU accelerator[15][16] | Maxwell | 2015年 11月10日 |
1× GM206 | 不適用 | 1024 | 872 | 1072 | GDDR5 | 128 | 4 | 5500 | 88 | 否 | 1786–2195 | 55.81–68.61 | 5.2 | 50–75 | Internal PCIe GPU (half-height, single-slot) |
M6 GPU accelerator[17] | 2015年 8月30日 |
1× GM204-995-A1 | 不適用 | 1536 | 722 | 1051 | GDDR5 | 256 | 8 | 4600 | 147.2 | 否 | 2218–3229 | 69.3–100.9 | 5.2 | 75–100 | Internal MXM GPU | |
M10 GPU accelerator[18] | 4× GM107 | 不適用 | 2560 | 1033 | ? | GDDR5 | 4× 128 | 4× 8 | 5188 | 4× 83 | 否 | 5289 | 165.3 | 5.2 | 225 | Internal PCIe GPU (full-height, dual-slot) | ||
M40 GPU accelerator[16][19] | 2015年 11月10日 |
1× GM200 | 不適用 | 3072 | 948 | 1114 | GDDR5 | 384 | 12 | 6000 | 288 | 否 | 5825–6844 | 182.0–213.9 | 5.2 | 250 | Internal PCIe GPU (full-height, dual-slot) | |
M60 GPU accelerator[20] | 2015年 8月30日 |
2× GM204-895-A1 | 不適用 | 4096 | 899 | 1178 | GDDR5 | 2× 256 | 2× 8 | 5000 | 2× 160 | 否 | 7365–9650 | 230.1–301.6 | 5.2 | 225–300 | Internal PCIe GPU (full-height, dual-slot) | |
P4 GPU accelerator[21] | Pascal | 2016年 9月13日 |
1× GP104 | 不適用 | 2560 | 810 | 1063 | GDDR5 | 256 | 8 | 6000 | 192.0 | 否 | 4147–5443 | 129.6–170.1 | 6.1 | 50-75 | PCI Express card |
P6 GPU accelerator[22][23] | 2017年 3月24日 |
1× GP104-995-A1 | 不適用 | 2048 | 1012 | 1506 | GDDR5 | 256 | 16 | 3003 | 192.2 | 否 | 6169 | 192.8 | 6.1 | 90 | 行動PCI Express模組 card | |
P40 GPU accelerator[21] | 2016年 9月13日 |
1× GP102 | 不適用 | 3840 | 1303 | 1531 | GDDR5 | 384 | 24 | 7200 | 345.6 | 否 | 10007–11758 | 312.7–367.4 | 6.1 | 250 | PCI Express card | |
P100 GPU accelerator (mezzanine)[24][25] | 2016年 4月5日 |
1× GP100-890-A1 | 不適用 | 3584 | 1328 | 1480 | HBM2 | 4096 | 16 | 1430 | 732 | 否 | 9519–10609 | 4760–5304 | 6.0 | 300 | NVLink card | |
P100 GPU accelerator (16 GB card)[26] | 2016年 6月20日 |
1× GP100 | 不適用 | 1126 | 1303 | 否 | 8071‒9340 | 4036‒4670 | 250 | PCI Express card | ||||||||
P100 GPU accelerator (12 GB card)[26] | 2016年 6月20日 |
不適用 | 3072 | 12 | 549 | 否 | 8071‒9340 | 4036‒4670 | ||||||||||
V100 GPU accelerator (mezzanine)[27][28][29] | Volta | 2017年 5月10日 |
1× GV100-895-A1 | 不適用 | 5120 | 未知 | 1,455 | HBM2 | 4,096 | 16 or 32 | 1,750 | 900 | 119,192 | 14,899 | 7,450 | 7.0 | 300 | SXM card |
V100 GPU accelerator (PCIe card)[27][28][29] | 2017年 6月21日 |
1× GV100 | 不適用 | 未知 | 1,370 | 112,224 | 14,028 | 7,014 | 250 | PCIe card | ||||||||
V100 GPU accelerator (PCIe FHHL card) | 2018年 3月27日 |
1× GV100 | 不適用 | 937 | 1,290 | 16 | 1,620 | 829.44 | 105,680 | 13,210 | 6,605 | 250 | PCIe FHHL card | |||||
T4 GPU accelerator (PCIe card)[30][31] | Turing | 2018年 9月12日 |
1× TU104-895-A1 | 不適用 | 2,560 | 585 | 1,590 | GDDR6 | 256 | 16 | 5,000 | 320 | 64,800 | 8,100 | 未知 | 7.5 | 70 | PCIe card |
A2 GPU accelerator (PCIe card)[32] | Ampere | 2021年 11月10日 |
1× GA107 | 不適用 | 1,280 | 1,440 | 1,770 | GDDR6 | 128 | 16 | 6,252 | 200 | 18,124 | 4,531 | 140 | 8.6 | 40-60 | PCIe card (half height, single-slot) |
A10 GPU accelerator (PCIe card)[33] | 2021年 4月12日 |
1× GA102-890-A1 | 不適用 | 9,216 | 885 | 1,695 | GDDR6 | 384 | 24 | 6,252 | 600 | 124,960 | 31,240 | 976 | 8.6 | 150 | PCIe card (single-slot) | |
A16 GPU accelerator (PCIe card)[34] | 2021年 4月12日 |
4× GA107 | 不適用 | 4× 1,280 | 885 | 1,695 | GDDR6 | 4× 128 | 4× 16 | 7,242 | 4× 200 | 4x 18,432 | 4× 4,608 | 1,084.8 | 8.6 | 250 | PCIe card (dual-slot) | |
A30 GPU accelerator (PCIe card)[35] | 2021年 4月12日 |
1× GA100 | 不適用 | 3,584 | 930 | 1,440 | HBM2 | 3,072 | 24 | 1,215 | 933.1 | 165,120 | 10,320 | 5,161 | 8.0 | 165 | PCIe card (dual-slot) | |
A40 GPU accelerator (PCIe card)[36] | 2020年 10月5日 |
1× GA102 | 不適用 | 10,752 | 1,305 | 1,740 | GDDR6 | 384 | 48 | 7,248 | 695.8 | 149,680 | 37,420 | 1,168 | 8.6 | 300 | PCIe card (dual-slot) | |
A100 GPU accelerator (PCIe card)[37][38] | 2020年 5月14日[39] |
1× GA100-883AA-A1 | 不適用 | 6,912 | 765 | 1410 | HBM2 | 5,120 | 40 or 80 | 1,215 | 1,555 | 312,000 | 19,500 | 9,700 | 8.0 | 250 | PCIe card (dual-slot) | |
H100 GPU accelerator (PCIe card)[40] | Hopper | 2022年 3月22日[41] |
1× GH100[42] | 不適用 | 14,592 | 1,065 | 1,755 CUDA 1620 TC | HBM2e | 5120 | 80 | 1,000 | 2,039 | 756,449 | 51,200 | 25,600 | 9.0 | 350 | PCIe card (dual-slot) |
H100 GPU accelerator (SXM card) | 不適用 | 16,896 | 1,065 | 1,980 CUDA 1,830 TC | HBM3 | 5,120 | 80 | 1,500 | 3,352 | 989,430 | 66,900 | 33,500 | 9.0 | 700 | SXM card | |||
L40 GPU accelerator[43] | Ada Lovelace | 2022年 10月13日 |
1× AD102[44] | 不適用 | 18,176 | 735 | 2,490 | GDDR6 | 384 | 48 | 2,250 | 864 | 362,066 | 90,516 | 1,414 | 8.9 | 300 | PCIe card (dual-slot) |
L4 GPU accelerator[45][46] | 2023年 3月21日[47] |
1x AD104[48] | 不適用 | 7,424 | 795 | 2,040 | GDDR6 | 192 | 24 | 1,563 | 300 | 121,000 | 30,300 | 490 | 8.9 | 72 | HHHL single slot PCIe card | |
型号 | 微架構 | 发布时间 | 芯片 | 核心 频率 |
渲染器 | 内存 | 算力[a] | CUDA 运算能力 |
热设计功耗 | 注释/ 外形尺寸 | ||||||||
CUDA核心 (总数) |
基础 频率 |
最大 增强 频率[c] |
总线 类型 |
总线字长 | 容量大小 | 频率 | 带宽 | 半精度 Tensor Core FP32 累加 | 單精度 (MAD或FMA) |
雙精度 (FMA) |
注释:
- ^ 1.0 1.1 To calculate the processing power see Tesla (微架构), 費米微架構, Kepler (微架构), Maxwell (microarchitecture), or 帕斯卡 (微架构). A number range specifies the minimum and maximum processing power at, respectively, the base clock and maximum boost clock.
- ^ Core architecture version according to the CUDA programming guide.
- ^ 3.0 3.1 GPU Boost is a default feature that increases the core clock rate while remaining under the card's predetermined power budget. Multiple boost clocks are available, but this table lists the highest clock supported by each card.[1]
- ^ 4.0 4.1 4.2 Specifications not specified by Nvidia assumed to be based on the NVIDIA GeForce 8GTX
- ^ 5.0 5.1 5.2 5.3 Specifications not specified by Nvidia assumed to be based on the NVIDIA GeForce 200
- ^ 6.0 6.1 Specifications not specified by Nvidia assumed to be based on the Quadro FX 5800
- ^ 7.0 7.1 7.2 7.3 7.4 7.5 With ECC on, a portion of the dedicated memory is used for ECC bits, so the available user memory is reduced by 12.5%. (e.g. 4 GB total memory yields 3.5 GB of user available memory.)
参考资料
- ^ Nvidia GPU Boost For Tesla (PDF). January 2014 [7 December 2015]. (原始内容存档 (PDF)于2020-05-16).
- ^ Tesla C1060 Computing Processor Board (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24).
- ^ Difference between Tesla S1070 and S1075. 31 October 2008 [January 29, 2017]. (原始内容存档于2012-02-26).
S1075 has one interface card
- ^ 4.0 4.1 Tesla C2050 and Tesla C2070 Computing Processor (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24).
- ^ Tesla M2050 and Tesla M2070/M2070Q Dual-Slot Computing Processor Modules (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24).
- ^ Tesla C2075 Computing Processor Board (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24).
- ^ Hand, Randall. NVidia Tesla M2050 & M2070/M2070Q Specs OnlineVizWorld.com. VizWorld.com. 2010-08-23 [2015-12-11]. (原始内容存档于2020-08-17).
- ^ Tesla M2090 Dual-Slot Computing Processor Module (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-10-26).
- ^ Tesla K10 GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24).
- ^ Tesla K20 GPU active accelerator (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2017-07-12).
- ^ Tesla K20 GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-03-26).
- ^ Tesla K20X GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24).
- ^ Tesla K40 GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-06-17).
- ^ Tesla K80 GPU accelerator (PDF). Images.nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2018-07-12).
- ^ Nvidia Announces Tesla M40 & M4 Server Cards - Data Center Machine Learning. Anandtech.com. [2015-12-11]. (原始内容存档于2020-11-08).
- ^ 16.0 16.1 Accelerating Hyperscale Datacenter Applications with Tesla GPUs | Parallel Forall. Devblogs.nvidia.com. 2015-11-10 [2015-12-11]. (原始内容存档于2017-07-09).
- ^ Tesla M6 (PDF). Images.nvidia.com. [2016-05-28]. (原始内容存档 (PDF)于2020-10-22).
- ^ Tesla M10 (PDF). Images.nvidia.com. [2016-10-29]. (原始内容存档 (PDF)于2017-05-10).
- ^ Tesla M40 (PDF). Images.nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2016-10-21).
- ^ Tesla M60 (PDF). Images.nvidia.com. [2016-05-27]. (原始内容存档 (PDF)于2020-10-22).
- ^ 21.0 21.1 Smith, Ryan. Nvidia Announces Tesla P40 & Tesla P4 - Network Inference, Big & Small. Anandtech. 13 September 2016 [13 September 2016]. (原始内容存档于2021-01-16).
- ^ Tesla P6 (PDF). www.nvidia.com. [2019-03-07]. (原始内容存档 (PDF)于2020-07-28).
- ^ Tesla P6 Specs. www.techpowerup.com. [2019-03-07]. (原始内容存档于2020-07-28).
- ^ Smith, Ryan. Nvidia Announces Tesla P100 Accelerator - Pascal GP100 for HPC. Anandtech.com. Anandtech.com. 5 April 2016 [5 April 2016]. (原始内容存档于2016-07-30).
- ^ Harris, Mark. Inside Pascal: Nvidia’s Newest Computing Platform. [13 September 2016]. (原始内容存档于2017-05-07).
- ^ 26.0 26.1 Smith, Ryan. NVidia Announces PCI Express Tesla P100. Anandtech.com. 20 June 2016 [21 June 2016]. (原始内容存档于2020-11-11).
- ^ 27.0 27.1 Smith, Ryan. The Nvidia GPU Technology Conference 2017 Keynote Live Blog. Anandtech. 10 May 2017 [10 May 2017].
- ^ 28.0 28.1 Smith, Ryan. NVIDIA Volta Unveiled: GV100 GPU and Tesla V100 Accelerator Announced. Anandtech. 10 May 2017 [10 May 2017].
- ^ 29.0 29.1 Oh, Nate. NVIDIA Formally Announces V100: Available later this Year. Anandtech.com. 20 June 2017 [20 June 2017].
- ^ NVIDIA TESLA T4 TENSOR CORE GPU. NVIDIA. [17 October 2018].
- ^ NVIDIA Tesla T4 Tensor Core Product Brief (PDF). www.nvidia.com. [2019-07-10].
- ^ NVIDIA TESLA A2 TENSOR CORE GPU.
- ^ NVIDIA TESLA A10 TENSOR CORE GPU.
- ^ NVIDIA TESLA A16 TENSOR CORE GPU.
- ^ NVIDIA TESLA A30 TENSOR CORE GPU.
- ^ NVIDIA TESLA A40 TENSOR CORE GPU.
- ^ NVIDIA TESLA A100 TENSOR CORE GPU. NVIDIA. [14 January 2021].
- ^ NVIDIA Tesla A100 Tensor Core Product Brief (PDF). www.nvidia.com. [2020-09-22].
- ^ Smith, Ryan. NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator. AnandTech. May 14, 2020.
- ^ https://www.nvidia.com/en-us/data-center/h100/
- ^ https://wccftech.com/nvidia-hopper-gh100-gpu-official-5nm-process-worlds-fastest-hpc-chip-80-billion-transistors-hbm3-memory/
- ^ https://www.techpowerup.com/gpu-specs/h100-pcie.c3899
- ^ https://www.nvidia.com/en-us/data-center/l40/
- ^ https://www.techpowerup.com/gpu-specs/l40.c3959
- ^ https://www.nvidia.com/en-us/data-center/l4/
- ^ https://images.nvidia.com/aem-dam/Solutions/Data-Center/l4/nvidia-ada-gpu-architecture-whitepaper-v2.1.pdf
- ^ https://investor.nvidia.com/news/press-release-details/2023/NVIDIA-and-Google-Cloud-Deliver-Powerful-New-Generative-AI-Platform-Built-on-the-New-L4-GPU-and-Vertex-AI/default.aspx
- ^ https://www.techpowerup.com/gpu-specs/l4.c4091