NVIDIA GeForce 30系列

GeForce RTX 30系列
	GeForce RTX 3090 創始版
发布日期	2020年9月17日，4年前
代号	GA10x
架构	Ampere
产品系列	GeForce RTX
电晶体	133億 (GA106); 174億 (GA104); 283億 (GA102);
制造工艺	三星 8nm
显示卡
中端GPU	GeForce RTX 3050; GeForce RTX 3060; 行動平台：; RTX 3050 ; RTX 3050Ti; RTX 3060
高端GPU	GeForce RTX 3060 Ti; GeForce RTX 3070; GeForce RTX 3070 Ti ; 行動平台：; RTX 3070 ; RTX 3070Ti
旗舰GPU	GeForce RTX 3080; GeForce RTX 3080 Ti; GeForce RTX 3090; GeForce RTX 3090 Ti ; 行動平台：; RTX 3080 ; RTX 3080Ti
API支持
Direct3D	Direct3D 12 Ultimate（12_2）
OpenGL	OpenGL 4.6
OpenCL	OpenCL 3.0
Vulkan	Vulkan 1.3
历史
前代产品	NVIDIA GeForce 20系列
后继产品	NVIDIA GeForce 40系列

NVIDIA GeForce RTX 30系列是NVIDIA继GeForce RTX 20系列之後开发的圖形處理器系列。於2020年9月1日正式發佈，並於2020年9月17日開始發貨^[1]。

GeForce 30系列圖形處理器基于安培微架构，擁有第二代光線追踪核心和第三代張量核心，Nvidia稱其運行性能和能效約為之前图灵微架构圖形處理器的两倍^[1]^[2]，使用三星电子的8纳米工艺制造。

架構特性

在上一代圖靈架構，引入了分數據類型計算的理念，將整數型（INT32）和單精度浮點型（FP32）兩種不同的數據類型交給兩種不同的ALU進行計算，提高了SM單元的並行計算效率。不過現代遊戲應用中最為常見的還是FP 32計算，INT 32 ALU的使用率比FP 32 ALU的低。為提升計算效率，新一代安培架構引入了可同時支援INT 32和FP 32兩種數據類型的新ALU，取代了原本只支援INT 32計算的ALU。也就是說，現在有兩條不同的數據路徑（Datapath），一條能夠處理整數或單精度浮點，另一條只能處理單精度浮點計算。原本整個SM單元同時可以處理64個INT 32計算指令和64個FP 32計算指令，安培上則是變成128個FP 32計算指令或64個INT 32計算指令和64個FP 32計算指令。為配合規模有一定擴張的計算單元，安培SM的共享緩存/L1數據緩存容量從96KB增長到了128KB，同時其帶寬變為原來的兩倍。

第二代RT Core

安培微架構的RT Core(Ray Tracing core,光線追踪核心)在圖靈架構的基礎上將三角形求交模塊數量增加到兩個（以並行方式運作），在基礎的BVH計算上面，新一代RT Core也能夠快上2倍。同時，第二代RT Core還增加了一個三角形位置內插模塊，在允許BVH內的數據做少量更新的情況下，就能實現移動物體運動模糊效果的顯著性能提升。在OptiX 7.0 中，開發人員可以為幾何體指定特定的移動路徑，讓每條射線和時間關聯起來，從而實現移動物體的所有運動模糊效果加速。

第三代Tensor Core

Tensor Core(張量核心)是專門針對深度學習加速設計的矩陣運算單元，可以執行基於深度學習的應用，例如光線追踪降噪和DLSS抗鋸齒渲染。圖靈中每個SM都配有8個Tensor Core(每個子核有兩個Tensor Core)，每個Clock(週期)可以執行512個FP16 Tensor操作。而在安培架構，每個SM裡有4個Tensor Core（每個子核有一個Tensor Core），但是每個Tensor Core的處理能力倍增，因此每個SM也能執行512個FP16 Tensor操作。

第三代Tensor Core引入了BF16、TF32 兩種新的數據格式，並引入硬件稀疏化技術，操作的能力上增加一倍達到等效每週期1024 個FP16 操作。

產品

型號	推出日期	核心代號	製程	電晶體數 & 晶粒面積	核心組態^[a]	二級暫存(MB)	時脈頻率			顯示記憶體				填充率		運算效能 (TFLOPS)					匯流排介面	TDP (W)	NVLink支援	發售價格 (美金)
型號	推出日期	核心代號	製程	電晶體數 & 晶粒面積	核心組態^[a]	二級暫存(MB)	預設 (MHz)	加速 (MHz)	記憶體 (MT/s)	容量 (GiB)	頻寬 (GB/s)	類型	介面頻寬 (bit)	像素 (GP/s)	材質 (GT/s)	單精度	雙精度	半精度	張量 (FP16)	光追	匯流排介面	TDP (W)	NVLink支援	發售價格 (美金)
GeForce RTX 3050	2022年1月27日	GA106-150-KA-A1	三星 8N	133億 276mm²	2560:80:32:80:28 (20) (3)	2	1552	1777	14000	8	224	GDDR6	128	49.6 56.86	124.1 142.2	7.946 9.098	0.124 0.142	7.946 9.098			PCIe 4.0 x8	130	否	$249
GeForce RTX 3060^[3]	2021年 2月25日	GA106-300-A1		133億 276mm²	3584:112:48:112:28 (28) (3)	3	1320		15000	12	360.0		192	63.4 85.3	147.8 199.0	9.46 12.74	0.148 0.199	9.46 12.74		25	PCIe 4.0 x16	170		$329
GeForce RTX 3060^[3]	2021年 9月1日	GA104-150-A1^[4]		174億 392.5mm²	3584:112:48:112:28 (28) (3)	3	1320		15000	12	360.0		192	63.4 85.3	147.8 199.0	9.46 12.74	0.148 0.199	9.46 12.74		25		170		$329
GeForce RTX 3060 Ti^[5]	2020年 12月2日	GA104-200-A1			4864:152:80:152:38 (38) (6)	4	1410	1665	14000	8	448.0		256	112.8 133.2	214.3 253.1	13.72 16.20	0.214 0.253	13.70 16.20	? 129.6	32		200		$399
GeForce RTX 3070^[6]	2020年 10月29日^[7]	GA104-300-A1			5888:184:96:184:46 (46) (6)		1500	1725	14000		448.0			144.0 165.6	276.0 317.4	17.66 20.31	0.276 0.318	17.66 20.37	141.31 162.98	40^[8]		220		$499
GeForce RTX 3070 Ti^[9]	2021年 6月10日	GA104-400-A1			6144:192:96:192:48 (48) (6)		1575	1770	9500 (19000)^[b]		608.3	GDDR6X		151.18 169.9	302.36 339.8	19.35 21.75	0.302 0.340	19.35 21.75				290		$599
GeForce RTX 3080^[10]	2020年 9月17日	GA102-200-KD-A1		283億 628.4mm²	8704:272:96:272:68 (68) (7)	5	1440	1710		10	760.0		320	138.2 164.2	391.68 465.12	25.07 29.77	0.392 0.465	25.06 29.76	200.54 238.14	58		320		$699
GeForce RTX 3080 Ti^[11]	2021年 6月3日	GA102-225-A1			10240:320:112:320:80 (80) (7)	6	1395	1665		12	912.4		384	153.5 186.5	438.5 532.8	28.57 34.71	0.438 0.533	28.06 34.10				350		$1199
GeForce RTX 3090^[12]	2020年 9月24日	GA102-300-A1			10496:328:112:328:82 (82) (7)		1395	1695	9750 (19500)^[b]	24	935.8			156.2 189.8	457.6 555.96	29.28 35.58	0.459 0.558	29.38 35.68	235.08 285.48	69^[8]		350	2路 NVLink	$1499
GeForce RTX 3090 Ti^[13]	2022年 3月22日	GA102-350-A1			10752:336:112:336:84 (84)(7)		1560	1860	10500 (21000)	24	1008			174.7 208.3	524.1 625.0	33.54 39.99	0.524 0.625	33.54 39.99	320			450	2路 NVLink	$1999

^ 流處理器數量：纹理映射單元數量：渲染输出单元數量：張量核心數量：光線追蹤核心數量（SM數量）（GPC數量）。面向非专业用途的Ampere架构中每个GPC由16个ROP及最多12个SM组成，每个SM固定包括128个流处理器（单精度浮点处理器）、64个32位长整型处理器、4个TMU、4个张量核心和1个光线追踪核心；GA100核心的浮点处理器配置则略有不同，参见NVIDIA Tesla
^ ^2.0 ^2.1 类似于早已在闪存行业应用的MLC技术，GDDR6X一次存取可以操作两个比特，括號內用於比較GDDR6的等效傳輸速率

另見

参考文献

^ ^1.0 ^1.1 GeForce Special Event. 英伟达. [September 1, 2020]. （原始内容存档于2020-09-02）.
^ Walton, Jarred. Nvidia GeForce RTX 3090 and GA102: Everything We Know. Tom's 硬體指南. August 31, 2020.
^ NVIDIA GeForce RTX 3060 Graphics Card Announcement. [2021-01-12]. （原始内容存档于2022-02-26）.
^ Mujtaba, Hassan. Custom GALAX & Gainward GeForce RTX 3060 Cards With NVIDIA Ampere GA104 GPUs Listed. Wccftech. 2021-09-25 [2021-09-25]. （原始内容存档于2021-11-13）（美国英语）.
^ NVIDIA GeForce RTX 3060 Ti Graphics Card. [2020-12-01]. （原始内容存档于2021-01-12）.
^ NVIDIA GeForce RTX 3070 Graphics Card. [2020-09-06]. （原始内容存档于2021-05-14）.
^ GeForce RTX 3070 Availability Update. [2021-11-13]. （原始内容存档于2022-01-11）.
^ ^8.0 ^8.1 Smith, Ryan. NVIDIA Announces the GeForce RTX 30 Series: Ampere For Gaming, Starting With RTX 3080 & RTX 3090. www.anandtech.com. [2020-09-02]. （原始内容存档于2022-01-12）.
^ NVIDIA GeForce RTX 3070 Family. [2021-06-02]. （原始内容存档于2022-02-26）.
^ NVIDIA GeForce RTX 3080 Graphics Card. [2020-09-06]. （原始内容存档于2021-05-19）.
^ NVIDIA GeForce RTX 3080 Family of Graphics Card. [2021-06-02]. （原始内容存档于2022-03-01）.
^ NVIDIA GeForce RTX 3090 Graphics Card. [2020-09-06]. （原始内容存档于2022-02-26）.
^ 3090 & 3090 Ti 顯示卡. www.nvidia.com. [2022-05-12]. （原始内容存档于2022-05-12）（中文（臺灣））.

外部链接

GEFORCE RTX 30 SERIES（页面存档备份，存于互联网档案馆）

[a-3] 流處理器數量：纹理映射單元數量：渲染输出单元數量：張量核心數量：光線追蹤核心數量（SM數量）（GPC數量）。面向非专业用途的Ampere架构中每个GPC由16个ROP及最多12个SM组成，每个SM固定包括128个流处理器（单精度浮点处理器）、64个32位长整型处理器、4个TMU、4个张量核心和1个光线追踪核心；GA100核心的浮点处理器配置则略有不同，参见NVIDIA Tesla

[b-11] 2.0 ^2.1 类似于早已在闪存行业应用的MLC技术，GDDR6X一次存取可以操作两个比特，括號內用於比較GDDR6的等效傳輸速率

[geforceSpecialEvent-1] 1.0 ^1.1 GeForce Special Event. 英伟达. [September 1, 2020]. （原始内容存档于2020-09-02）.

[toms3090GA102-2] Walton, Jarred. Nvidia GeForce RTX 3090 and GA102: Everything We Know. Tom's 硬體指南. August 31, 2020.

[4] NVIDIA GeForce RTX 3060 Graphics Card Announcement. [2021-01-12]. （原始内容存档于2022-02-26）.

[5] Mujtaba, Hassan. Custom GALAX & Gainward GeForce RTX 3060 Cards With NVIDIA Ampere GA104 GPUs Listed. Wccftech. 2021-09-25 [2021-09-25]. （原始内容存档于2021-11-13）（美国英语）.

[6] NVIDIA GeForce RTX 3060 Ti Graphics Card. [2020-12-01]. （原始内容存档于2021-01-12）.

[7] NVIDIA GeForce RTX 3070 Graphics Card. [2020-09-06]. （原始内容存档于2021-05-14）.

[8] GeForce RTX 3070 Availability Update. [2021-11-13]. （原始内容存档于2022-01-11）.

[:4-9] 8.0 ^8.1 Smith, Ryan. NVIDIA Announces the GeForce RTX 30 Series: Ampere For Gaming, Starting With RTX 3080 & RTX 3090. www.anandtech.com. [2020-09-02]. （原始内容存档于2022-01-12）.

[10] NVIDIA GeForce RTX 3070 Family. [2021-06-02]. （原始内容存档于2022-02-26）.

[12] NVIDIA GeForce RTX 3080 Graphics Card. [2020-09-06]. （原始内容存档于2021-05-19）.

[13] NVIDIA GeForce RTX 3080 Family of Graphics Card. [2021-06-02]. （原始内容存档于2022-03-01）.

[14] NVIDIA GeForce RTX 3090 Graphics Card. [2020-09-06]. （原始内容存档于2022-02-26）.

[15] 3090 & 3090 Ti 顯示卡. www.nvidia.com. [2022-05-12]. （原始内容存档于2022-05-12）（中文（臺灣））.

[1]

[2]

[a]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[b]

[10]

[11]

[12]

[13]

显示卡
GeForce RTX 3090 創始版
发布日期	2020年9月17日，4年前（2020-09-17）
代号	GA10x
架构	Ampere
产品系列	GeForce RTX
电晶体	133億 (GA106) 174億 (GA104) 283億 (GA102)
制造工艺	三星 8nm
中端GPU	GeForce RTX 3050 GeForce RTX 3060 行動平台： RTX 3050 RTX 3050Ti RTX 3060
高端GPU	GeForce RTX 3060 Ti GeForce RTX 3070 GeForce RTX 3070 Ti 行動平台： RTX 3070 RTX 3070Ti
旗舰GPU	GeForce RTX 3080 GeForce RTX 3080 Ti GeForce RTX 3090 GeForce RTX 3090 Ti 行動平台： RTX 3080 RTX 3080Ti
API支持
Direct3D	Direct3D 12 Ultimate（12_2）
OpenGL	OpenGL 4.6
OpenCL	OpenCL 3.0
Vulkan	Vulkan 1.3
历史
前代产品	NVIDIA GeForce 20系列
后继产品	NVIDIA GeForce 40系列