Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

NVIDIA GeForce 30系列

NVIDIA GeForce RTX 30系列NVIDIAGeForce RTX 20系列之後开发的圖形處理器系列。於2020年9月1日正式發佈,並於2020年9月17日開始發貨[1]

GeForce RTX 30系列
GeForce RTX 3090 創始版
发布日期2020年9月17日,​4年前​(2020-09-17
代号GA10x
架构Ampere
产品系列GeForce RTX
电晶体
  • 133億 (GA106)
  • 174億 (GA104)
  • 283億 (GA102)
制造工艺三星 8nm
显示卡
中端GPUGeForce RTX 3050
GeForce RTX 3060
行動平台:
RTX 3050
RTX 3050Ti
RTX 3060
高端GPUGeForce RTX 3060 Ti
GeForce RTX 3070
GeForce RTX 3070 Ti
行動平台:
RTX 3070
RTX 3070Ti
旗舰GPUGeForce RTX 3080
GeForce RTX 3080 Ti
GeForce RTX 3090
GeForce RTX 3090 Ti
行動平台:
RTX 3080
RTX 3080Ti
API支持
Direct3DDirect3D 12 Ultimate(12_2)
OpenGLOpenGL 4.6
OpenCLOpenCL 3.0
VulkanVulkan 1.3
历史
前代产品NVIDIA GeForce 20系列
后继产品NVIDIA GeForce 40系列

GeForce 30系列圖形處理器基于安培微架构,擁有第二代光線追踪核心和第三代張量核心,Nvidia稱其運行性能和能效約為之前图灵微架构圖形處理器的两倍[1][2],使用三星电子8纳米工艺制造。

架構特性

编辑

在上一代圖靈架構,引入了分數據類型計算的理念,將整數型(INT32)和單精度浮點型(FP32)兩種不同的數據類型交給兩種不同的ALU進行計算,提高了SM單元的並行計算效率。不過現代遊戲應用中最為常見的還是FP 32計算,INT 32 ALU的使用率比FP 32 ALU的低。為提升計算效率,新一代安培架構引入了可同時支援INT 32和FP 32兩種數據類型的新ALU,取代了原本只支援INT 32計算的ALU。也就是說,現在有兩條不同的數據路徑(Datapath),一條能夠處理整數或單精度浮點,另一條只能處理單精度浮點計算。原本整個SM單元同時可以處理64個INT 32計算指令和64個FP 32計算指令,安培上則是變成128個FP 32計算指令或64個INT 32計算指令和64個FP 32計算指令。為配合規模有一定擴張的計算單元,安培SM的共享緩存/L1數據緩存容量從96KB增長到了128KB,同時其帶寬變為原來的兩倍。

第二代RT Core

编辑

安培微架構的RT Core(Ray Tracing core,光線追踪核心)在圖靈架構的基礎上將三角形求交模塊數量增加到兩個(以並行方式運作),在基礎的BVH計算上面,新一代RT Core也能夠快上2倍。同時,第二代RT Core還增加了一個三角形位置內插模塊,在允許BVH內的數據做少量更新的情況下,就能實現移動物體運動模糊效果的顯著性能提升。在OptiX 7.0 中,開發人員可以為幾何體指定特定的移動路徑,讓每條射線和時間關聯起來,從而實現移動物體的所有運動模糊效果加速。

第三代Tensor Core

编辑

Tensor Core(張量核心)是專門針對深度學習加速設計的矩陣運算單元,可以執行基於深度學習的應用,例如光線追踪降噪和DLSS抗鋸齒渲染。圖靈中每個SM都配有8個Tensor Core(每個子核有兩個Tensor Core),每個Clock(週期)可以執行512個FP16 Tensor操作。而在安培架構,每個SM裡有4個Tensor Core(每個子核有一個Tensor Core),但是每個Tensor Core的處理能力倍增,因此每個SM也能執行512個FP16 Tensor操作。

第三代Tensor Core引入了BF16、TF32 兩種新的數據格式,並引入硬件稀疏化技術,操作的能力上增加一倍達到等效每週期1024 個FP16 操作。

產品

编辑
型號 推出日期 核心代號 製程 電晶體數
&
晶粒面積
核心組態[a] 二級暫存(MB) 時脈頻率 顯示記憶體 填充率 運算效能 (TFLOPS) 匯流排介面 TDP (W) NVLink支援 發售價格 (美金)
預設 (MHz) 加速 (MHz) 記憶體 (MT/s) 容量 (GiB) 頻寬 (GB/s) 類型 介面頻寬 (bit) 像素 (GP/s) 材質 (GT/s) 單精度 雙精度 半精度 張量 (FP16) 光追
GeForce RTX 3050 2022年1月27日 GA106-150-KA-A1 三星
8N
133億

276mm2

2560:80:32:80:28
(20) (3)
2 1552 1777 14000 8 224 GDDR6 128 49.6
56.86
124.1
142.2
7.946
9.098
0.124
0.142
7.946
9.098
PCIe 4.0
x8
130 $249
GeForce RTX 3060[3] 2021年
2月25日
GA106-300-A1 3584:112:48:112:28
(28) (3)
3 1320 15000 12 360.0 192 63.4

85.3

147.8

199.0

9.46

12.74

0.148

0.199

9.46

12.74

25 PCIe 4.0

x16

170 $329
2021年
9月1日
GA104-150-A1[4] 174億

392.5mm2

GeForce RTX 3060 Ti[5] 2020年
12月2日
GA104-200-A1 4864:152:80:152:38
(38) (6)
4 1410 1665 14000 8 448.0 256 112.8

133.2

214.3

253.1

13.72

16.20

0.214

0.253

13.70

16.20

?

129.6

32 200 $399
GeForce RTX 3070[6] 2020年
10月29日[7]
GA104-300-A1 5888:184:96:184:46
(46) (6)
1500 1725 144.0

165.6

276.0

317.4

17.66

20.31

0.276

0.318

17.66

20.37

141.31

162.98

40[8] 220 $499
GeForce RTX 3070 Ti[9] 2021年
6月10日
GA104-400-A1 6144:192:96:192:48
(48) (6)
1575 1770 9500 (19000)[b] 608.3 GDDR6X 151.18

169.9

302.36

339.8

19.35

21.75

0.302

0.340

19.35

21.75

290 $599
GeForce RTX 3080[10] 2020年
9月17日
GA102-200-KD-A1 283億

628.4mm2

8704:272:96:272:68
(68) (7)
5 1440 1710 10 760.0 320 138.2

164.2

391.68

465.12

25.07

29.77

0.392

0.465

25.06

29.76

200.54

238.14

58 320 $699
GeForce RTX 3080 Ti[11] 2021年
6月3日
GA102-225-A1 10240:320:112:320:80
(80) (7)
6 1395 1665 12 912.4 384 153.5

186.5

438.5

532.8

28.57

34.71

0.438

0.533

28.06

34.10

350 $1199
GeForce RTX 3090[12] 2020年
9月24日
GA102-300-A1 10496:328:112:328:82
(82) (7)
1395 1695 9750 (19500)[b] 24 935.8 156.2

189.8

457.6

555.96

29.28

35.58

0.459

0.558

29.38

35.68

235.08

285.48

69[8] 350 2路 NVLink $1499
GeForce RTX 3090 Ti[13] 2022年

3月22日

GA102-350-A1 10752:336:112:336:84

(84)(7)

1560 1860 10500

(21000)

1008 174.7

208.3

524.1

625.0

33.54

39.99

0.524

0.625

33.54

39.99

320 450 $1999
  1. ^ 流處理器數量:纹理映射單元數量:渲染输出单元數量:張量核心數量:光線追蹤核心數量(SM數量)(GPC數量)。面向非专业用途的Ampere架构中每个GPC由16个ROP及最多12个SM组成,每个SM固定包括128个流处理器(单精度浮点处理器)、64个32位长整型处理器、4个TMU、4个张量核心和1个光线追踪核心;GA100核心的浮点处理器配置则略有不同,参见NVIDIA Tesla
  2. ^ 2.0 2.1 类似于早已在闪存行业应用的MLC技术,GDDR6X一次存取可以操作两个比特,括號內用於比較GDDR6的等效傳輸速率

另見

编辑

参考文献

编辑
  1. ^ 1.0 1.1 GeForce Special Event. 英伟达. [September 1, 2020]. (原始内容存档于2020-09-02). 
  2. ^ Walton, Jarred. Nvidia GeForce RTX 3090 and GA102: Everything We Know. Tom's 硬體指南. August 31, 2020. 
  3. ^ NVIDIA GeForce RTX 3060 Graphics Card Announcement. [2021-01-12]. (原始内容存档于2022-02-26). 
  4. ^ Mujtaba, Hassan. Custom GALAX & Gainward GeForce RTX 3060 Cards With NVIDIA Ampere GA104 GPUs Listed. Wccftech. 2021-09-25 [2021-09-25]. (原始内容存档于2021-11-13) (美国英语). 
  5. ^ NVIDIA GeForce RTX 3060 Ti Graphics Card. [2020-12-01]. (原始内容存档于2021-01-12). 
  6. ^ NVIDIA GeForce RTX 3070 Graphics Card. [2020-09-06]. (原始内容存档于2021-05-14). 
  7. ^ GeForce RTX 3070 Availability Update. [2021-11-13]. (原始内容存档于2022-01-11). 
  8. ^ 8.0 8.1 Smith, Ryan. NVIDIA Announces the GeForce RTX 30 Series: Ampere For Gaming, Starting With RTX 3080 & RTX 3090. www.anandtech.com. [2020-09-02]. (原始内容存档于2022-01-12). 
  9. ^ NVIDIA GeForce RTX 3070 Family. [2021-06-02]. (原始内容存档于2022-02-26). 
  10. ^ NVIDIA GeForce RTX 3080 Graphics Card. [2020-09-06]. (原始内容存档于2021-05-19). 
  11. ^ NVIDIA GeForce RTX 3080 Family of Graphics Card. [2021-06-02]. (原始内容存档于2022-03-01). 
  12. ^ NVIDIA GeForce RTX 3090 Graphics Card. [2020-09-06]. (原始内容存档于2022-02-26). 
  13. ^ 3090 & 3090 Ti 顯示卡. www.nvidia.com. [2022-05-12]. (原始内容存档于2022-05-12) (中文(臺灣)). 

外部链接

编辑