郵箱：611661226@qq.com

2020顯卡

發(fā)布時(shí)間: 2023-07-18 16:29 閱讀：文章來源：轉(zhuǎn)載

本內(nèi)容來源于@什么值得買APP，觀點(diǎn)僅代表作者本人｜作者：gaojie20

前言

▲1984年上映，由詹姆斯·卡梅隆導(dǎo)演，阿諾·施瓦辛格主演的《終結(jié)者》豆瓣評分高達(dá)8.2分，其中故事背景中的天網(wǎng)是人類于20世紀(jì)后期創(chuàng)造的以計(jì)算機(jī)為基礎(chǔ)的人工智能防御系統(tǒng)。之后自我意識覺醒，視全人類為威脅。電影劇情中，公元2029年，經(jīng)過核毀滅的地球已由電腦“天網(wǎng)”統(tǒng)治，人類幾乎被消滅殆盡。一個(gè)叫約翰·康納的軍事領(lǐng)袖召集幸存者一起對抗天網(wǎng)，組建了反抗軍組織。

▲其續(xù)集于2003年上映的《終結(jié)者3》片中顯示，天網(wǎng)的算力是60TFLOP/s，也就是每秒60萬億次浮點(diǎn)運(yùn)算。

▲其續(xù)集于2003年上映的《終結(jié)者3》片中顯示，天網(wǎng)的算力是60TFLOP/s，也就是每秒60萬次F浮點(diǎn)運(yùn)算

▲而在2022年的今天，英偉達(dá)最新發(fā)布的Ada Lovelace架構(gòu)新旗艦RTX 4090在3.15 GHz頻率下算力可以達(dá)到100TFLOP，所有也有網(wǎng)友調(diào)侃：看起來無所不能的天網(wǎng)，算力只相當(dāng)于0.6張RTX 4090顯卡。值得尋味的是《終結(jié)者》電影上映時(shí)間是1984年，而世界上第一塊顯卡發(fā)明于1981年，還是8位ISA顯卡。時(shí)間催化科技落地再擊穿曾經(jīng)電影中的科幻數(shù)據(jù)，究竟是劇本預(yù)設(shè)太保守，還是科技進(jìn)步太迅速呢？

NVIDIA Turing GPU 架構(gòu)于 2018 年推出，由TSMC 12nm工藝制造，開創(chuàng)了 3D 圖形和 GPU 加速計(jì)算的未來。圖靈在 PC 游戲、專業(yè)圖形應(yīng)用程序和深度學(xué)習(xí)推理的效率和性能方面取得了重大進(jìn)步。使用新的基于硬件的加速器，Turing 融合了光柵化、實(shí)時(shí)光線追蹤、人工智能和模擬，以在 PC 游戲中實(shí)現(xiàn)令人難以置信的真實(shí)感和電影品質(zhì)的互動體驗(yàn)。

▲兩年后的 2020 年，由Samsung 8nm 8N工藝制造的NVIDIA Ampere 架構(gòu)整合了更強(qiáng)大的 RT 核心和Tensor核心，以及一種新穎的 SM 結(jié)構(gòu)，與 Turing GPU 相比，該結(jié)構(gòu)可提供 2 倍 FP32 時(shí)鐘對時(shí)鐘的性能。這些創(chuàng)新使得 Ampere 架構(gòu)在傳統(tǒng)光柵圖形中的運(yùn)行速度比 Turing 快 1.7 倍，在光線追蹤中的運(yùn)行速度高達(dá) 2 倍。

▲2022年新的 NVIDIA Ada Lovelace GPU 架構(gòu)以數(shù)學(xué)家 Ada Lovelace 命名，他被認(rèn)為是世界上第一位計(jì)算機(jī)程序員，因?yàn)槭褂昧?TSMC 5nm 4N工藝制造，其構(gòu)架規(guī)模遠(yuǎn)遠(yuǎn)超過了 Turing 和 Ampere GPU。幾何復(fù)雜性的增加和照明的創(chuàng)新使圖形看起來比以往任何時(shí)候都更加逼真。與之前的 NVIDIA Ampere GPU 架構(gòu)相比，Ada 在光柵化游戲中的速度高達(dá) 2 倍，在光線追蹤游戲中的速度高達(dá) 4 倍。

Ada 圖形架構(gòu)預(yù)示著第三代 NVIDIA RTX 技術(shù)，通過利用實(shí)時(shí)光線追蹤來提高游戲視覺效果的真實(shí)性，而無需繪制純光線追蹤 3D 圖形所需的大量計(jì)算能力。這是通過將傳統(tǒng)的光柵圖形與光線追蹤元素（例如反射、照明和全局照明等）混合來完成的。第 3 代 RTX 預(yù)示著新的更高 IPC “Ada” CUDA 核心、第 3 代 RT 核心、第 4 代 Tensor 核心和新的光流處理器（Optical Flow Processor），該組件在不涉及 GPU 主圖形的情況下在生成新幀中起關(guān)鍵作用渲染管道。

NVIDIA Ada GPU 完整架構(gòu)

▲完整的 AD102 GPU 包括 12 個(gè)圖形處理集群 (GPC)、72 個(gè)紋理處理集群 (TPC)、144 個(gè)流處理器 (SM) 和一個(gè) 384 位顯存接口以及12 個(gè) 32 位顯存控制器。此外還包括 288 個(gè) FP64 內(nèi)核（每個(gè) SM 2 個(gè)），上圖中未顯示。 FP64 TFLOP 率是 FP32 操作的 TFLOP 率的 1/64。包含少量的 FP64 內(nèi)核以確保任何具有 FP64 代碼的程序都能正確運(yùn)行，其中還包括FP64 Tensor Core 代碼。

完整的 AD102 GPU 使用了12個(gè)GPC單元構(gòu)成，每個(gè)GPC的SM為12個(gè)共144個(gè)SM，所以可以計(jì)算出：

144（SM）*128(CUDA內(nèi)核)=18432(CUDA內(nèi)核)

144（SM）*1（RT核心）=144（RT核心）

144（SM）*4（Tensor核心）=576（Tensor核心）

144（SM）*4（TMUs紋理單元）=576（TMUs紋理單元）

12（GPC）*16（ROPs光柵單元）=192（ROPs光柵單元）

12（顯存控制器）*32bit（位寬）=384bit（顯存位寬）

和上一代第一款首發(fā)產(chǎn)品RTX 3090一樣，RTX 4090不是完整版核心，而是配備了這一代的第一款 Ada Lovelace GPU： AD102-300-A1。

NVIDIA AD102-300-A1 GPU架構(gòu)

▲盡管這張旗艦卡中使用的芯片并不是完整的核心，AD102依然擁有128 個(gè)流式多處理器 (SM) ，包含16384 個(gè) CUDA 內(nèi)核。

RTX 4090的AD102-300-A1核心

▲RTX 4090使用了11個(gè)GPC單元構(gòu)成，9個(gè)GPC的SM為12個(gè)，2個(gè)GPC的SM為10個(gè)，共144個(gè)SM。所以可以計(jì)算出：

128（SM）*128(CUDA內(nèi)核)=16384(CUDA內(nèi)核)

128（SM）*1（RT核心）=128（RT核心）

128（SM）*4（Tensor核心）=512（Tensor核心）

128（SM）*4（TMUs紋理單元）=512（TMUs紋理單元）

11（GPC）*16（ROPs光柵單元）=176（ROPs光柵單元）

12（顯存控制器）*32bit（位寬）=384bit（顯存位寬）

Ada的圖形處理集群 (GPC)

▲Ada的圖形處理集群 (GPC)包含1個(gè)光柵引擎，6 個(gè) TPC、12 個(gè) SM 和 16 個(gè) ROP。

GPC 是所有 AD10x Ada 系列 GPU 中占主導(dǎo)地位的高級硬件模塊，所有關(guān)鍵圖形處理單元都位于 GPC 中。每個(gè) GPC 包括一個(gè)專用的光柵引擎、兩個(gè)光柵操作 (ROP) 分區(qū)，每個(gè)分區(qū)包含八個(gè)單獨(dú)的 ROP 單元和六個(gè) TPC。每個(gè) TPC 包括一個(gè) PolyMorph 引擎和兩個(gè) SM。

AD10x GPU 中的每個(gè) SM 包含 128 個(gè) CUDA 核心、1個(gè) Ada 第三代 RT 核心、4個(gè) Ada 第四代Tensor 核心、四個(gè)紋理單元、一個(gè) 256 KB 寄存器和 128 KB 的 L1/共享緩存。

Ampere 架構(gòu)的第2代RT Core

▲Ampere 架構(gòu)的第2代RT Core圖中，BVH 遍歷由 Box Intersection Engine （左側(cè)）加速，光線-三角形相交測試由 Box Intersection Engine 加速三角形相交引擎（右側(cè)）。通過兩者為光線追蹤功能提供專用資源，從而解放SM單元，使其騰出時(shí)間來執(zhí)行其他像素、頂點(diǎn)和計(jì)算著色任務(wù)。在使用綜合基準(zhǔn)測試以及真實(shí)游戲和應(yīng)用程序進(jìn)行測試時(shí)，Turing 和 Ampere GPU 中的 RT Core 已被證明是迄今為止處理 RT 工作負(fù)載的性能最高的引擎。

Ada 架構(gòu)的第3代RT Core

▲Ada 架構(gòu)的第3代RT Core，在繼承了第2代的兩個(gè)功能單元之外，新增了Opacity Micromap Engine （左下）和 Displaced Micro-Mesh Engine （右下）這兩個(gè)專用單元。

葉子或火焰等復(fù)雜形狀通常使用紋理中的 alpha 通道來表示透明度和不透明度的級別

▲在 Ada 的 RT Core 之前，開發(fā)人員可以通過將某些內(nèi)容標(biāo)記為不透明來將它們合并到光線追蹤場景中。當(dāng)葉子被光線擊中時(shí)，將調(diào)用著色器來確定如何處理相交，即使光線只是簡單地表征為命中或未命中。這會產(chǎn)生很大的計(jì)算資源開銷。具體來說，當(dāng)光線扭曲投射到非透明對象時(shí)，單個(gè)光線查詢可能需要多次著色器調(diào)用才能解析，而其他光線會立即終止。結(jié)果是資源開銷大以及效率低下。

為了有效處理此類內(nèi)容，NVIDIA 工程師在 Ada 的 RT Core 中添加了 Opacity Micromap Engine。不透明微圖是微三角形的虛擬網(wǎng)格，每個(gè)微三角形都具有不透明狀態(tài)，RT Core 使用該狀態(tài)直接解析與非透明三角形的光線交叉點(diǎn)。具體而言，交叉點(diǎn)的重心坐標(biāo)用于處理相應(yīng)的微三角形的不透明度狀態(tài)。不透明狀態(tài)可以是不透明的、透明的或未知的。如果不透明，則記錄并返回命中。如果透明，則忽略交叉點(diǎn)并繼續(xù)搜索交叉點(diǎn)。如果未知，則將控制權(quán)返回給 SM，調(diào)用著色器（“anyhit”）以編程方式解決交集。

新的Opacity Micromap Engine處理不透明度蒙版時(shí)，將其劃分為規(guī)則的三角形網(wǎng)格，用于報(bào)告光線/三角形交點(diǎn)的重心坐標(biāo)。這些網(wǎng)格的大小可以是1到1600萬個(gè)微三角形，每個(gè)微三角形有1-2bit。

▲考慮使用兩個(gè)三角形和一個(gè) alpha 紋理描述的詳細(xì)楓葉（參見子圖 (a)）。不透明蒙版應(yīng)用于由 2 個(gè)三角形組成的楓葉。Opacity Micromap Engine評估葉子并確定哪些部分是不透明的、透明的或未知的，對應(yīng)葉子的不透明區(qū)域，最后紅色和藍(lán)色對應(yīng)混合不透明區(qū)域（未知）。在上面的示例中，Opacity Micromap Engine將微型三角形的 30 個(gè)標(biāo)記為透明，41 個(gè)標(biāo)記為不透明，57 個(gè)標(biāo)記為未知。這意味著超過一半的葉子被完全表征，并且超過一半的與這些三角形相交的光線要么錯過了葉子，要么明確地與葉子的內(nèi)部相交。結(jié)果是，Ada RT Core 無需調(diào)用任何著色器代碼即可完全表征這些光線，同時(shí)保留原始 Alpha 紋理的完整分辨率和保真度。不過當(dāng)處于未知狀態(tài)時(shí)，GPU會將控制權(quán)返回給SM著色器進(jìn)行解析。

▲與 Ampere 相比，Ada 的 Opacity Micromap Engine 與不透明蒙版減少了SM著色器工作負(fù)載，通常投射在 alpha通道中的測試幾何體上的陰影光線會看到最大的收益。 Ada 的不透明蒙版支持可以顯著增加場景中詳細(xì)幾何圖形的數(shù)量和保真度，從而提高真實(shí)感。借助這項(xiàng)新功能，它將 alpha 遍歷速度提高了 2 倍。開發(fā)人員可以非常快速地將不透明度值分配給不規(guī)則形狀的物體（如蕨類植物和柵欄）或半透明的物品（如火焰或煙霧），從而允許 Ada RT Core 直接對對 alpha 測試紋理進(jìn)行光線追蹤，而不是依賴 GPU 的 SM著色器單元。大幅提升對 alpha 測試紋理進(jìn)行光線追蹤的速度。

▲集成到 Ada RT Core 中的第2個(gè)新硬件單元是 Displaced Micro-Mesh Engine，旨在減少處理具有高水平幾何細(xì)節(jié)的復(fù)雜對象時(shí)傳統(tǒng)上所需的 BVH 構(gòu)建時(shí)間和存儲要求。有了這個(gè)新功能，NVIDIA開發(fā)了一種新的位移微網(wǎng)格原語來進(jìn)行光線追蹤。當(dāng)需要額外的幾何細(xì)節(jié)時(shí)，Displaced Micro-Mesh Engine可以根據(jù)需要動態(tài)生成額外的微三角形。與傳統(tǒng)渲染這些復(fù)雜對象相比，Displaced Micro-Mesh Engine將 BVH 構(gòu)建時(shí)間縮短了 10 倍，同時(shí)將 BVH 存儲需求降低了 20 倍。

Ada 流處理器 (SM)

▲與之前的Ampere一樣，Ada SM 分為四個(gè)分區(qū)，每個(gè)分區(qū)包含一個(gè) 64 KB 寄存器、一個(gè) L0 指令緩存、一個(gè) warp 調(diào)度程序、一個(gè)調(diào)度單元，16 個(gè)專門用于處理 FP32 操作的 CUDA 內(nèi)核（每個(gè)時(shí)鐘最多 16 個(gè) FP32 操作），16 個(gè)可以處理 FP32 或 INT32 操作的 CUDA 內(nèi)核（每個(gè)時(shí)鐘 16 個(gè) FP32 操作或每個(gè)時(shí)鐘 16 個(gè) INT32 操作），一個(gè) Ada 第4代Tensor 核心、四個(gè)加載/存儲單元和一個(gè)執(zhí)行先驗(yàn)和圖形插值指令的特殊功能單元 (SFU)。

Ada SM 包含 128 KB 的 1 級緩存。該緩存采用統(tǒng)一架構(gòu)，可根據(jù)工作負(fù)載配置為 L1 數(shù)據(jù)緩存或共享內(nèi)存。完整的AD102 GPU 包含 18432 KB 的 L1 緩存，而Ampere構(gòu)架中完整的GA102 僅有 10752 KB。

與 Ampere 相比，Ada 的 2 級緩存進(jìn)行了徹底改造。 AD102 配備了 98304 KB 的二級緩存，比 GA102 中的 6144 KB 提高了 16 倍。這會讓所有應(yīng)用程序都受益，而諸如光線追蹤之類的復(fù)雜操作最為受益。

▲Ada GPU升級的第4代Tensor 核心為現(xiàn)有 FP16、BF16、TF32 和 INT8 格式提供雙倍的吞吐量，其第4代Tensor 核心引入了對新 FP8 的支持。與 FP16 相比，F(xiàn)P8 的數(shù)據(jù)存儲需求減半，吞吐量翻倍。借助新的 FP8 格式，GeForce RTX 4090 可為 AI 推理工作負(fù)載提供 1.3 PetaFLOPS 的性能。

▲NVIDIA DLSS 3 是 AI 驅(qū)動圖形領(lǐng)域的革命性突破，可大幅提升性能。DLSS 3 由 GeForce RTX 40 系列 GPU 所搭載的全新第四代 Tensor Core 和光流加速器提供支持，可利用 AI 創(chuàng)造更多高質(zhì)量幀。

▲基于 Ada 架構(gòu)的全新顯卡配備了支持 AV1 編碼的全新第八代 NVIDIA 編碼器 (NVENC)，可為主播、廣播愛好者和視頻通話用戶帶來更多新的嘗試和體驗(yàn)。該技術(shù)的效率比 H.264 高 40%，這有助于主播在保持直播推流比特率不變的情況下，將畫面分辨率從 1080p 提高到 1440p，且畫質(zhì)依然穩(wěn)定。

開箱

▲ PNY是一家美商公司，中文名：必恩威，成立于 1985 年，是致力于消費(fèi)和商業(yè)級電子制造的全球技術(shù)領(lǐng)導(dǎo)者。PNY 擁有 30 多年為全球消費(fèi)者、B2B 和 OEM 提供服務(wù)的經(jīng)驗(yàn)。產(chǎn)品在北美、拉丁美洲、歐洲和亞洲的 50 多個(gè)國家和地區(qū)設(shè)有 20 家公司，在全球主要零售店、電子零售店、批發(fā)商和分銷商處銷售。產(chǎn)品組合包括種類繁多的 USB 閃存驅(qū)動器、閃存卡、PC 內(nèi)存升級、固態(tài)驅(qū)動器、NVIDIA? 顯卡和 HP 閃存產(chǎn)品。憑借面向移動、數(shù)字成像、計(jì)算和游戲解決方案的產(chǎn)品。

其實(shí)我對PNY的了解，還是因?yàn)樵诒泵赖腷estbuy海淘Quadro專業(yè)顯卡，PNY在北美是Quadro和Tesla的獨(dú)家代理商，這個(gè)定位非常類似中國的麗臺，2020年開始銷售的Geforce RTX 3000系列消費(fèi)級顯示卡基本和國內(nèi)麗臺銷售的外形是非常類似的，因?yàn)槎际荘alit代工出品，2021年底開始獨(dú)立研發(fā)生產(chǎn)顯示卡，那么RTX 4000就是PNY獨(dú)立研發(fā)生產(chǎn)顯示卡的開山之作。

▲而XLR8 Gaming系列就是PNY所規(guī)劃的游戲系列產(chǎn)品，當(dāng)然PNY GeForce RTX 4090 24GB OC XLR8 Gaming Verto EPIC-X RGB? TF就是PNY目前出品的消費(fèi)級旗艦顯卡。

▲包裝正面

▲包裝背面

▲包裝側(cè)面

▲同比其他品牌的RTX3090包裝盒，PNY的包裝體積要小不少

▲開箱

▲原封本體

▲原封標(biāo)簽

▲這是靜電袋的標(biāo)簽，和盒子上的標(biāo)簽以及顯卡上的標(biāo)簽，配合成三碼合一。其中D43724是PNY獨(dú)有的工廠碼。

▲附件全家福

▲1組 16-Pin 轉(zhuǎn) 四組 8-Pin的供電排線，官方稱之為PCIe5 12VHPWR Adapter。

▲這種帶有NVIDIA標(biāo)的4 x 8P轉(zhuǎn)12VHPWR的線其實(shí)我不建議使用，因?yàn)檫@種線材全部是由NVIDIA配送的套料，每一家都是一樣的，因?yàn)榍捌谟袌?bào)道NVIDIA這批轉(zhuǎn)接線有嚴(yán)重的焊接方式的質(zhì)量問題，容易導(dǎo)致顯卡與轉(zhuǎn)接線的12VHPWR位燒熔，所以這里我極力建議大家不要使用這條線，具體分析我會放在文章結(jié)尾部分。

▲附贈的一組顯卡支撐架，官方命名為：VGA Support Kits，來自聯(lián)力代工制造。

▲安裝方式如上圖

▲顯卡正面使用了三個(gè)100mm雙滾珠環(huán)型風(fēng)扇

▲與傳統(tǒng)90mm風(fēng)扇相比增加了40%以上的風(fēng)量，風(fēng)壓提高55%。

▲顯卡背面使用了沖壓成型鋁制金屬背板

▲顯卡背板的一塊做了鏤空設(shè)計(jì)，方便風(fēng)扇將熱風(fēng)吹至機(jī)箱內(nèi)部。

▲顯卡頂部設(shè)計(jì)了一組XLR8的ARGB燈效

▲由于這次的RTX 4090各家都采用了短PCB設(shè)計(jì)，所以16PIN供電設(shè)計(jì)在短PCB的一側(cè)上方，覆蓋上全長度的散熱器，就會顯得外接供電貌似設(shè)計(jì)在顯卡的中間部分。

▲顯卡底部

▲顯卡的厚度是71.1mm，標(biāo)準(zhǔn)的3.5槽厚度。接口部分為3x DisplayPort 1.4, 1x HDMI 2.1

▲顯卡前部可以看出使用了4熱管穿Fin。

▲這張顯卡的體積控制在331.8 x 136.8 x 71.1mm，長度比公版的創(chuàng)始者310mm略長，但是短于其他AIC的同型號產(chǎn)品。

▲顯卡體積的兼容性對比

拆解

▲我直接對這張顯卡進(jìn)行了拆解

▲沖壓全鋁背板

▲散熱器本體

▲散熱使用了8根熱管

▲接觸底座使用了Vapor-Chamber真空腔均熱板設(shè)計(jì)。

▲PCB正面

▲PCB背面

PNY的這張卡的PCB是公版PG139-SKU330

▲這張顯卡全部的MOSFET使用都是OnSemi NCP302150 DrMOS，分別用于GPU和顯存供電；額定電流均為50A 。

▲GPU核心的PMW芯片是uPI uP9512U 。

▲該控制器管理14 相GPU核心供電。

▲顯存供電PMW芯片是UPI uP9512R

▲該控制器管理3相顯存供電。

▲GDDR6X 內(nèi)存芯片由美光制造，型號為 D8BZC，解碼為 MT61K512M32KPA-21:U。它們被指定以 1313 MHz（21 Gbps 有效）運(yùn)行。

▲GPU核心是AD102-300-A1

▲HOLTEK HT32F52352芯片控制燈效以及風(fēng)扇轉(zhuǎn)速。

▲GSTEK GS9216是一顆12A降壓芯片。

▲UPI US5650Q是一顆四通道電壓電流監(jiān)控芯片，監(jiān)測PCB上四顆SHUNT RESISTOR，2顆R002和1顆R005在12VHWPR附近, 1顆R005在金手指附近。

這個(gè)供電的思路看下來，感覺PNY的設(shè)計(jì)比較關(guān)注默認(rèn)效能穩(wěn)定性，沒有大量的堆料供應(yīng)超頻需求。設(shè)計(jì)方案和Palit類似。

既然都是PG139-SU330公版參考設(shè)計(jì)，為什么各家的PCB有明顯的不同，包括電源的相數(shù)以及供電的方案。其實(shí)來自igor'sLAB的主編Igor Wallossek早就發(fā)表過他的意見，在Ada設(shè)計(jì)之初，NVIDIA考慮的仍然是使用SAMSUNG 8N制程，所以給與板卡廠商的散熱以及電路設(shè)計(jì)參考指南都是以600W散熱規(guī)模以及供電規(guī)模呈現(xiàn)的，因?yàn)檎麄€(gè)產(chǎn)品的規(guī)劃確實(shí)需要幾個(gè)月時(shí)間，但是AMD的NAVI 31確定下來使用TSMC 5-6nm混合工藝制造后，NVIDIA估計(jì)是不淡定了，立即改變Ada的制程，直接轉(zhuǎn)投TSMC 5nm改良版4N，確實(shí)TSMC 4N面對AMD確定的TSMC 5-6nm混合制程是存在優(yōu)勢的，同時(shí)由于一些市場戰(zhàn)略問題，NVIDIA并沒有向板卡廠商透露工藝變更事宜，直到AD102出來，NVIDIA通知板卡廠商RTX 4090的TGP和散熱設(shè)計(jì)為450W才得到確認(rèn)。

ASUS ROG Strix GeForce RTX 4090 OC

▲這時(shí)候板卡廠商更換方案已經(jīng)來不及了，于是就用600W的電路設(shè)計(jì)+散熱方案直接推出了RTX 4090的產(chǎn)品，可以理解成PG139-SU330公版參考設(shè)計(jì)的600W加強(qiáng)版。

NVIDIA Geforce RTX 4090 Founders Edition

▲其實(shí)對于NVIDIA自己的FE版本也是早早設(shè)計(jì)好了600W的電路PCB，就是PG139-SU330公版的600W變種加強(qiáng)版，但是上市時(shí)候使用了450W的散熱模塊，原先計(jì)劃的三風(fēng)扇FE散熱方案可以移交到RTX 4090Ti上去了。

Palit GeForce RTX 4090 GameRock OC

▲在投片TSMC 4N之后NVIDIA在市場方面向板卡廠商出售方案的時(shí)候就完全轉(zhuǎn)向了450W的PG139-SU330公版設(shè)計(jì)，包括供電套料都一并提供，并極力要求廠商這樣去做，原因就是在面對未來的NAVI-31的時(shí)候，NVIDIA希望表現(xiàn)的是一個(gè)比對方優(yōu)秀的能耗比，而不是一個(gè)多燒了33%TGP功耗性能多出5%的產(chǎn)品，諸如Palit抑或PNY就是屬于后期被NVIDIA規(guī)劃為450W產(chǎn)品線的主推廠商。

所以這一代產(chǎn)品，PG139-SU330公版參考設(shè)計(jì)是600W版本還是450W版本，完全取決于NVIDIA介入生產(chǎn)設(shè)計(jì)的時(shí)間線，在轉(zhuǎn)投TSMC 4N之前，都是600W方案，在投了TSMC 4N之后都是450W方案。

那么是不是600W版本的PCB以及散熱設(shè)計(jì)就會強(qiáng)很多呢？這取決于板卡廠商的慣性思維，因?yàn)镾AMSUNG 8N制程Ampere的GPU核心提供給廠商的時(shí)候是存在分級的，分為30%的BIN0，60%的BIN1，10%的BIN2。這是由三星的良率問題決定，所以產(chǎn)生了BIN2這樣的Sorting GPU核心，優(yōu)秀的核心會提供給核心AIC裝備，比如御三家這些，所以御三家的旗艦版會比下游廠家的核心在同樣電壓下BOOST到更高更夸張的頻率，這讓超公版PCB和散熱設(shè)計(jì)變得非常有價(jià)值。但是TSMC 4N卻不提供所謂的Sorting GPU核心，這次只有BIN1，沒有BIN0和BIN2，每一家拿到的核心體制都基本一致，沒有特別優(yōu)秀的也沒有特別差的，這就讓想做超公版的廠家特別頭疼，因此，大家看評測所了解的600W滿載的效能也并沒有特別多的效能提升，能耗比完全沒有優(yōu)勢。

測試平臺

電源適配

▲為了盡可能穩(wěn)定有效的完成測試任務(wù)，電源這次使用了Seasonic Prime TX-1600

▲Seasonic Prime TX-1600包裝

▲80PLUS鈦金認(rèn)證，電源原生支持兩個(gè)PCIe5 12VHPWR供電接口。

▲開箱

▲附件全家福

▲線材包1

▲線材包2

▲PCIe5 12VHPWR供電線

▲PCIe5 12VHPWR供電接口部分

▲海韻的PCIe5 12VHPWR供電線直接定義為600W輸出。

▲電源本體背面

▲電源本體正面

▲電源本體側(cè)面

▲電源模組接口

▲45°視角

京東

Seasonic 海韻 PRIME-TX 鈦金牌（94%）全模組ATX電源電腦電源 1600W3599元實(shí)時(shí)價(jià)格8小時(shí)前已更新去購買

測試平臺

【CPU】: AMD Ryzen 7 5800X

【主板】: ASRock X570S PG Riptide

【內(nèi)存】: Lexar THOR DDR4-3600 16GB X2(White)

【硬盤】: LEXAR NM800 1TB M.2 PCIe Gen 4X4 SSD

【顯卡】: PNY RTX 4090 OC XLR8 Gaming Verto

【散熱】: Thermalright Forzen Magic 240 ARGB

【機(jī)箱】: SilverStone RM42-502

【電源】: Seasonic TX-1600

【系統(tǒng)】: Windows 11 x64 WorkStation 21H2

【系統(tǒng)】: Ubuntu 18.04.6 x64

▲視角1

▲點(diǎn)亮的光效

基本情況

▲GPUZ默認(rèn)參數(shù)

▲閑時(shí)，使用HWINFO對GPU功耗、GPU熱點(diǎn)溫度、GPU溫度以及顯存結(jié)溫進(jìn)行了監(jiān)控，可以發(fā)現(xiàn)：

功耗=14.834W，

GPU熱點(diǎn)溫度=45.8°C

GPU溫度=36.9°C

顯存結(jié)溫=40°C

▲我們進(jìn)行3DMARK Speed Way的壓力測試，本測試一共20輪，我們在第17輪開始統(tǒng)計(jì)，榨出當(dāng)前最高的TGP和溫度并使用HWinfo監(jiān)控。

▲運(yùn)行3DMARK Speed Way壓力測試是因?yàn)橐恢碧幱贕PU 100%滿載狀態(tài)：

功耗=443.946W，

GPU熱點(diǎn)溫度=79.9°C

GPU溫度=70.3°C

顯存結(jié)溫=80°C

這基本是目前現(xiàn)有手段能榨出的最大表現(xiàn)力。

▲回到HWINFO監(jiān)控頁面去復(fù)盤，了解一下這張卡的一些特性：

關(guān)于GPU功耗，最低9.133W，最高445.763W，基本說明這張卡的功耗區(qū)間，看起來被鎖450W TGP。

GPU頻率在待機(jī)時(shí)候穩(wěn)定在210MHz，滿載時(shí)候達(dá)到2820MHz。

顯存頻率在待機(jī)時(shí)候穩(wěn)定在101.3MHz，滿載時(shí)候達(dá)到2625.5MHz。

GPU過熱限制=84°C，說明整個(gè)顯卡的散熱設(shè)計(jì)是為了把GPU溫度壓制在84°C以內(nèi)。

GPU風(fēng)扇1是三顆風(fēng)扇中的左右兩顆并聯(lián)，待機(jī)基本不轉(zhuǎn)，測試時(shí)候轉(zhuǎn)速最大達(dá)到1713RPM，但這只是風(fēng)扇全速轉(zhuǎn)速的49%。

GPU風(fēng)扇2是三顆風(fēng)扇中的中間一顆，在待機(jī)時(shí)候基本不轉(zhuǎn)，測試時(shí)候轉(zhuǎn)速最大達(dá)到1721RPM，但這只是風(fēng)扇全速轉(zhuǎn)速的49%。

▲想讓風(fēng)扇全速，使用PNY的VelocityX軟件就可以做到。

▲將風(fēng)扇這里的自動關(guān)閉，轉(zhuǎn)速拉到100%即可達(dá)到最大轉(zhuǎn)速3086RPM。

下面看一下超頻效果，

▲超頻之前跑了一個(gè)3DMARK TIME SPY EXTREME測試，GPU分?jǐn)?shù)19472

▲隨后我直接將GPU核心加了200MHz，

▲進(jìn)行3DMARK TIME SPY EXTREME測試，GPU分?jǐn)?shù)19912

▲HWINFO監(jiān)控?cái)?shù)據(jù)的GPU功耗依然牢牢被鎖在450W以內(nèi)。

▲比較一下兩個(gè)測試，差異主要是CPU核心頻率boost從2790MHz越遷到2985MHz，實(shí)際功耗沒有增加，溫度也沒有增加。所以也不用動輒對boost核心頻率達(dá)到3000MHz的600W超級公版垂涎三尺，其實(shí)哪怕450W TGP的RTX 4090往上隨便拉個(gè)200-250核心頻率就隨意可以達(dá)到3000MHz的boost核心頻率。

▲這說明這次的AD102-300-A1核心在不增加功耗的情況下是留有一定余量的性能可以壓榨的，但是空間不大，200-250MHz，一旦超過這個(gè)范圍，就需要BIOS破除Maximum Power Limit 450W的限制。

▲關(guān)于RGB特效，VelocityX提供了多種選擇，下面展示幾張我拍攝的燈光效果。

視頻

▲基本情況部分測試到此結(jié)束。

對比測試

▲從左往右，依次是PNY RTX 4090 Verto、影馳RTX 3090 Ti星耀以及七彩虹RTX 3090火神

▲三款產(chǎn)品同比

▲厚度上PNY RTX 4090略厚，長度和影馳RTX 3090 Ti星耀基本一致。

DLSS3 測試

▲NVIDIA GeForce RTX 40系列顯卡的一大變化就是新增了對DLSS 3技術(shù)的支持，DLSS 3在前代DLSS2的基礎(chǔ)上，通過(OFA)光流加速推斷下一幀生成的目標(biāo)畫面，使傳統(tǒng)CUDA算力得到極大的節(jié)省，讓GPU在應(yīng)對高分辨率實(shí)時(shí)渲染游戲時(shí)可以更加游刃有余，與不使用DLSS相比，理論上游戲性能的提升可高達(dá)4倍。

▲DLSS 3由于Frame Generation的加入，它的理論幀數(shù)性能能達(dá)到原先DLSS 2的雙倍，這使得GeForce RTX 40系顯卡能夠以更小的壓力用4K分辨率高畫質(zhì)運(yùn)行所有支持DLSS 3的游戲，同時(shí)距離流暢體驗(yàn)8K游戲也更進(jìn)一步。

▲目前有超過35款游戲和應(yīng)用宣布即將支持DLSS3。

DLSS3 測試-Cyberpunk 2077

《Cyberpunk 2077》DLSS3設(shè)置

▲DLSS 3的相關(guān)測試使用《Cyberpunk 2077》完成，雖然選擇游戲自帶的BENCHMARK進(jìn)行測試，但由于DLSS 3應(yīng)用了新技術(shù)，當(dāng)下游戲自帶的幀數(shù)記錄功能并不能精準(zhǔn)地記錄下開啟DLSS 3之后的游戲幀數(shù)。因此在DLSS 3游戲中，雖然使用游戲自帶的BENCHMARK進(jìn)行測試，但實(shí)際幀數(shù)以NVIDIA的FrameView工具為準(zhǔn)。

▲開啟光追測試，我們可以發(fā)現(xiàn)，開啟DLSS 2之后的游戲性能幀數(shù)已經(jīng)相當(dāng)可觀，然而當(dāng)開啟DLSS 3之后，游戲性能在DLSS 2的基礎(chǔ)上又提升了一大截，與關(guān)閉DLSS相比，在4K分辨率下開啟DLSS 3質(zhì)量可以帶來170%的性能提升，2K分辨率下可以帶來145%的性能提升。

DLSS對比測試

DLSS對比測試-FAR CRY 6

DLSS對比測試-Shadow of the Tomb Raider

生產(chǎn)力測試

生產(chǎn)力測試環(huán)節(jié)使用了Puget Systems的三個(gè)測試腳本進(jìn)行測試：

生產(chǎn)力測試-Adobe After Effects 22.4

▲本測試以Adobe After Effects 22.4為測試載體

▲以PugetBench for After Effects 0.95.2為工具基準(zhǔn)進(jìn)行測試

本測試涉及到了許多不同的項(xiàng)目，其中包括一個(gè)專用的“GPU 壓力”測試，該測試旨在往 GPU 上施加盡可能多的負(fù)載，同時(shí)仍保持在某人在現(xiàn)實(shí)世界中可能實(shí)際執(zhí)行的范圍內(nèi)。在 After Effects 等應(yīng)用程序中查看 GPU 性能通常是檢查 GPU 承受重負(fù)載的極端情況的情況，因此通過每個(gè) GPU 的 After Effects 基準(zhǔn)測試中看到的整體性能開始，GPU 分?jǐn)?shù)是根據(jù)“GPU Stress”組合的性能計(jì)算得出的，該組合旨在將盡可能多的負(fù)載置于 GPU 上，同時(shí)最大限度地減少 CPU 作為瓶頸，可以很好地顯示 After Effects 中不同 GPU 之間的最大性能增量。

GPU分?jǐn)?shù)的基準(zhǔn)是以NVIDIA GeForce RTX 3080 10GB為100分參考基準(zhǔn)。

NVIDIA GeForce RTX 3080 10GB

GPU分?jǐn)?shù)：100

▲測試數(shù)據(jù)匯總

生產(chǎn)力測試-Adobe Premiere Pro 22.6.1

▲本測試以Adobe Premiere Pro 222.6.1為測試載體

▲以PugetBench for Premiere Pro 0.95.3為工具基準(zhǔn)進(jìn)行測試。

這個(gè)基準(zhǔn)測試通過4K和8K分辨率以及29.97和59.94 FPS的各種編解碼器來研究實(shí)時(shí)回放和導(dǎo)出性能。對于GPU測試使用專用的“重載GPU效果”單獨(dú)向GPU施加盡量多的壓力，使其超出普通Premiere Pro用戶的工作范圍來進(jìn)行測試。

測試的剪輯素材 (59.94 FPS)素材分辨率以及編碼器包含：4K H.264 150mbps 8-bit (59.94FPS)、4K ProRes 422、4K RED、8K RED、8K H.265 100Mbps。

對于每種類型的測試素材，進(jìn)行四種測試：

標(biāo)準(zhǔn) - 兩個(gè) 59.94FPS 片段串聯(lián)，應(yīng)用 Lumetri Color 效果

2x Forward - 四個(gè) 59.94FPS 剪輯，在 119.88FPS 序列中將 Lumetri 顏色設(shè)置為 200% 速度，以模擬以 2 倍速度播放時(shí)的性能。

4x Forward - 8 個(gè) 59.94FPS 剪輯，在 239.76FPS 序列中將 Lumetri 顏色設(shè)置為 400% 的速度，以模擬以 4 倍速度播放時(shí)的性能。

MultiCam - 在多機(jī)位序列中跨四六個(gè)軌道的多個(gè)剪輯。在“多相機(jī)”顯示模式下測試播放。

這些測試都用于全回放分辨率的實(shí)時(shí)回放性能測試。

標(biāo)準(zhǔn)測試還使用“Youtube 2160p 4K 超高清”預(yù)設(shè)（H.264、4K、40mbps）以及導(dǎo)出到 4K ProRes 422HQ 8-bpc 來測試其導(dǎo)出性能。

關(guān)于GPU有一個(gè)“Heavy GPU Effects”測試，使用：

串聯(lián)的 Twp ProRes 422 剪輯，每個(gè)剪輯之間有交叉溶解

高級效果：Lumetri Color、Ultra Key、Sharpen、Gaussian Blur、Basic 3D、Directional Blur 和 VR Digital Glitch。

極致效果：Lumetri Color、Ultra Key、Sharpen、Gaussian Blur、Basic 3D、Directional Blur、VR Digital Glitch 和 VR De-Noise。

通過導(dǎo)出到 ProRes 422HQ 來衡量性能。

GPU 分?jǐn)?shù)基準(zhǔn)是以NVIDIA GeForce RTX 3080 10GB為100分參考基準(zhǔn)：

NVIDIA GeForce RTX 3080 10GB

GPU分?jǐn)?shù)：100

▲測試數(shù)據(jù)匯總

生產(chǎn)力測試-DaVinci Resolve Studio 18.0.2

▲本測試以BlackMagic DaVinci Resolve Studio 18.0.2為測試載體，以PugetBench for DaVinci Resolve 0.92.3為工具基準(zhǔn)進(jìn)行測試。

本基準(zhǔn)測試主要使用各種編解碼器以 4K 和 8K（僅限擴(kuò)展預(yù)設(shè)）分辨率、OpenFX 以及 Fusion 中的性能進(jìn)行渲染。

測試的剪輯素材 (59.94 FPS)素材溯源自以下兩家自媒體提供的樣片：包含以下分辨率和編解碼器：

4K H.264 150mbps 8-bit、4K ProRes 422、4K RED、8K RED以及8K H.265 100mbps

GPU 效果部分側(cè)重于 OpenFX 和降噪，包含以下效果：

Temporal NR x3 - 2 Frames Better

Temporal NR - 2 Frames Better

Film Grain

Spatial NR - Better

Lens Blur x5

Lens Flare

Optical Flow - 50% Enhanced Better

Face Refinement

▲測試數(shù)據(jù)匯總

最后需要說明的是，本次測試的剪輯素材來自以下兩家自媒體：

▲4K和8K RED剪輯視頻來自老萊的工作室，這些剪輯也已轉(zhuǎn)碼以創(chuàng)建H.265和ProRes 422剪輯。Linus Media Group是老萊的公司，在YouTube上提供了流行的 LinusTips和 TechLinked頻道。

▲Neil Purcell是倫敦著名的照明攝影師，在廣播電視領(lǐng)域擁有超過25年的經(jīng)驗(yàn)。從事各種各樣的作品；從戲劇到木偶，現(xiàn)場新聞和事實(shí)，兒童節(jié)目，燈光娛樂，真人秀，外部廣播，重大體育賽事，音樂演唱會，流行視頻，企業(yè)電影和商業(yè)廣告。圖中Neil Purcell（燈光攝影師/攝影操作員）正在以他的松下 GH5 拍攝 4K H.264 素材。本次測試使用的4K H.264素材來源于他的剪輯作品。

深度學(xué)習(xí)

RTX 4090 具有576個(gè)第4代Tensor核心，RTX 3090 Ti 具有336個(gè)第3代Tensor核心，RTX 3090 具有328個(gè)第3代Tensor核心，理論上RTX 4090的Tensor核心不僅有數(shù)量上的優(yōu)勢而且有迭代的優(yōu)勢。這對深度學(xué)習(xí)來說是個(gè)非常大的利好。不過RTX 4090實(shí)在太新了可能需要點(diǎn)時(shí)間才能讓深度學(xué)習(xí)的周邊支持跟上，正好CUDA Toolkit 11.8趕著發(fā)布了，所以直接使用了NVIDIA的NGC 容器系統(tǒng)進(jìn)行測試。

▲測試系統(tǒng)

Ubuntu 22.04 Linux

NVIDIA Enroot 3.4

來自NVIDIA NGC 的容器化應(yīng)用程序

TensorFlow 1.15.5 ML/AI 框架標(biāo)簽：nvcr.io/nvidia/tensorflow:22.09-tf1-py3

PyTorch 1.13.0a0 ML/AI 框架標(biāo)簽：nvcr.io/nvidia/pytorch:22.09-py3

深度學(xué)習(xí)-TensorFlow ResNet50

▲ TensorFlow 1.15.5版本是 NVIDIA 維護(hù)的，能提供更好的性能。基準(zhǔn)是訓(xùn)練 100 Step的 ResNet 50 卷積神經(jīng)網(wǎng)絡(luò) (CNN)。結(jié)果是以每秒處理的圖象數(shù)來決定。精度可選擇FP32 和 FP16 。每秒處理的圖象數(shù)越多說明性能越好。

命令行：

CUDA_VISIBLE_DEVICES=0 python resnet.py --layers=50 --batch_size=128 --precision=fp16CUDA_VISIBLE_DEVICES=0 python resnet.py --layers=50 --batch_size=128 --precision=fp32

▲測試數(shù)據(jù)匯總

深度學(xué)習(xí)-PyTorch Transformer

▲基準(zhǔn)測試使用 PyTorch 1.13 在帶有 CUDA 的 Wikitext-2 的神經(jīng)網(wǎng)絡(luò)上對Transformer 模型進(jìn)行 6 epoch 的訓(xùn)練，完成時(shí)間越短，說明性能越好。

命令行：

time CUDA_VISIBLE_DEVICES=0 python main.py --cuda --epochs 6 --model Transformer --lr 5 --batch_size 640

▲測試數(shù)據(jù)匯總

值得注意的是PyTorch和TensorFlow的迭代支持很快，一些優(yōu)化一定會持續(xù)跟進(jìn)Ada構(gòu)架進(jìn)行優(yōu)化的，所以預(yù)留了未來可期許的深度學(xué)習(xí)性能提升空間。

硬件兼容性

其實(shí)我對測試平臺不太追新，最主要的問題就是怕不兼容，結(jié)果還是遇到了不兼容的情況，最后得到了解決：

測試平臺我選用的是ASRock X570S PG Riptide主板以及AMD Ryzen 7 5800X，沒有選用INTEL 12和13代平臺以及AMD Ryzen 7000系列平臺最主要的原因是因?yàn)橛胁糠值臏y試在Ubuntu 18.04.6 LTS下進(jìn)去，對于Linux平臺而言，支持如上新平臺發(fā)揮效能需要更新內(nèi)核到5.17-5.22以上，存在一些未知且不可預(yù)測的可能性，求穩(wěn)所以使用了成熟的平臺。

▲ASRock X570S PG Riptide包裝

▲ASRock X570S PG Riptide附件一覽

▲ASRock X570S PG Riptide本體

▲安裝AMD Ryzen 7 5800X，散熱器選用的是Thermalright Forzen Magic 240 ARGB。

▲ Thermalright Forzen Magic 240 ARGB包裝

▲Thermalright Forzen Magic 240 ARGB本體1

▲Thermalright Forzen Magic 240 ARGB本體2

▲SSD選擇的比較穩(wěn)健的LEXAR NM800 1TB M.2 PCIe Gen 4X4 ，為了提高兼容性選用了主流的IG5236主控+美光B47R NAND。

▲SSD本體正面

▲SSD本體背面

▲安裝設(shè)備在M.2-1 CPU PCIe Lane槽位。

▲CrystalDiskMark 8.0.24的持續(xù)讀寫使用QD32T1的默認(rèn)設(shè)置，隨機(jī)讀寫使用QD32T16的條件，可以非常接近官標(biāo)所標(biāo)識的UP TO的最大值：

Sequential Read [持續(xù)讀取](Q=32,T=1) : 7459 MB/s 超越官標(biāo)

Sequential Write [持續(xù)寫入](Q=32,T=1) : 5738 MB/s 接近官標(biāo)

Random Read 4KiB [4K隨機(jī)讀取](Q=32,T=16) : 399K IOPS 接近官標(biāo)

Random Write 4KiB[4K隨機(jī)寫入] (Q=32,T=16) : 1013K IOPS 遠(yuǎn)超官標(biāo)

評估了下，基本可以認(rèn)為達(dá)到了官標(biāo)的性能。

內(nèi)存選擇的是Lexar THOR DDR4-3600 16GB X2(White)

▲DRAM本體正面

▲DRAM擺拍2

▲上機(jī)

▲安裝內(nèi)存在DIMM 2和DIMM 4。

▲上機(jī)用臺風(fēng)看了下，美光F-Die，顆粒編號D8CJV，美光里的內(nèi)部編號為MT40A2G8SA-062E:F，原生DDR4-3200的顆粒，SPD里有DDR4-3600 18-22-22-42 1.35V的XMP參數(shù)以及DDR4-3200 22-22-22-52 1.2V的JEDEC參數(shù)。

▲機(jī)箱選用的是一款工作站機(jī)箱SilverStone RM42-502

▲這是一款可以通過導(dǎo)軌直接上機(jī)柜的RACK機(jī)箱

▲支持240-280水冷。打開前門可以看到兼容水冷的風(fēng)扇進(jìn)風(fēng)位

▲SilverStone RM42-502的特點(diǎn)是可以通過附件里面的轉(zhuǎn)換件變成塔式工作站機(jī)箱

▲SilverStone RM42-502的塔式形態(tài)--開門

▲SilverStone RM42-502的塔式形態(tài)--關(guān)門，前門鑰匙是工作站機(jī)箱的標(biāo)配。

▲組裝好硬件

問題一

▲第一件事情發(fā)現(xiàn)點(diǎn)不亮。。。。。。如圖所示顯示器無顯示，但是機(jī)器運(yùn)行則一切正常。

▲ASRock X570S PG Riptide這種上市一年多的成熟產(chǎn)品竟然必須需要更新2022年10月22日最新2.20版本BIOS才可以支持RTX 4090，所以當(dāng)發(fā)現(xiàn)點(diǎn)不亮RTX 4090的時(shí)候不用慌，先去用別的顯卡點(diǎn)亮系統(tǒng)升級一個(gè)最新的BIOS。

問題二

▲第二個(gè)問題，要清楚SilverStone RM42-502是一個(gè)支持ETAX雙路主板的工作站服務(wù)器機(jī)箱，不僅寬大且做工精良。

▲規(guī)格是430mm (W) x 176mm (H) x 468mm (D),寬度是430mm。

▲就這個(gè)規(guī)格的機(jī)箱，在安裝了前置240水冷之后，塞進(jìn)去331mm長度的PNY GeForce RTX 4090 24GB OC XLR8也已經(jīng)比較緊湊了，機(jī)箱在不安裝前置水冷情況下允許安裝的顯卡最大長度為426mm，一般普通水冷排厚度為27mm，12025規(guī)格水冷風(fēng)扇厚度為25mm，安裝完水冷僅剩下374mm的長度空間，依然足夠裝下目前在售的任意品牌型號的RTX 4090！如果你正在為找一款適合RTX 4090的做工精良的工作站機(jī)箱而煩惱，如果你能夠接受無ARGB的機(jī)箱內(nèi)環(huán)境的話，SilverStone RM42-502絕對是您正確的選擇！

但是市面上大多數(shù)的ATX機(jī)箱顯卡限制長度都在350mm以內(nèi)，這意味著，如果你購買RTX 4090顯示卡，顯卡的長度決定了你是否需要更換一個(gè)更大的機(jī)箱。所以這時(shí)候長度更短的RTX 4090的機(jī)箱兼容適配性當(dāng)然是更強(qiáng)的。

問題三

▲第三個(gè)問題，如果使用了Seasonic TX-1600原配的12VHPWR線材進(jìn)行安裝，如果發(fā)生過度彎曲，還是有可能發(fā)生以下情況：

▲因?yàn)檫^度彎曲發(fā)生的線材接頭脫落情況，

▲PCI-SIG組織早就通報(bào)了因?yàn)?2VHPWR的線材因?yàn)樘蔡值脑蛟谶^度彎曲的時(shí)候造成接頭松動甚至脫落，和顯卡12VHPWR接頭部分發(fā)生電阻值過高，發(fā)熱嚴(yán)重最終造成12VHPWR燒毀的問題。

現(xiàn)在問題來了，機(jī)箱的能蓋上側(cè)板能容納的最大顯卡高度為156mm，而顯卡本身的高度為136.8mm，如果要蓋上側(cè)板，就必須在19mm的空間內(nèi)進(jìn)行12VHPWR線材彎折，這其實(shí)還是有風(fēng)險(xiǎn)。對于海韻電源而言，其實(shí)還有終極解決方案來解決這個(gè)問題。

▲海韻為解決彎曲問題出品了一款新的12VHPWR模組線，符合PCIe 5.0供電標(biāo)準(zhǔn)，兼容ATX 3.0，使用16AWG高規(guī)格線徑，耐高電流合金銅端子，可支持高達(dá)600W功率輸出。電源直連顯卡供電，可降低轉(zhuǎn)接帶來的故障風(fēng)險(xiǎn)，為玩家?guī)砀踩€(wěn)定的供電方案。另外，該模組線采用了新的模組線材，壓紋工藝如編織質(zhì)感，比一般的模組線更柔軟，更有利于玩家走線。

▲海韻這款12VHPWR模組線適配于其PRIME和FOCUS系列850W及以上型號，可選黑色或白色，但與其他品牌并不適配。如果玩家使用的是國行在保的海韻電源，每個(gè)電源SN可免費(fèi)申請一次，得到這款12VHPWR模組線。

▲1000W及以上的海韻電源需提供RTX 40系列顯卡的購買憑證，850W及以上的海韻電源需提供RTX 3090 Ti顯卡的購買憑證，另外玩家需要提供一張電源與顯卡的合照（電源SN清晰可見），默認(rèn)發(fā)黑色，白色需備注。玩家可將相關(guān)資料發(fā)送到官方郵箱cn.support@seasonic.com免費(fèi)申請，郵費(fèi)自理，以順豐到付寄出。

問題四

▲第四個(gè)問題，第一批次NVIDIA配給顯卡生產(chǎn)商的1組 16-Pin轉(zhuǎn)4組 8-Pin的供電排線，官方稱之為PCIe5 12VHPWR Adapter，存在嚴(yán)重質(zhì)量問題。igor'sLAB 發(fā)表了一項(xiàng)關(guān)于 Nvidia 12VHPWR 適配器的研究，不建議使用此適配器！

▲reddit有個(gè)帖子專門持續(xù)匯報(bào)發(fā)生的轉(zhuǎn)接線燒毀顯卡供電接口事件，且持續(xù)更新。到2022年10月30日為止因NVIDIA配送的16-Pin轉(zhuǎn)4組 8-Pin的12VHPWR線材燒毀顯卡接口事件為12例，均為TGP大于550W的RTX 4090。目前無法確定NVIDIA要求近期發(fā)行的RTX 4090新版TGP功耗鎖定為450W是否與此有關(guān)。

▲NVIDIA配送的16-Pin轉(zhuǎn)4組 8-Pin的12VHPWR線材總共有 4 根 14AWG 粗線分布在總共 6 個(gè)觸點(diǎn)上，兩條外部引線分別焊接到一個(gè)引腳上，中間的兩條引線分別焊接到兩個(gè)引腳上。

▲焊料底座是僅 0.2mm的薄銅底座，每根進(jìn)線寬度為 2 mm，因此中間連接的每對寬度為4mm。

▲將一根甚至兩根14AWG 電線焊接到它上面是活動的，彎曲情況下非常容易造成脫落。

▲目前上市的大多數(shù)的RTX 4090都是在600W TGP下運(yùn)行，在這電流強(qiáng)度下，因?yàn)閺澢鷮?dǎo)致的不穩(wěn)定且活動的焊接觸點(diǎn)引腳電阻值上升，迅速燒毀顯示卡以及轉(zhuǎn)接線的12VHPWR接口部分。

▲因?yàn)樵缙诘腞TX 3090Ti配送的1組12-Pin轉(zhuǎn)3組 8-Pin的供電排線使用了相同的設(shè)計(jì)，可能是因?yàn)?50W TGP功耗輸入電流較低并未報(bào)告燒毀RTX 3090Ti的情況，但是這次有用戶害怕使用RTX 4090配送的16-Pin轉(zhuǎn)4組 8-Pin的12VHPWR線材，轉(zhuǎn)而使用RTX 3090Ti配送的12-Pin轉(zhuǎn)3組 8-Pin的12VHPWR線材，一樣發(fā)生了燒毀情況。目前的報(bào)告是兩例。順帶說一下PNY GeForce RTX 4090 24GB OC XLR8 Gaming Verto EPIC-X RGB? TF目前是和RTX 3090Ti一樣的450W TGP功耗設(shè)計(jì)。

總結(jié)

因?yàn)槭掷餂]有其他的RTX 4090顯示卡，所以同類比測試是無法進(jìn)行的，本次評測主要對上代的旗艦級顯示卡做了明確的性能比對。

基于DLSS3游戲用途的玩家是非常值得升級RTX 4090的，而對于普通DLSS游戲用戶而言，需求沒有那么強(qiáng)烈，生產(chǎn)力環(huán)節(jié)諸如Adobe AR PR類的軟件而言，升級理由并不充分，而對于達(dá)芬奇用戶來說就非常值得升級，深度學(xué)習(xí)方面是絕對值得升級的，但是周邊支持的完善可能需要點(diǎn)時(shí)間。

截至發(fā)文，RTX 4090的價(jià)格從首發(fā)12999奔著16000去了，京東缺貨，天貓缺貨，倒不是商家囤貨居奇，是因?yàn)?成的大廠訂單都直送美國了，這就造成中國目前的缺貨真空期，自然水漲船高。

至于PNY這張RTX 4090顯示卡，性能中規(guī)中矩，因?yàn)镸aximum Power Limit 被鎖定在450W，所以在不能動電壓的情況下超頻所獲得性能有限在2-3%附近，其長度適中且不浮夸的散熱規(guī)模令人印象深刻，因?yàn)槟鼙ＷC兼容適配大多數(shù)的普通機(jī)箱，同時(shí)性能也足夠壓制450W TDP，49%的自動風(fēng)扇控制可以最大程度保證滿載運(yùn)行時(shí)候的靜音效果，如果不破解Maximum Power Limit 其實(shí)也用不到100%的手動風(fēng)扇設(shè)置。VelocityX軟件的使用理念比較簡約，簡單暴力比較適合快速上手，ARGB的光效加持也起到了畫龍點(diǎn)睛的效果。

那么問題來了，這張卡的潛在客戶群體在哪里？這張卡適合對穩(wěn)定度有一定要求，且對機(jī)箱電源的兼容適配要求比較高的用戶，換句話說，在不想更換更高功率電源和更大規(guī)模機(jī)箱的前提下，客戶有一個(gè)850W的電源，一個(gè)普通ATX的機(jī)箱，如果你要塞進(jìn)去RTX 4090，除了NVIDIA創(chuàng)始者版本，PNY RTX 4090 OC XLR8 Gaming Verto就是最佳的選擇了。當(dāng)然前提是你需要有一個(gè)適合RTX 4090的電源以及彎折不會燒毀的12VHPWR線材。

作者聲明本文無利益相關(guān)，歡迎值友理性交流，和諧討論～

???展開全文

上一篇：游戲顯卡驅(qū)動下一篇：顯卡金手指

相關(guān)文章

熱門文檔

亚洲一级簧片_性毛片_国产乱子视频_久久影城_强伦女教师视频_成人精品久久

2020顯卡

前言

開箱

拆解

測試平臺

基本情況

對比測試

DLSS3 測試

DLSS3 測試-Cyberpunk 2077

DLSS對比測試

DLSS對比測試-FAR CRY 6

DLSS對比測試-Shadow of the Tomb Raider

生產(chǎn)力測試

生產(chǎn)力測試-Adobe After Effects 22.4

生產(chǎn)力測試-Adobe Premiere Pro 22.6.1

生產(chǎn)力測試-DaVinci Resolve Studio 18.0.2

深度學(xué)習(xí)

深度學(xué)習(xí)-TensorFlow ResNet50

深度學(xué)習(xí)-PyTorch Transformer

硬件兼容性

問題一

問題二

問題三

問題四

總結(jié)

2060顯卡怎么樣

2020 顯卡

2060顯卡

1050 顯卡

4090顯卡

顯卡風(fēng)扇不轉(zhuǎn)

怎么更新顯卡驅(qū)動

顯卡測試軟件

顯卡驅(qū)動安裝失敗

3060顯卡最佳頻率

電腦顯卡驅(qū)動怎么安裝

電腦顯卡自動設(shè)置方法

gta吃顯卡還是cpu

亚洲一级簧片_性 毛片_国产乱子视频_久久影城_强伦女教师视频_成人精品久久

2020顯卡

前言

開箱

拆解

測試平臺

基本情況

對比測試

DLSS3 測試

DLSS3 測試-Cyberpunk 2077

DLSS對比測試

DLSS對比測試-FAR CRY 6

DLSS對比測試-Shadow of the Tomb Raider

生產(chǎn)力測試

生產(chǎn)力測試-Adobe After Effects 22.4

生產(chǎn)力測試-Adobe Premiere Pro 22.6.1

生產(chǎn)力測試-DaVinci Resolve Studio 18.0.2

深度學(xué)習(xí)

深度學(xué)習(xí)-TensorFlow ResNet50

深度學(xué)習(xí)-PyTorch Transformer

硬件兼容性

問題一

問題二

問題三

問題四

總結(jié)

2060顯卡怎么樣

2020 顯卡

2060顯卡

1050 顯卡

4090顯卡

顯卡風(fēng)扇不轉(zhuǎn)

怎么更新顯卡驅(qū)動

顯卡測試軟件

顯卡驅(qū)動安裝失敗

3060顯卡最佳頻率

電腦顯卡驅(qū)動怎么安裝

電腦顯卡自動設(shè)置方法

gta吃顯卡還是cpu

亚洲一级簧片_性毛片_国产乱子视频_久久影城_强伦女教师视频_成人精品久久