刷卡機刷卡顯示超出時間范圍
網(wǎng)上關(guān)于刷卡機刷卡顯示超出時間范圍,昂達 RTX 4080 魔劍顯卡評測的刷卡知識比較多,也有關(guān)于刷卡機刷卡顯示超出時間范圍的問題,今天第一pos網(wǎng)(www.cnksdq.com.cn)為大家整理刷卡常見知識,未來的我們終成一代卡神。
本文目錄一覽:
刷卡機刷卡顯示超出時間范圍
引言&外觀賞析
引言
說起RTX 40系顯卡,大家映入眼簾的應(yīng)該是它強大的性能和出色的能耗比,當(dāng)時一經(jīng)推出,就成了眾多發(fā)燒友的追捧對象,不少AIC廠商都在推出了當(dāng)家花旦,讓游戲玩家一飽眼福,嘗鮮RTX 40系顯卡的魅力。昂達作為NVIDIA在國內(nèi)的主要合作伙伴,也于近日推出了新品GeForce RTX 4080魔劍16GB顯卡。
全新的魔劍系列顯卡定位為昂達的高端旗艦,而這次推出的GeForce RTX 4080魔劍16G更是該系列首款顯卡產(chǎn)品。熟悉昂達的小伙伴應(yīng)該知道,以前昂達做的都是中低端顯卡,最高也只是到RTX 3060 Ti、RTX 2060 SUPER,這次直接拉滿,直沖RTX 4080,想必你也和我一樣,十分好奇這張顯卡的表現(xiàn),讓我們一起見證這張新顯卡能否利刃出鞘!
下文“昂達 GeForce RTX 4080 魔劍 16GB”簡稱為“昂達RTX 4080 魔劍”
規(guī)格對比
在開始之前,先了解一下本次的主角RTX 4080,其采用的是AD103-300 核心,TSMC 4N工藝制造,芯片面積為379平方毫米,晶體管密度達到了459億,晶體管數(shù)量相比較于上一代產(chǎn)品提升明顯,近乎翻倍,而這一代的核心還進一步提升了頻率,因此能帶來更好的性能表現(xiàn)。
其他參數(shù)方面,RTX 4080 RTX 4080標配9728個CUDA,128個第三代RT Cores,512個第四代Tensor Cores,并且用上了16GB的GDDR6X顯存,大顯存配合性能上的提升更可以為游戲以及創(chuàng)作者帶來更好的使用體驗。
而目前RTX 4080顯卡配備的AD103-300核心并不是完整的AD103核心,完整的AD103核心應(yīng)該包括7個GPC(圖形處理集群)、40個TPC(紋理處理集群)、80個SM(流式多處理器)以及一個帶有8個32Bit顯存控制器的256Bit顯存帶寬。因此筆者猜測,RTX 4080或許不是AD103核心下的終極產(chǎn)物,后續(xù)應(yīng)該還會推出完整AD103核心的RTX 4080 Ti。
再看看下方的RTX 4080的核心結(jié)構(gòu)圖,和完整版本的AD103核心對比起來就很容易看出差別,RTX 4080核心代號為AD103-300,其擁有4個完整規(guī)格的GPC(圖形處理集群,每個內(nèi)建6個TPC),與3個非完整的GPC(兩個內(nèi)建5個TPC,一個內(nèi)建4個TPC),共組成38個TPC,SM單元則剩下76個,顯存位寬還是完整的256Bit。
但是RTX 4080上的AD103-300核心在編解碼器上砍了一刀,不得不說老黃的刀法精準,編解碼器數(shù)量直接砍半,與RTX 4090同等規(guī)格,僅保留了兩個NVENC編碼器和一個NVDEC解碼器,因此完整版的AD103核心應(yīng)該會有更快的視頻編解碼速度,不過之前測試過RTX 4090,編解碼速度相比上一代有著近乎翻倍的提升,想必RTX 4080也有不錯的表現(xiàn)。
外觀賞析
正面包裝盒最吸睛的莫過于中間巨大的“眼睛”,熟悉NVIDIA的玩家一眼就能認出那是經(jīng)典的眼睛Logo,這也代表了昂達不斷探索新技術(shù)、接近和創(chuàng)新的精神。包裝盒的右下角寫著“GeForce RTX”字樣。
包裝盒的背面就顯得簡約了許多,大多數(shù)標識都是昂達RTX 4080魔劍顯卡全新升級的技術(shù)及品牌理念等。
昂達RTX 4080魔劍表面方方正正,但不失質(zhì)感,黑色的外觀配合斜切線條低調(diào)而不失優(yōu)雅,超大風(fēng)扇的表面還置入了光線鐳射條,在不同角度與光線下能顯示不同顯示效果,觀感極佳。
正面是三把巨型的散熱風(fēng)扇,昂達將其命名為“冰點”滾珠風(fēng)扇,可見其對散熱效能的信心。三把風(fēng)扇中左右兩個為10cm,中間的為9cm,每把風(fēng)扇上配以9片交錯的流線型扇葉,可帶來更多的進風(fēng)量。
翻到顯卡背面,可以看到昂達RTX 4080魔劍還配備了一體式陽極鋁金屬強化背板,可以有效保護PCB。
在顯卡背部還有大面積的鏤空風(fēng)道,這樣設(shè)計不僅顏值更美觀,還可以令鰭片上的熱量被快速帶走,有效地增強散熱效率。
顯卡的頂部是一小塊屏幕,當(dāng)顯卡接通電源后,屏幕會顯示“ONDA”的呼吸燈,大幅增加了這張顯卡的時尚個性。
屏幕之外就是一整排的出風(fēng)口,橫跨整個顯卡頂部和底部,配合正面的三把散熱風(fēng)扇,加速熱量排出。
供電接口還是我們熟悉的老朋友——12VHPWR供電接口,用來帶這張320W TGP的昂達RTX 4080魔劍可以說是綽綽有余了。
底部為顯卡金手指,接口為標準的PCIe 4.0 x16,在使用前一定要在主板打開Resizable BAR功能,這張顯卡的性能才能完全釋放。
比起其他RTX 4080顯卡,昂達RTX 4080 魔劍更為“輕薄”,是一張三槽顯卡,配備了3個DP1.4接口和1個HDMI2.1接口,支持最高8K輸出顯示。
顯卡拆解
顯卡拆解
每張顯卡到了我手里,必不可少的就是拆解,這張昂達RTX 4080魔劍的拆解還是相當(dāng)容易的,只需要卸下金屬背板上的螺絲即可完全分離PCB與散熱器。
PCB是類公版的方案,從PCB正面可以清楚的看到昂達RTX 4080魔劍為越肩設(shè)計,比一般的顯卡都要再高一些,不過PCB上的接口、供電、核心、顯存,以及輔助供電位置都相當(dāng)?shù)暮侠砬乙?guī)正。
翻到背面,相比正面就要簡潔不少了,顯卡上的一些控制芯片被安置在此。在核心的背面還有兩顆兩個POSCAP(導(dǎo)電聚合物鉭電容),有它們坐鎮(zhèn),顯卡整體的電氣性能會更強。
PCB上的主角那肯定是AD103-301-A1核心,由TSMC 4N定制工藝打造,換裝了全新的Ada Lovelace架構(gòu),9728個CUDA核心加持,同時兼具超高的能耗比,這也讓它能夠在昂達RTX 4080魔劍上大放異彩。
核心旁則是8顆GDDR6X顯存,來自美光,型號為2PU47 D8BZF,作為GDDR6的升級版,顯存位寬為256Bit,速度達到了22.4Gbps,并且單顆容量達到了2GB,8顆組成16GB的大顯存為昂達RTX 4080魔劍提供澎湃性能。
供電規(guī)模也是這款顯卡最值得關(guān)注的點,昂達RTX 4080魔劍的供電模組被安排在PCB的兩側(cè),采用13相核心供電+3相顯存供電。
每相供電都采用獨立的DrMos芯片,封裝型號為BLN3,實際應(yīng)為AOS的AOZ5311NQI-03,持續(xù)輸出電流為55A。
核心供電DrMos芯片
顯存供電DrMos芯片
供電控制芯片則安排在了PCB背面,分別是uP9512R、uP9529Q和uS5650Q,其中uP9512R和uP9529Q共同管理核心供電,可以做精細化的供電管理,而uS5650Q則是主要負責(zé)顯存供電部分。
uP9512R芯片
uP9529Q芯片
uS5650Q芯片
昂達RTX 4080魔劍用的是最新的12VHPWR供電接口,單口最大功率600W,僅需一根12VHPWR的電源線就可以完成對于顯卡的供電,安裝方便。
拆解繼續(xù)!我們來看看昂達RTX 4080魔劍的散熱系統(tǒng),這個散熱系統(tǒng)由主動散熱的散熱風(fēng)扇、散熱器以及金屬背板三部分組成。
先看看這個碩大的散熱器,整個散熱器采用熱管直觸設(shè)計,這樣有利于加速解熱,整體的散熱效能更強。
供電MOS、顯存、核心芯片緊密接觸均熱板,并且還為接觸的地方加裝了高系數(shù)的導(dǎo)熱墊輔助散熱,全方位優(yōu)化熱量傳遞效率,散熱能力更勝一籌。
散熱器用的是兩段式的散熱模塊,兩邊均升級了特大面積的散熱鰭片。散熱鰭片的底下,6根高性能熱管穿梭而過,超高效的散熱效能助力顯卡超性能發(fā)揮。
有如此規(guī)格的一體成型鰭片模組設(shè)計,再配合金屬背板上的鏤空窗口以及優(yōu)秀的風(fēng)道設(shè)計,昂達RTX 4080魔劍想熱都難。
主動散熱部分是三把“冰點”滾珠風(fēng)扇,每把風(fēng)扇上有9片流線型扇葉,這樣設(shè)計的目的是增加進風(fēng)量,讓顯卡即使高負載運轉(zhuǎn)時也能快速散熱,穩(wěn)定滿血釋放。
三把風(fēng)扇均采用智能控制,當(dāng)顯卡在低功耗運行時,風(fēng)扇能夠智能停止轉(zhuǎn)動,保證良好的低噪音效果與更穩(wěn)定的性能。
測試平臺&理論/游戲性能測試
測試平臺介紹
先介紹一下本次的測試平臺,昂達RTX 4080 魔劍作為次旗艦定位的顯卡,想要與之映襯的硬件自然不能差,因此我們用上了評測室最強配置,CPU用的是Intel i9-13900K,主板為ROG MAXIMUS Z790 HERO,內(nèi)存插滿,直接上金士頓的64GB DDR5-6000,這樣的配置才能讓展現(xiàn)這張顯卡的性能。
單有強悍的硬件可不夠,顯示設(shè)備也得跟上,所以我們?yōu)檫@張昂達RTX 4080 魔劍配備了4K顯示器的天花板——愛攻&保時捷聯(lián)名設(shè)計的AGON PD32M,4K@144Hz高刷,還有miniLED背光加持,從里到外都散發(fā)著一種高級感,只有這樣的顯示器才能配得上這張旗艦顯卡。
開始測試前,先通過GPU-Z了解一下測試的昂達RTX 4080 魔劍,從圖中可以看出這款顯卡的基準頻率為2205MHz,Boost頻率可以達到2505MHz,與公版RTX 4080保持一致。
而在溫控和功耗策略方面,這款顯卡的TGP設(shè)定為320W與公版保持一致,允許的最高功耗限制為330W。在溫度墻上,這款顯卡也頗為激進,最高可以去到88℃,顯然這是為超頻所準備的。
理論性能測試
啰嗦了那么多,測試正式開始,首先是理論性能測試,為了更好的展現(xiàn)昂達RTX 4080魔劍的性能,我們也加上了前代卡皇RTX 3090 Ti進行對比。
在全世界最好玩的游戲《3DMark》中,這張顯卡的表現(xiàn)可以用驚喜來形容。單是對比上代的RTX 3080 Ti,昂達RTX 4080魔劍的領(lǐng)先幅度能夠達到33%,如果是跟前卡皇RTX 3090 Ti,它也絲毫不虛,性能領(lǐng)先依舊有20%以上。
要說這里面提升幅度最大的要屬Fire Strike項目,昂達RTX 4080魔劍得分59244,只差一點就能突破6W分大關(guān),這個成績是RTX 3080 Ti的1.2倍,可見新架構(gòu)和新工藝帶來的性能提升有多明顯。
如果看老黃引以為傲的光追項目,性能差距還會更加明顯,作為老黃家的看家本領(lǐng),這代顯卡在光追和DLSS上也是提升明顯,單是在Port Royal測試中昂達RTX 4080魔劍的得分就高達17711,而作為前代卡皇的RTX 3090 Ti僅有1W4左右,單是光追的提升就有30%以上,更別說DLSS加持后對游戲性能的提升了。
看完了常規(guī)的理論測試,再看看GPGPU的算力測試,在這個項目中,昂達RTX 4080魔劍的的領(lǐng)先幅度進一步提升,無論是跟RTX 3080 Ti比還是跟RTX 3090 Ti比,它的性能都高出40%左右,真的不負旗艦之名。
游戲性能測試
像我們這種臭打游戲的最關(guān)注的肯定是昂達RTX 4080魔劍的游戲性能,因此我們也在不同分辨率下選取了多款主流熱門的3A游戲進行實測。
1080P分辨率真的毫無壓力,不會真有人用RTX 4080配1080P的屏幕吧?!實測中可以看到昂達RTX 4080 魔劍的整體性能領(lǐng)先上代RTX 3080 Ti足足有27%以上,不少游戲都是200+ FPS,這個表現(xiàn)已經(jīng)不能用流暢來形容了,要用絲滑。
2K分辨率下,昂達RTX 4080魔劍與RTX 3080 Ti的差距進一步拉大,此時的RTX 3080 Ti很多游戲都是100多FPS,但昂達RTX 4080魔劍憑借高顯存、新架構(gòu)的優(yōu)勢,絕大多數(shù)游戲還能保證接近甚至超越200 FPS的水準,像跑分界的活化石《古墓麗影:暗影》,這個優(yōu)化極好的游戲在這款顯卡的加持下,幾乎快要突破300 FPS!
4K分辨率下,昂達RTX 4080魔劍的游戲性能領(lǐng)先RTX 3080 Ti達到了40%,不少游戲已經(jīng)是可玩跟流暢玩的區(qū)別了。要說這里面最明顯的當(dāng)屬顯卡殺手之稱的《賽博朋克2077》和《地鐵:離去 增強》,RTX 3080 Ti在這兩個游戲里都是勉強60 FPS的水平,但昂達RTX 4080魔劍在僅開啟DLSS 2的情況下已經(jīng)能夠做到90 FPS了,更別說它還有隱藏的DLSS 3這個黑科技。
看過RTX 4090的都知道,8K游戲已經(jīng)成為可能,那作為次旗艦的昂達RTX 4080魔劍又如何呢?經(jīng)過我們實測,可以看到部分游戲依舊可以跑到60 FPS以上,像優(yōu)化好的《極限競速:地平線5》可以去到70 FPS,《古墓麗影:暗影》甚至可以有103 FPS的優(yōu)秀成績,可見8K還是可以期待一下的。
總的來說,得益于架構(gòu)革新和緩存加大,這代RTX 4080顯卡在開啟最高畫質(zhì)和DLSS的情況下,市面上的3A大作已經(jīng)能夠暢玩了,對于游戲玩家來說,昂達RTX 4080魔劍不僅是一塊趁手的游戲工具,更是一款性價比的高端顯卡,2K@165Hz、4K@144Hz的電競體驗統(tǒng)統(tǒng)不在話下。
DLSS 3性能測試
DLSS 3性能測試
要說RTX 40系顯卡最大的升級點是什么?那莫過于DLSS 3這個黑科技了,DLSS作為RTX 20系推出的黑科技,其目的就是為了讓顯卡能夠在不影響畫質(zhì)的前提下提高游戲性能,讓玩家能夠體驗更真實的游戲畫質(zhì)。現(xiàn)在老黃在RTX 40系顯卡上帶來了全新的版本——DLSS 3,相比前作,新增幀生成和NVIDIA Reflex技術(shù),能夠?qū)崿F(xiàn)游戲性能的翻倍提升。
3DMark DLSS 3理論性能測試
先給DLSS 3來一個理論性能測試,我們使用3DMark中的DLSS專項測試進行,實測下來可以看到昂達RTX 4080魔劍在開啟DLSS 2時已經(jīng)能夠暢玩4K了,如果開啟DLSS 3后,性能能夠進一步提升,并且開關(guān)DLSS 3前后性能差距能夠達到3倍以上,同時我們也試了一下8K分辨率,開啟DLSS 2時,45 FPS還是不能達到流暢游玩,但當(dāng)你打開DLSS 3后,游戲幀數(shù)可以去到70 FPS左右,已經(jīng)可以期待8K流暢游戲了。
《光明記憶:無限》游戲?qū)崪y
關(guān)測理論數(shù)據(jù)可沒有意思,我們也選用了目前支持DLSS 3技術(shù)的游戲進行實測,這里我們以《光明記憶:無限》為例,這款游戲現(xiàn)在已經(jīng)支持DLSS 3了,并且在游戲中還能通過開啟DLSS 3的插幀功能來實現(xiàn)DLSS 2與DLSS 3的對比,接下來就讓我們看看昂達RTX 4080 魔劍到底能有怎樣的表現(xiàn)。
實測在不開啟DLSS的情況下,昂達RTX 4080 魔劍在4K分辨率下仍是可以流暢運行《光明記憶:無限》的;開啟DLSS 2后,游戲幀數(shù)就達到了137 FPS,1%幀數(shù)也達到了115 FPS,這完全就是翻倍的游戲流暢度提升;至于開啟DLSS 3之后,游戲幀數(shù)更是達到了160 FPS,配上4K@144Hz的AGON PD32M顯示器,別提有多爽了,真的是絲滑電競。
這里我們也截取了一下游戲在4K分辨率下開啟DLSS 3后的游戲效果,可以看到畫質(zhì)依舊清晰,幾乎與原生4K無異!
Unreal Engine 5 Enemies DEMO性能測試
最后我們還測試了開發(fā)游戲所需用到的Unreal Engine 5引擎,UE5作為全新的游戲開發(fā)引擎,對顯卡的壓力自是不小,在Enemies DEMO中,昂達RTX 4080 魔劍開啟DLSS 3后猶如有高人相助,4K分辨率下可達77 AVG/66 1% FPS/ 55 ms的水平,而關(guān)閉DLSS 3僅有22 AVG/17 1% FPS/ 195 ms,前后足足相差3倍之多,可見老黃的黑科技真的沒有騙人。
并且開啟DLSS 3后,游戲流暢度提升的同時,畫質(zhì)也不受影響。我們可以從視頻中可以看出,即使開啟DLSS 3后,從肉眼看來,開關(guān)前后的畫質(zhì)幾乎沒有區(qū)別,并且因為DLSS是利用AI進行渲染,在部分細節(jié)上,DLSS模式下的畫質(zhì)甚至比原生畫質(zhì)還要清晰。
2K分辨率DLSS性能測試
我們不僅測了《光明記憶:無限》,還測了更多的游戲在開關(guān)DLSS 3下的區(qū)別,從測試數(shù)據(jù)中可以看到在2K畫質(zhì)下,開啟DLSS 2后昂達RTX 4080魔劍已經(jīng)超越前代RTX 3080 Ti不少了,一旦開啟DLSS 3,它將大幅領(lǐng)先前作,不少游戲在DLSS 3的加持下已經(jīng)能夠滿足240Hz的高刷游戲需求了。
4K分辨率DLSS性能測試
上面我們實測在DLSS 2下,昂達RTX 4080魔劍征戰(zhàn)4K分辨率沒有絲毫問題,現(xiàn)在有了DLSS 3,成績更是亮眼,在開啟DLSS 3后,游戲幀數(shù)相比DLSS 2高出20-30幀,而相比RTX 3080 Ti來說,那就是性能的翻倍!像《賽博朋客2077》開啟DLSS 3后,前后游戲差距足足有30幀,即便是4K,超級光追的模式下,現(xiàn)在昂達RTX 4080魔劍也能有114 FPS了,如果降低一些特效,4K@144Hz暢玩夜之城將成為現(xiàn)實。
8K分辨率DLSS性能測試
8K分辨率其實我們也進行了測試,不過昂達RTX 4080 魔劍的16GB顯存在這里就顯得有些不足了,部分游戲都遇到了顯存瓶頸,不過還是有部分游戲能夠穩(wěn)定在60 FPS運行的,像是《瘟疫傳說:安魂曲》《毀滅全人類2》這類新游戲,在開啟DLSS 3后還是不錯的,滿足流暢游玩問題不大。其他游戲則需要等游戲廠商優(yōu)化,屆時配上8K的顯示器甚至是電視,全新的游戲體驗一定能夠驚艷眾人。
創(chuàng)作性能測試
創(chuàng)作性能測試
測完了游戲,4K甚至8K的游戲體驗給我們留下了深刻印象,不過昂達RTX 4080魔劍可不止在游戲上有所成就,在生產(chǎn)力上也頗有建樹。這里我們也測試了包括PCMark 10與PugetBench在內(nèi)的多個項目。能夠比較全面的反應(yīng)這款顯卡在綜合體驗和視頻內(nèi)容生產(chǎn)力方面的實力。
實測結(jié)果如下,在PCMark10的測試中,昂達RTX 4080魔劍在數(shù)位內(nèi)容創(chuàng)作和游戲項目上有不小的提升,這也與上面的游戲性能測試相符。而在創(chuàng)作生產(chǎn)力工具上,性能也比前代領(lǐng)先12%左右,相比RTX 4090更是只有1%的性能差距,可以說創(chuàng)作生產(chǎn)力用戶選昂達RTX 4080魔劍更具性價比一些。
值得一提的是昂達RTX 4080 魔劍支持最新的AV1編解碼功能,因此這次在達芬奇軟件中相比前代RTX 3080 Ti有比較大的性能提升,如果后續(xù)軟件經(jīng)過不斷優(yōu)化和顯卡驅(qū)動的更新,筆者想象以昂達RTX 4080魔劍獨有的AV1優(yōu)勢,在視頻方面會更進一步,與前代的差距會越來越明顯,因此如果你是一名視頻創(chuàng)作者,我也更推薦你使用最新的昂達RTX 4080魔劍。
再看看專業(yè)生產(chǎn)力的表現(xiàn),如果說視頻內(nèi)容生產(chǎn)力的提升只是小步快跑,那在建模、渲染、工業(yè)設(shè)計等軟件上昂達RTX 4080魔劍就可以說是質(zhì)的飛躍了,單是在Blender渲染軟件中,相比前代RTX 3080 Ti就有50%以上的提升,面對RTX 3090 Ti也絲毫不虛,性能差距依舊有45%以上。
另外在SPECviewperf 2020集成的8款工業(yè)軟件測試中,昂達RTX 4080魔劍的表現(xiàn)依舊喜人,整體性能領(lǐng)先RTX 3080 Ti有40%左右,這也意味著渲染同一素材時,使用昂達RTX 4080魔劍可以縮短近三分之一以上的時間。
雙NVENC編碼器專項測試
要說RTX 40系還有什么黑科技?那當(dāng)屬RTX 40系顯卡上升級的雙NVENC編碼器,它支持時下熱門的AV1編碼,而AV1作為下一代主流的視頻編碼技術(shù)有著自己獨特的優(yōu)勢,其具有更快的編碼速度和更高質(zhì)量的流媒體傳輸性能,像達芬奇、萬興喵影、剪映等常用的剪輯軟件已經(jīng)支持AV1編碼,B站等主流的視頻網(wǎng)站也加入了AV1解碼,未來AV1將會成為一個新趨勢。
為了驗證雙NVENC編碼器對視頻創(chuàng)作的提升究竟有多大,我們使用NVIDIA提供的8K片源與工程文件分別測試AV1格式和H.265格式下的編碼時間。實測昂達RTX 4080 魔劍的編解碼實力與旗艦級的RTX 4090相當(dāng),同一段素材下,AV1編碼相比H.265編碼快不少;即使同樣使用H.265編碼,有雙編碼器的加持下,昂達RTX 4080 魔劍的效率比前代快62%以上。
AV1編碼可不僅僅是快,它還有更多你意想不到的點,例如,它在占用空間上也頗有優(yōu)勢,從下圖可以看到無論是4K還是8K分辨率,采用AV1編碼后,視頻文件大小平均能夠降低25%以上。
你以為這就結(jié)束了嗎,AV1編碼導(dǎo)出快、占用小,畫質(zhì)也不輸H.265,這里我們截取了幾個畫面進行對比,從肉眼來看,其實畫質(zhì)幾乎完全一樣,這樣也意味著AV1可以用更小的空間占用量實現(xiàn)與H.265同等規(guī)格的畫質(zhì)表現(xiàn)。
功耗&超頻&評測總結(jié)
功耗與發(fā)熱
這張昂達RTX 4080魔劍的散熱規(guī)格大家也都看到了,可以用極致豪華來形容,用它來壓制AD103核心筆者都覺得大材小用了,這個規(guī)格別說RTX 4080,就算是RTX 4090也一樣夠用,因此筆者也相當(dāng)好奇這款顯卡的散熱效能。
在Furmark甜甜圈單烤15分鐘測試中,昂達RTX 4080魔劍的占用率達到了99%,但此時的顯存溫度僅有50℃,GPU核心溫度也是70℃左右,足以證明這代顯卡在架構(gòu)設(shè)計及散熱器的雙重優(yōu)勢下,功耗與發(fā)熱表現(xiàn)近乎逆天,比大多數(shù)CPU的溫度還要低。
值得一提的是無論是待機還是滿載的情況下,這款顯卡的風(fēng)扇轉(zhuǎn)速都相當(dāng)?shù)停旁跈C箱內(nèi)幾乎感覺不到風(fēng)扇噪音,并且待機時的溫度甚至只有30℃出頭,可以說老黃的RTX 4080真的把溫度跟能耗比提升到了新臺階。
超頻體驗
在GPU-Z中我們知道昂達RTX 4080魔劍可以將溫度跟功耗墻都進行解鎖,給超頻留下了不小的空間,筆者也用小飛機進行超頻測試,看看這款顯卡的潛力究竟在哪里!
首先看看這款顯卡在默頻下,Time Spy得分27858,這個成績已經(jīng)相當(dāng)出色了,在它之上也只有RTX 4090了,可見它的游戲性能不是一般的強。
緊接著我們在小飛機中解鎖電壓、功耗以及溫度后,超頻GPU核心,GPU核心保守點,先加190MHz,穩(wěn)定過測,此時Time Spy得分28820,此時顯卡核心頻率穩(wěn)定在3000MHz。
繼續(xù)加碼,這次同時超頻GPU核心及顯存,GPU核心頻率加220MHz,顯存頻率也拉升500MHz,這次Time Spy得分已經(jīng)來到了29158,相比剛才又增加了近400分。
最后我們將頻率定格在GPU核心+250MHz,顯存+500MHz的水平,此時的Time Spy測試得分29265,相比默認頻率下的27858分,提升了5%以上,這樣的表現(xiàn)還是相當(dāng)可觀的。不過這應(yīng)該不是昂達RTX 4080魔劍的極限,如果有更好的散熱條件,它應(yīng)該還能繼續(xù)沖擊更高的頻率。
評測總結(jié)
測試了這么多張RTX 40系顯卡以后,可以說全新的RTX 40系顯卡還是無時不刻帶給我新的驚喜,Ada lovece架構(gòu)大大提升了執(zhí)行效率和光追性能,TSMC 4N工藝和豪華散熱器讓這代顯卡的能耗比驚人,當(dāng)然最值得夸贊的還是老黃的獨家黑科技DLSS 3,僅靠這個就讓顯卡的游戲性能翻倍,而在專業(yè)性能上新顯卡也有質(zhì)的飛躍。總體來說,RTX 40系顯卡內(nèi)外皆驚喜。
我們再聊聊這次送測的昂達GeForce RTX 4080 魔劍 16GB顯卡,外觀上雖不及其他家的顯卡那樣亮眼,但黑色的外殼加上兩根漸變色帶,遠望有種絕地黑武士的既視感,整體給人一種低調(diào)又不失優(yōu)雅的感覺,頂部的“ONDA”呼吸燈恰到好處,給這張顯卡增添了一抹點睛之筆。
當(dāng)然,性能方面才是它的殺手锏,得益于新架構(gòu)和大顯存的加持,這張顯卡在我們的游戲測試中可謂所向披靡,幾乎是上代顯卡無法企及的高度。散熱方面也相當(dāng)不錯,超強的散熱系統(tǒng)與動力十足的風(fēng)扇相配合,展現(xiàn)了無以倫比的功耗與溫度表現(xiàn),甚至在超頻測試中,還能盡情釋放,實現(xiàn)核心與顯存的雙雙超頻,性能提升也十分可觀。
最后再聊聊這款顯卡的售價,RTX 4080公版上市時首發(fā)價9499元,雖然它的性能強勁,但高昂的售價依舊讓不少玩家望而卻步,緊接著發(fā)售的不少AIC顯卡也在9499元之上。不過昂達GeForce RTX 4080 魔劍 16GB顯卡可謂是獨樹一幟,一經(jīng)上市就是8999元的超值售價,如果你最近剛好想入手一款旗艦性能的高端顯卡,那筆者推薦你關(guān)注一下昂達GeForce RTX 4080 魔劍 16GB,低調(diào)冷艷的外觀,極致震撼的性能是你不容錯過的理由。
技術(shù)講解:Ada Lovelace架構(gòu)
Ada Lovelace架構(gòu)講解
Turing、Ampere上兩代架構(gòu)核心均以人物來命名,前者是計算機科學(xué)之父——艾倫·麥席森·圖靈;后者則是“電學(xué)中的牛頓”——安德烈·瑪麗·安培,電流的國際單位安培就是以其姓氏命名。那Ada Lovelace定非凡人,度娘一下果然,這是 人稱“數(shù)字女王”的阿達·洛芙萊斯,編寫了歷史上首款電腦程序,是被世界公認的第一位計算機程序員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫喔。
從Turing架構(gòu)開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RT Core單元,以及面向AI推理的Tensor Core單元,這革命性的創(chuàng)新使實時光線追蹤成為可能。而Ampere架構(gòu)則是全面的架構(gòu)改進,在加入新一代的二代RT Core和三代Tensor Core基礎(chǔ)上,還有著更先進的SM單元設(shè)計,這樣顯卡工作效率那是翻倍的提升。而來到Ada Lovelace架構(gòu),同時是以效率提升為大前提,自然是引入了最新的第三代 RT Cores與第四代 Tensor Cores單元,同時加入眾多新穎的黑科技,從執(zhí)行效率來說Ada Lovelace架構(gòu)是上代Ampere架構(gòu)的2倍以上,甚至光線追蹤能力更是達到了恐怖的4倍性能。
全新的SM流式多處理器
Ada Lovelace架構(gòu)中最大的亮點之一:全新的SM流式多處理器,每個SM包含了128個CUDA核心、1個第三代的RT Cores,4個第四代 Tensor Cores(張量核心)、4個Texture Units(紋理單元)、256 KB Register File(寄存器堆),以及128 KB L1 數(shù)據(jù)緩存/共享內(nèi)存子系統(tǒng),于是這一個全新的SM單元有著超過上一代2倍之的性能表現(xiàn)。
過去的Turing架構(gòu)INT32 計算單元與FP32數(shù)量是一致的,而兩者相加才組成了64個CUDA核心。但是Ampere架構(gòu)開始,左側(cè)的計算單元實現(xiàn)了FP32+INT32的計算單元并發(fā)執(zhí)行,也就是說CUDA核心數(shù)量翻倍到了128個。
再來看看Ada Lovelace架構(gòu)的SM,F(xiàn)P32/INT32的計算單元組合,同樣實現(xiàn)了每個SM內(nèi)含128個CUDA的設(shè)計,看似提升不大,但是當(dāng)你了解到GeForce RTX 4080擁有76個SM,9728個CUDA核心,那你也就應(yīng)該明白達82.6 TFLOPS的著色器能力是如何實現(xiàn)的了,比上一代的RTX 3090 Ti顯卡的40 TFLOPS,還真是提升了兩倍有多。
另外緩存方面Ada Lovelace架構(gòu)也進行了大規(guī)格的提升,首先每個SM單元中單獨配上了128 KB的緩存,這樣RTX 4080顯卡中就實現(xiàn)了97MB L1/共享內(nèi)存。其次核心的二級緩存進行進行了重新的設(shè)計,并且完整AD103核心與RTX 4080都是64MB二級緩存,相比RTX 3080 Ti可以說是質(zhì)的飛躍。
技術(shù)講解:第三代RT Cores與第四代Tensor Cores
以為剛才的CUDA數(shù)量與超大L2緩存就已經(jīng)很猛了,實現(xiàn)上Ada Lovelace架構(gòu)最大的提升還是在第三代 RT Cores與第四代 Tensor Cores身上。
第三代 RT Cores
RT Cores用于光線追蹤加速,第三代 RT Cores 的有效光線追蹤計算能力達到 191 TFLOPS,是上一代產(chǎn)品 2.8 倍。
在Ampere架構(gòu)中,第二代RT Cores支持邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing),用于加速BVH遍歷和執(zhí)行射線三角交叉測試計算,雖然光線追蹤處理能力已經(jīng)比初代的Turing架構(gòu)核心更高效,但是隨著環(huán)境和物體的幾何復(fù)雜性持續(xù)增加,傳統(tǒng)的處理方式很難再以更高效率、正確反應(yīng)出的現(xiàn)實世界中的光線,尤其是光的運動準確性。
所以在第三代 RT Cores增加了兩個重要硬件單元:Opacity Micromap Engine與Displaced Micro-Meshes Engine引擎。Opacity Micromap Engine,主要是用于alpha通道的加速,可以將 alpha 測試幾何體的光線追蹤速度提高2倍。
在傳統(tǒng)光柵渲染中,開發(fā)人員使用一些 Alpha 通道的素材來實現(xiàn)更高效的畫面渲染,例如 Alpha 通道的葉子或火焰等復(fù)雜形狀的物體。但在光線追蹤時代,這傳統(tǒng)的做法會為光線追蹤帶為不少無效的計算,例如運動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調(diào)用一次著色器來確定如何處理相交,這時就會做成嚴重的執(zhí)行成本與時間等待成本。
而Opacity Micromap Engine用于直接解析具有非不透明度光線交集的不透明度狀態(tài)三角形。根據(jù)Alpha 通道的不透明,透明與未知等三個不同的塊狀態(tài)進行處理:透明則直接忽略繼續(xù)找下一個,不透明塊則記錄并告之命中,而未知的則交給著色器來確定如何處理,這樣GPU很大部分都不需要進行著色器的調(diào)試處理,能夠?qū)崿F(xiàn)更為高效的性能。
Displaced Micro-Meshes Engine
如果說Opacity Micromap Engine加速的是面處理,那么Displaced Micro-Meshes Engine就是幾何曲面細節(jié)的加速器。如上圖所示,在Ada Lovelace架構(gòu)中,通過1個基底三角形+位移地圖,就可以創(chuàng)建出一個高度詳細的幾何網(wǎng)格,所需要資源占用比二代RT Cores更低,效率也更高。
通過NVIDIA給出的創(chuàng)建14:1珊瑚蟹例子來說事,這里我們需要需要1.7萬個微網(wǎng)格、160萬個微三角形,在Ada Lovelace架構(gòu)中BVH創(chuàng)建速度可加快7.6倍,存儲空間縮小8.1倍。Displaced Micro-Meshes Engine起到了關(guān)鍵性的作用,其將一個幾何物體根據(jù)不同細節(jié)分成密度不一的微網(wǎng)絡(luò)處理,紅色密度超高,細節(jié)處理越為復(fù)雜 。相應(yīng)的低密度微網(wǎng)絡(luò)區(qū)域則可以釋放更多的資源與存儲空間,這樣Displaced Micro-Meshes Engine就可以幫助BVH加速過程,減少構(gòu)建時間和存儲成本。
同時Ada Lovelace架構(gòu)SM中新增了著色器執(zhí)行重排序(Shader Execution Reordering,SER),這是由于光線追蹤不再只有強光或者陰影渲染處理,未來將會更多的是在光線的運動性,這樣光線就會變得越來越復(fù)雜,想要第三代 RT Cores與第四代 Tensor Cores有著更高的執(zhí)行效率,那就得為他們來安排一位管家。而著色器執(zhí)行重排序(SER)就是為了能夠即時重新安排著色器負載來提高執(zhí)行效率,為光線追蹤提供2倍的加速,也能更好地利用 GPU 資源。不過目前仍未有實例,想實現(xiàn)這個功能,還得游戲與開發(fā)工具的支持才行。
第四代 Tensor Cores
Tensor Cores是專門為執(zhí)行張量/矩陣運算而設(shè)計的專用執(zhí)行單元,這些運算是深度學(xué)習(xí)中使用的核心計算功能。第四代 Tensor Cores 新增 FP8 引擎,具有高達 1.32 petaflops 的張量處理性能,超過上一代 的 5 倍。
技術(shù)講解:DLSS 3
技術(shù)講解:DLSS 3
或者說第四代 Tensor Cores太硬核你不會知道是啥?提升意義在哪?但是Tensor Cores最經(jīng)典的應(yīng)用DLSS你肯定會知道,這一次Ada Lovelace架構(gòu)支持NVIDIA最新的DLSS3技術(shù)。
之前我們也聊過DLSS技術(shù),其設(shè)計之初是為了彌補光線追蹤技術(shù)后的性能損失,具體的表現(xiàn)為開啟光線追蹤技術(shù)后游戲幀數(shù)大幅度的下降,甚至很難保證游戲流暢的運行。于是DLSS使用低分辨率內(nèi)容作為輸入并運用AI技術(shù)輸出高分辨率幀,從而提升光線追蹤的性能。
在DLSS3中包含了三項技術(shù):DLSS 幀生成、DLSS 超分辨率(也稱為 DLSS 2)和 NVIDIA Reflex。你可以理解為DLSS3是在DLSS2的基礎(chǔ)上,新增了DLSS 幀生成技術(shù);而后兩技術(shù)中,DLSS 超分辨率只需要GeForce RTX顯卡都能使用上,NVIDIA Reflex則是GeForce 900 系列以后的顯卡都用使用上。
想實現(xiàn)DLSS 幀生成可不簡單,這需要配合上Ada Lovelace架構(gòu)的GeForce RTX 40系列顯卡才行。DLSS 幀生成技術(shù)原理是:利用 AI 技術(shù)生成更多幀,以此提升性能。DLSS 會借助 GeForce RTX 40 系列 GPU 所搭載的全新光流加速器分析連續(xù)幀和運動數(shù)據(jù),進而創(chuàng)建其他高質(zhì)量幀,同時不會影響圖像質(zhì)量和響應(yīng)速度。
從Ampere架構(gòu)開始,NVIDIA顯卡就已經(jīng)支持了光流加速器,而Ada Lovelace架構(gòu)的光流加速器升級到了第二代,其提供了高達300 TeraOPS (TOPS) ,比安培架構(gòu)的初代光流加速器(Optical Flow Acceleration,OFA)快 2 倍以上。為了實現(xiàn)DLSS幀生成,OFA扮演了重要的角色,其配合上新的運行矢量分析算法在DLSS 3技術(shù)框架內(nèi)實現(xiàn)精確和高性能的幀生成能力。
另外,由于DLSS 幀生成是在GPU上作為后處理執(zhí)行的,那么即使在游戲受到CPU性能限制的時候,我們同樣能夠從中獲得更好的游戲性能提升。尤其是那種物理計算密集型的游戲或大型場景游戲,DLSS2均可以讓GeForce RTX 40系列顯卡以高達兩倍于CPU可計算的性能來渲染游戲。
最后由于DLSS 3是建立在DLSS 2基礎(chǔ)之上的,游戲開發(fā)者可以在已支持DLSS 2或NVIDIA Streamline的現(xiàn)有游戲中快速集成該功能,所以DLSS 3已在游戲生態(tài)得到廣泛應(yīng)用,目前已有超過35款游戲和應(yīng)用即將支持該技術(shù)。
閱讀小亮點:NVIDIA Reflex
NVIDIA Reflex也是DLSS3其中的一環(huán),它可以使GPU和CPU同步,確保最佳響應(yīng)速度和低系統(tǒng)延遲。
想要實現(xiàn)端對端的最低延遲,你需要確保游戲、顯示器以及鼠標三者都同時支持并開啟了Reflex 技術(shù)。
當(dāng)GeForce RTX 40 系列顯卡和 NVIDIA Reflex搭配上后,直接達到1440p分辨率360 FPS的體驗,這著實是性能有點強勁了。
在GTC2022大會時已經(jīng)透露將會還有4 款 1440p 分辨率的新型 G-SYNC 電競顯示器將要發(fā)布,包括采用mini-LED技術(shù)的AOC AG274QGM – AGON PRO Mini LED、MSI MEG 271Q Mini LED 和 ViewSonic XG272G-2K Mini LED三款顯示器刷新率均為300Hz,而最猛的是ASUS ROG Swift 360 Hz PG27AQN ,刷新率直接來到了360Hz。
但唯一一個問題就在于,部分顯示器廠商認為此類產(chǎn)品受眾人群較少,會降低此類顯示器的產(chǎn)能,甚至產(chǎn)品就已經(jīng)被內(nèi)部PASS掉,所以1440p 360Hz是很美好,但現(xiàn)實也是相當(dāng)?shù)墓歉小?/p>
技術(shù)講解:雙NVIDIA編碼器
技術(shù)講解:雙NVIDIA編碼器(NVENC)
GeForce RTX 40 系列顯卡還有一個全新的升級,那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式 AV1。
而由于AV1是一種免版稅的視頻編碼格式,上游軟件廠商與下游戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬件與軟件支持AV1格式,包括剪映專業(yè)版、DaVinci Resolve、以及 Adobe Premiere Pro 較為流行的 Voukoder 插件均支持,且均可通過編碼預(yù)設(shè)使用雙編碼器,這樣我們等待視頻導(dǎo)出的時間縮短將近一半。
不單是視頻制作軟件,AV1格式也將會是主播、游戲直播UP主們的新寵兒,在保證畫面最高質(zhì)量的情況下,AV1 編碼器可將效率提高 40%,同時顯卡的占用也更低。包括OBS Studio一一代軟件中也會增加AV1格式的支持。另外我們還能通過 GeForce Experience 和 OBS Studio 錄制高達 8K60 的內(nèi)容,這樣我們做游戲錄制也會變得更為輕松。
包括我們之后測試時使用的游戲內(nèi)錄視頻都是支持AV1格式,同時雙編碼器NVENC在資源占用和適配上做得越來越好。
以上就是關(guān)于刷卡機刷卡顯示超出時間范圍,昂達 RTX 4080 魔劍顯卡評測的知識,后面我們會繼續(xù)為大家整理關(guān)于刷卡機刷卡顯示超出時間范圍的知識,希望能夠幫助到大家!

轉(zhuǎn)載請帶上網(wǎng)址:http://www.cnksdq.com.cn/shuaka/61460.html