對于DIYer來說,今年的處理器市場無疑是近10年來最為精彩的,憑借基于ZEN架構(gòu)的AMD
面粉機銳龍7、銳龍5、銳龍3處理器的上市,AMD
磨面機處理器在性能與價格上都與競爭對手英特爾的同級產(chǎn)品展開了有力的競爭,如今四核處理器即將成為主流市場標(biāo)配,只需1500元就能買到擁有12條運算線程的處理器,這激烈的競爭為消費者帶來了切實的好處。不過在有個領(lǐng)域,在今天晚上9點之前,卻長時間處于一家獨大的局面——這就是頂級消費級處理器市場。
自2006年英特爾推出Core微架構(gòu),并發(fā)布Core 2 Extreme X6800頂級處理器擊敗當(dāng)時的AMD FX-62處理器后,在長達(dá)11年的時間里,Extreme系列處理器一直借助首屈一指的性能,以及配套的各類X58、X79、X99、X299等高端主板稱霸頂級處理器市場。
不過情況在今年終于有了一點改變,從基于AMD ZEN面粉機yvap.cn架構(gòu)的銳龍?zhí)幚砥鞅憩F(xiàn)可以看到,這類處理器不僅單線程性能有了大幅提升,還通過加入SMT技術(shù)大幅提升了處理器的多線程運算能力,也就意味著ZEN架構(gòu)不僅可以打造出像銳龍7、銳龍5磨面機yvap.cn這樣的中高端處理器,更擁有開發(fā)出頂級處理器的潛力。
終于在11年之后,在今晚9點以后,這個猜想成為了現(xiàn)實。AMD再次重返頂級處理器市場了,帶來了其新一代頂級產(chǎn)品——AMD 銳龍Threadripper處理器,以及配套的X399主板。
它是否擁有將現(xiàn)在的英特爾頂級處理器即Core i9系列斬于馬下的能力?
自從AMD發(fā)布了全新的Zen架構(gòu)的銳龍?zhí)幚砥骷易搴?,AMD在CPU市場上的頹勢地位就徹底改變了。銳龍的發(fā)布意味著AMD不僅重新開始推出頂級處理器,而且還通過挑戰(zhàn)英特爾,重新引導(dǎo)市場走向健康的競爭發(fā)展中。戰(zhàn)火總是永不停息的。在銳龍?zhí)幚砥靼l(fā)布后,AMD又開始布局全新的市場,將目光轉(zhuǎn)向那些更高端、對更多CPU核心有需求的用戶。
從市場角度和用戶組成的情況來看,高端市場不僅僅只是游戲玩家,還有大量對渲染、3D建模、視頻編輯、音頻編輯、代碼編譯等工作有需求的用戶。這些用戶在之前只能選擇最多四個物理核心的高端處理器來加速自己的工作,或者被迫選擇更昂貴和稀少的專業(yè)級產(chǎn)品。不過,隨著AMD全新推出的銳龍Threadripper系列處理器,這樣的態(tài)勢將徹底發(fā)生變化。
目前AMD推出了兩款銳龍Threadripper處理器,型號分別是銳龍Threadripper 1950X和銳龍Threadripper 1920X。對于其規(guī)格列表如下:
從表中可以看出,這兩款處理器在維持了高核心數(shù)量(均超過10個)的同時,在頻率上也沒有縮水,其中銳龍 Threadripper 1950X的最高頻率甚至可以達(dá)到4.2GHz(當(dāng)然只有4個核心開啟的狀態(tài)下),L2和L3緩存容量也至少達(dá)到了38MB,可以說AMD本次基本上屬于將之前的超多核心、面向服務(wù)器和工業(yè)領(lǐng)域的高端處理器產(chǎn)品拓展至民用市場,極大的拓寬了民用市場用戶的選擇范圍。
▲銳龍Threadripper處理器拋棄了傳統(tǒng)處理器所用的紙盒包裝,每顆處理器都采用類似存放珠寶的大型首飾盒包裝起來。包裝外圍由一層軟性泡沫材質(zhì)包裹,中間上部開有一個透明視窗,印有“Ryzen Threadripper”字樣以及“ZEN”的經(jīng)典圖案。
▲處理器外圍配有一層橙色安裝導(dǎo)軌,可不用取下,安裝時可引導(dǎo)插入處理器插槽相應(yīng)的導(dǎo)軌中。同時,處理器附送了內(nèi)六角安裝螺絲刀。
▲可以看到Threadripper處理器比普通的8核心銳龍7處理器大了很多
另外,新的銳龍 Threadripper處理器全部改用了LGA封裝,接口也換成全新的SocketTR4,簡稱sTR4,針腳觸點數(shù)量高達(dá)4094個,遠(yuǎn)超英特爾之前HEDT平臺的LGA 2066針腳數(shù)量,因此整個處理器的面積也大了不少,安裝上也需要特殊扣具輔助。
和一般處理器安裝不同的是,銳龍 Threadripper需要插入主板CPU扣具的固定槽內(nèi)后,用螺絲固定在CPU扣具上,再涂抹硅脂并安裝散熱器。用戶應(yīng)該可以在主板說明書和CPU說明書上找到相應(yīng)的說明。
▲安裝處理器時,需先遵照插槽上的提示,按順序分別擰松編號為3、2、1的內(nèi)六角螺絲,打開插槽,揭開保護蓋。
▲再借助橙色導(dǎo)軌,將處理器插入插槽保護蓋一側(cè)的固定槽內(nèi)。
▲然后將處理器平放在插槽上方,并按順序分別擰緊編號為1、2、3的內(nèi)六角螺絲即完成安裝。
5大特點——使用在銳龍 Threadripper上的AMD Zen架構(gòu)
有關(guān)AMD的Zen架構(gòu),之前本刊介紹過多次。在這里,本文還將簡要回顧一下銳龍 Threadripper處理器所采用的Zen架構(gòu)的特性。
根據(jù)AMD官方描述,Zen微架構(gòu)擁有的以下幾大特點:
01
更高的性能
采用了全新的增強指令集并行,大幅度提高了單線程性能。AMD Zen架構(gòu)的設(shè)計目的在于有效提升了處理器的IPC。在內(nèi)核架構(gòu)上主要做出了四方面的改進:
一是采用了1.75倍于之前架構(gòu)的、更大的指令調(diào)度器窗口以及1.5倍于之前架構(gòu)的排序?qū)挾群唾Y源,大大緩解了指令擁塞情況。
二是采用了全新的緩存架構(gòu),允許部分頻繁訪問的微操作繞過L2和L3緩存直接讀取。
三是采用了全新設(shè)計的、基于神經(jīng)網(wǎng)絡(luò)預(yù)測的分支預(yù)測單元,大幅度提高了分支預(yù)測效率,降低了由于分支預(yù)測失敗帶來災(zāi)難性后果的可能性。
四是加入了SMT功能,可以大幅度提高指令管線的填充度,提高效率。
▲Zen架構(gòu)方面的改進
02
更大的吞吐量
通過全新的緩存結(jié)構(gòu)和預(yù)取引擎,大幅度提升了數(shù)據(jù)吞吐速率。具體來說,Zen架構(gòu)徹底改變了緩存體系,采用為每個核心配備64KB L1指令和數(shù)據(jù)緩存,以及512KB L2專用緩存,同時四個內(nèi)核共享的8MB L3緩存的設(shè)計方案,更符合現(xiàn)代處理器的實際需求。
同時緩存帶寬大幅度提升至前代產(chǎn)品的5倍,提高了緩存存取效率。此外,AMD還專門為緩存設(shè)計了一個預(yù)取器,用于推測那些數(shù)據(jù)將可能被緩存儲存、那些數(shù)據(jù)可能會被核心調(diào)用,大幅度提高了緩存利用效率。
▲Zen架構(gòu)在緩存方面做出了重大調(diào)整
03
更好的能耗比
從設(shè)計端開始,以低功耗、高性能為目的設(shè)計產(chǎn)品,加入更多的智能和主動地管理處理器功耗功能,降低無效損耗,提高處理器能耗比。在這一點上,Zen架構(gòu)的產(chǎn)品采用了全新的14nm FinFET密度優(yōu)化版本工藝制造,相比前代28nm甚至32nm工藝,在大幅度降低了電壓、漏電電流等不利因素的同時,提升了頻率和能耗比。值得一提的是,這種全新的14nm工藝允許使用更低的工作電壓和更小的管芯尺寸,從而進一步降低功耗、提升頻率。
另外,AMD在架構(gòu)方面改進(比如前文提到的微操作改進)、時鐘管理政策的改善等,都帶來了Zen架構(gòu)產(chǎn)品在性能功耗比上的優(yōu)異表現(xiàn),這使得Zen架構(gòu)可以從低功耗移動版處理器擴展至HEDT產(chǎn)品,擁有巨大的功耗彈性。
▲Zen架構(gòu)加入了很多節(jié)能方面的設(shè)計。
04
更出色的可擴展性
通過使用名為Infinity Fabric的全新高性能連接,實現(xiàn)不同處理器模塊的有效擴展,以及AMD不同IP核心之間的通訊。AMD的Infinity Fabric總線不僅可以通過其雙向42GB/s的帶寬實現(xiàn)不同CCX之間的高速連接,AMD還還可以利用Infinity Fabric實現(xiàn)對處理器不同核心之間的電壓、溫度、功耗、頻率等細(xì)節(jié)數(shù)據(jù)進行實時的控制和調(diào)整,實現(xiàn)處理器的高效率運行。
▲Zen架構(gòu)設(shè)計了基礎(chǔ)核心,被稱為CCX。所有的Zen架構(gòu)、Ryzen家族的處理器都是基于這款核心擴展而來。
05
兩種內(nèi)存工作模式
AMD的銳龍 Threadripper處理器不僅規(guī)模大、技術(shù)新穎,還加入了不少新的技術(shù)。在內(nèi)存方面,為了讓用戶有更出色的使用體驗,AMD提供了兩種不同的內(nèi)存模式供用戶選擇。
▲AMD的Ryzen Master調(diào)節(jié)軟件里提供了兩種內(nèi)存模式切換功能,本次測試中我們還是采用了默認(rèn)的Distributed Mode。
其中一種模式被稱為Distributed Mode,也就是采用UMA(Uniform Memory Access)統(tǒng)一內(nèi)存訪問模式。在這種模式下,系統(tǒng)將統(tǒng)一、優(yōu)先使用所有可用的內(nèi)存通道并自動分配相應(yīng)任務(wù)。這種模式下,內(nèi)存的總體性能和帶寬表現(xiàn)會比較出色,這也是AMD的默認(rèn)模式。
另一種模式被稱為Local Mode,采用的是nUMA(Non-Uniform Memory Access)非統(tǒng)一內(nèi)存訪問模式。這種模式下,CPU核心和控制器最優(yōu)先處理內(nèi)存物理結(jié)構(gòu)上離處理器最近的DIMM中的內(nèi)容,除非內(nèi)容過大會溢出到下一個內(nèi)存模塊。實際應(yīng)用中,如果將游戲或者需要加快處理速度的應(yīng)用放置在離CPU最近的DIMM中,可以降低這些應(yīng)用的延遲并提高整體效能。
AMD在自家的Ryzen Master工具軟件中,提供了兩種模式調(diào)整的軟件開關(guān),用戶只需要下載并安裝Ryzen Master,就可以直接手動選擇是采用Distributed亦或是Local模式。AMD還提供了測試數(shù)據(jù),理論數(shù)據(jù)來看,Local模式下的延遲要比Distributed模式大約低了23%,從86.9ns降低至66.2ns,但內(nèi)存?zhèn)鬏攷捯驳土俗罡呒s18%。而在實際應(yīng)用中,這兩種內(nèi)存工作模式的影響則復(fù)雜得多。根據(jù)AMD的評估,在75個游戲中,無論是Distributed還是Local模式,對不同游戲的影響是不確定的,Local模式大約會有5%到10%(峰值)的增益。
總的來說,AMD提供的兩種模式各有優(yōu)劣,一般玩家使用默認(rèn)模式就好,在本次測試中,我們也是采用Distributed Mode進行測試。對于追求極限、技術(shù)上也比較成熟的玩家可以考慮使用nUMA模式獲得與眾不同的性能體驗,不過可能需要一些額外操作,還需要進一步研究才能充分發(fā)揮其性能,本刊也將在后續(xù)對這一模式進行深度測試。
連接、擴展——銳龍 Threadripper架構(gòu)
目前AMD和英特爾都在推出超多核心處理器。比如英特爾的Xeon至強家族,就推出了最高達(dá)28核心的方案。不過,在核心數(shù)量超過4個以后,核心之間的互聯(lián)和同步問題就成為了處理器設(shè)計的關(guān)鍵因素之一,在這一點上,AMD和英特爾走向了完全不同的道路。在這里,本文先說一些題外話。
英特爾在早期的超多核心設(shè)計中采用的是環(huán)形總線架構(gòu)。相比傳統(tǒng)的交叉總線架構(gòu),環(huán)形總線架構(gòu)的優(yōu)勢要明確的多:環(huán)形總線結(jié)構(gòu)更為簡單,更為節(jié)省晶體管、功耗較低、在恰當(dāng)?shù)膬?yōu)化下能夠帶來非常不錯的性能。英特爾在環(huán)形總線上的首款產(chǎn)品就是大名鼎鼎的Nehalem,后來又通過不斷的優(yōu)化,從一條環(huán)形總線到兩條,英特爾的超多核心處理器從之前的6~8核心發(fā)展到最多22~24個,環(huán)形總線這才走向技術(shù)終點。
環(huán)形總線的優(yōu)勢主要是結(jié)構(gòu)簡單,但是隨著核心數(shù)量越來越多,其缺陷也逐漸放大。比如環(huán)形總線上每個核心掛接的點也越來越多,使得延遲逐漸增高。尤其是緩存一致性廣播等,需要不斷的在環(huán)形總線只減傳遞數(shù)據(jù),維持不同物理核心的同步,核心太多會導(dǎo)致數(shù)據(jù)傳輸?shù)却龝r間變長。
在最差的情況下,雙環(huán)形總線的兩個物理核心同步延遲甚至?xí)哌_(dá)數(shù)十個周期,這會帶來性能的大幅度降低和能源的損耗。因此,英特爾在新的處理器上放棄了環(huán)形總線設(shè)計,改用了全新的Mesh網(wǎng)絡(luò),同時為此徹底更新了處理器的緩存設(shè)計——環(huán)形總線的L3緩存較大,方便一致性的同時可以同時為多個處理器提供共享服務(wù)。
但是Mesh網(wǎng)路下,每個處理器都是節(jié)點,都可以傳遞和廣播數(shù)據(jù),這樣一來一個較大的L3存在的意義就被削弱了,因此英特爾改用了較大的L2和較小的L3,并且不再采用包含式結(jié)構(gòu),轉(zhuǎn)而采用獨立式緩存設(shè)計,L2和L3緩存數(shù)據(jù)互不影響,從本代產(chǎn)品開始,英特爾全面采用Mesh互聯(lián)架構(gòu)設(shè)計超多核心處理器,從目前的測試來看,其效果和性能表現(xiàn)還是不錯的。
回到AMD這里來。目前AMD所有的銳龍家族處理器產(chǎn)品都源于一個原生的四核心模塊,被稱為一個CPU Complex(CCX),CCX的內(nèi)部鏈接可能是交叉互聯(lián)也可能是通過其他的方式,由于其核心數(shù)量較少(只有四個物理核心),因此其技術(shù)難度相對來說低很多。對外部來說,AMD希望通過擴展CCX數(shù)量實現(xiàn)處理器核心數(shù)量增加,這就意味著各個CCX之間的連接就會成為關(guān)鍵。如果觀察AMD發(fā)布的代號為“Naples”的EPYC處理器,就會發(fā)現(xiàn)AMD實際上是將兩個CCX綁定為一個模塊,然后再通過Infinity Fabric總線將其連接起來。
從宏觀上看,Naples處理器四個模塊之間使用的依舊是傳統(tǒng)的交叉互聯(lián)方案,只是總線換成了Infinity Fabric。每個模塊的兩個CCX再用Infinity Fabric連接在一起。比如桌面版本的銳龍 7就是兩個CCX模塊使用Infinity Fabric總線連接獲得的“4+4”八核心處理器,也就是兩個CCX的Infinity Fabric總線直連。更高端的服務(wù)器版本的32核心霄龍EPYC處理器使用的是“(4+4)×4”的設(shè)計,四個模塊采用Infinity Fabric總線交叉互聯(lián)。
銳龍 Threadripper處理器則采用的是“(4+4)×2”或者“(3+3)×2”的方式,也就是兩個模塊采用Infinity Fabric總線直連的方案。
▲AMD展示的EYPC處理器,可見四個核心模塊在一個基板上。
▲AMD EYPC Naples處理器的內(nèi)部鏈接架構(gòu)簡圖
從連接角度來說,AMD的這種設(shè)計實際上避開了超多核心處理器設(shè)計所需要面對的物理連接上的問題,也避開了諸如使用環(huán)形總線或者Mesh架構(gòu)這樣的選擇。相比環(huán)形總線或者Mesh網(wǎng)絡(luò),傳統(tǒng)的交叉總線連接各模塊的主要問題在于模塊和模塊之間的同步和并行性問題應(yīng)該如何解決,也就是說如果兩個不同CCX之間需要通訊的話,如何解決通訊延遲和帶寬問題。在環(huán)形總線上,解決這個問題的是環(huán)形總線本身,在Mesh網(wǎng)絡(luò)中,每個核心自己就是收發(fā)站,可以轉(zhuǎn)發(fā)信息并選擇最快、最近、不擁堵的路徑。
舉例來說,當(dāng)兩個具有高度相關(guān)性的線程同時在系統(tǒng)中運行時,操作系統(tǒng)可能將其隨機分配在任何兩個空閑的核心執(zhí)行。如果是環(huán)形總線或者Mesh網(wǎng)絡(luò)的話,在處理器內(nèi)部能夠以比較高的高效率互聯(lián)互通,延遲甚至可以被各種方法所優(yōu)化、掩蔽,或者處理器在調(diào)配中可以將這兩個線程再度分配至擁有共享資源的兩個核心執(zhí)行(處理器對操作系統(tǒng)而言被看做一個整體的話),這樣可以實現(xiàn)降低延遲、提高效率的目的。
但在傳統(tǒng)網(wǎng)絡(luò)中,如果兩個有相關(guān)性的線程被分配給完全不同的兩個模塊處理,比如A模塊處理線程1,B模塊處理線程0,同時線程1和線程0存在高度相關(guān)性,其數(shù)據(jù)共享、一致性就需要通過總線來完成,這無疑增加了大量的通訊延遲。因為對傳統(tǒng)結(jié)構(gòu)的處理器來說,處理器A模塊的A1核心和B模塊的B1核心的通訊,需要通過A模塊的轉(zhuǎn)發(fā)中心轉(zhuǎn)發(fā)至Infinity Fabric總線后,再交由B模塊的轉(zhuǎn)發(fā)中心,再到達(dá)B1核心,中間的延遲和帶寬可能還是能夠?qū)π阅墚a(chǎn)生影響的。
這還僅僅是一種情況,實際操作中,如果存在對帶寬敏感的應(yīng)用,那么最好將這個應(yīng)用的不同線程均分在不同的CCX上,使其能夠使用更多的DDR4帶寬,因為每個CCX只能管理一對DDR4控制器。如果對延遲高度敏感,那么最好將所有線程都塞入一個CCX(當(dāng)然最好小于等于4個),這樣線程可以高速共享L3緩存,性能會有最佳表現(xiàn)。如果出現(xiàn)具有相關(guān)性、帶寬敏感和延遲敏感的應(yīng)用的多個線程需要執(zhí)行,這就非??简濧MD的優(yōu)化能力了。
另外,考慮到AMD宣稱Infinity Fabric總線的雙向帶寬為42GB/s,目前單通道DDR4內(nèi)存的帶寬差不多也在20GB/s左右,Infinity Fabric總線的帶寬實際上相當(dāng)于雙通道DDR內(nèi)存,即使延遲和讀取方面Infinity Fabric總線擁有絕對優(yōu)勢,但是這樣的帶寬和總線設(shè)計是否能滿足CPU內(nèi)部龐大的數(shù)據(jù)流量需求,尚不得而知。無論如何,CCX搭配Infinity Fabric總線的設(shè)計方案,還是需要盡可能的多的軟件和系統(tǒng)優(yōu)化才能發(fā)揮出應(yīng)有的性能。
▲AMD展示的銳龍Threadripper處理器內(nèi)部鏈接簡圖。
▲國外玩家對Ryzen Threadripper的開蓋結(jié)果,和EYPC處理器如出一轍。
繼續(xù)來看Threadripper。根據(jù)目前的消息來看,AMD的Threadripper處理器更像是從服務(wù)器級別的EPYC處理器中“下放”而來。因為從CPU接口以及內(nèi)部核心排布來看,銳龍Threadripper處理器內(nèi)部依舊存在四個模塊,也就是8個CCX,32個物理核心。對銳龍Threadripper 1950X來說,AMD屏蔽了2個模塊或者4個CCX、16個核心,實現(xiàn)“(4+4)×2”;對銳龍Threadripper 1920X來說,AMD在屏蔽2個模塊或者4個CCX、16個核心的基礎(chǔ)上,在開啟的4個CCX中還額外每CCX屏蔽一個核心,最終實現(xiàn)了12個核心的效果,實現(xiàn)“(3+3)×2”。
目前AMD尚未對任何有關(guān)銳龍Threadripper處理器為什么使用這么多模塊以及為何拆蓋后有四個Die的問題給出明確的回答。這也引發(fā)了一些討論,諸如未開啟的模塊是否依舊可以使用Infinity Fabric總線,兩個開啟的模塊之間的Infinity Fabric總線連接是否有且只有一條——因為從實用角度考慮,如果能夠有更多的總線連接兩個模塊,帶寬資源和傳輸能力更高的話,對處理器實際并行計算時的表現(xiàn)還是有正向影響的,只是不知道AMD是如何處理的。
全新接口、全新芯片組——X399芯片組解析
在發(fā)布全新處理器的同時,AMD也發(fā)布了全新的X399芯片組與之相配。由于現(xiàn)代處理器已經(jīng)都集成了諸如內(nèi)存控制器、PCI-E總線控制器、SATA總線控制器、USB控制器等部件,因此芯片組主要用于提供諸如更多的USB、SATA、網(wǎng)絡(luò)接口等功能。
▲AMD X399芯片組與銳龍?zhí)幚砥鲾U展能力對比,可見PCIe 3.0通道主要由處理器提供,X399芯片組主要提供USB 3.1、SATA接口。
AMD X399芯片組額外提供了2個USB 3.1 Gen 2,6個USB 3.1 Gen 1,6個USB 2.0,2個PCI-E 3.0通道和8個PCIe 2.0通道、8個SATA以及SATA RAID功能。當(dāng)然,這是芯片組所提供的最大可連接設(shè)備數(shù)量,在實際使用中,廠商可能會根據(jù)需要來調(diào)整,比如將PCI-E 3.0通道轉(zhuǎn)為PCI-E Express或者SATA接口等。另外,X399和CPU的連接依靠的是PCI-E 3.0 4X通道,從規(guī)格上來看,這是額外的通道,并不會占用芯片組本身的連接通道數(shù)量。
在和CPU搭配時,X399搭配CPU能夠帶來總計最多66條PCI-E 3.0通道,其中64條來自CPU,用戶可以用其組建多卡系統(tǒng)或者更強悍的高速磁盤系統(tǒng)。比如AMD宣稱可以搭配成2個PCI-E 3.0 16X搭配2個PCI-E 3.0 8X以及3個NVMe,或者是6個PCI-E 3.0 8X搭配1個4X NVMe,當(dāng)然具體如何使用,還需要根據(jù)用戶和廠商設(shè)計來定。
由于目前CPU支持四通道內(nèi)存,但由于內(nèi)存規(guī)格和兼容性等問題,X399主板搭配銳龍Threadripper處理器使用時,還存在不同的搭配情況。根據(jù)AMD官方說明,在啟用四通道內(nèi)存的情況下,根據(jù)內(nèi)存Ranks(就是單面、雙面內(nèi)存)不同、每通道內(nèi)DIMM數(shù)量不同(就是每通道插入多少內(nèi)存條,最多每通道只支持2根內(nèi)存條),內(nèi)存頻率會有顯著差異,最高可以支持DDR4 2667,這是在使用四通道、單面內(nèi)存、每通道一根內(nèi)存條的情況下,最低只能使用到DDR4 1866,這是四通道、雙面內(nèi)存、每通道兩根內(nèi)存的情況下。
出現(xiàn)這種問題主要是考慮到內(nèi)存同步和數(shù)據(jù)刷新延遲等,一般內(nèi)存通道越多、Ranks越多、DIMM數(shù)量越多,支持的同步頻率就會越低。
在超頻功能上,X399支持對CPU的自由超頻功能。因為目前所有銳龍Threadripper處理器都是不鎖倍頻的,用戶可以自行調(diào)整核心頻率、電壓等設(shè)置。
首發(fā)X399主板大賞:ROG ZENITH EXTREME
不知大家是否記得,當(dāng)今頂級主板品牌ROG的起源,實際上也來源于AMD平臺。ROG第一款產(chǎn)品就是為Athlon 64 FX CPU設(shè)計出Crosshair主板。可以說ROG始于AMD高端桌面平臺,現(xiàn)今華碩又為X399芯片組和銳龍Threadripper處理器,打造出ROG ZENITH EXTREME主板。此主板以天頂為名,將超頻、散熱、光影糅合一體,意在為玩家?guī)砣碌腁MD平臺體驗。
▲8相CPU核心供電設(shè)計,搭配IR國際整流器公司IR 3555M PowIRstage一體式封裝MOSFET、日系黑金固態(tài)電容、12顆松下SP-Cap聚合物鋁電容。
為了有力地支持像銳龍Threadripper這樣的超多核心頂級處理器,ROG ZENITH EXTREME主板采用了優(yōu)秀的做工用料。首先其處理器供電部分采用了8相CPU核心供電設(shè)計,每相供電電路搭配最大可承載60A電流的IR國際整流器公司IR 3555M PowIRstage一體式封裝MOSFET,也就是說8相供電電路最大可承載480A電流,應(yīng)對銳龍Threadripper處理器180W的TDP可以說綽綽有余。
此外主板處理器供電部分不僅搭配了可在105℃環(huán)境溫度下工作10000小時的日系黑金固態(tài)電容、全封閉電感,還在主板PCB背面配備了總計12顆松下SP-Cap聚合物鋁電容。SP-Cap聚合物鋁電容是采用高導(dǎo)電率的聚合物材料作為陰極的片式疊層鋁電解電容器。此類電容具有極低的等效串聯(lián)電阻(ESR),降低紋波電壓能力強,允許通過更大紋波電流。聚合物片式疊層鋁電解電容器在高頻下,阻抗曲線呈現(xiàn)近似理想電容器特性。
在頻率變化情況下,電容量非常穩(wěn)定,更適合在高頻、高負(fù)載環(huán)境下工作,一般僅在高端板卡產(chǎn)品上能看到此類SP-Cap聚合物鋁電容的采用。
▲LiveDash OLED顯示屏不僅可以顯示各種監(jiān)控信息,還可顯示非常有趣的小動畫、LOGO。
最有特色的是在主板散熱器上配備了名為LiveDash的OLED顯示屏,玩家可通過它方便地掌握系統(tǒng)溫度、CPU頻率、風(fēng)扇轉(zhuǎn)速等信息。同時,用戶還可以在這個小窗口上顯示各種黑白動畫(可加載顯示用戶自己設(shè)計的動畫),如華碩LOGO、奔跑的恐龍、UFO,非常有趣,也令玩家的電腦更顯個性化。
▲附送ROG Areion萬兆網(wǎng)卡
網(wǎng)絡(luò)方面,該主板不僅板載了支持802.11ad協(xié)議、理論傳輸速度可達(dá)4600Mbps的無線網(wǎng)卡,還為用戶附送了最新的ROG Areion萬兆網(wǎng)卡。這款網(wǎng)卡采用傳統(tǒng)的半刀卡造型,占用單槽空間,與常規(guī)聲卡和PCIe SSD差不多。同時它還配備了半封閉式鋁合金保護罩,還有CNC工藝雕刻、醒目的ROG“敗家之眼”LOGO。網(wǎng)卡芯片基于Aquantia的AQtion AQC107方案,并設(shè)計有大型散熱片輔助散熱,以保證網(wǎng)卡的穩(wěn)定工作。
網(wǎng)卡接口采用了高大上的PCIe 3.0 x4,尾部提供自適應(yīng)單LAN RJ45端口,兼容100Mbps、1Gbps、2.5Gbps、5Gbps和10Gbps。另外,尾部LAN口和PCB邊緣設(shè)有指示燈,可顯示工作狀態(tài)。
▲借助AURA SYNC同步發(fā)光技術(shù),主板可以多種色彩顯示。
同時ROG ZENITH EXTREME主板也支持目前流行的AURA SYNC同步發(fā)光技術(shù),不僅主板自身可以靜態(tài)、呼吸、閃爍、多彩循環(huán)、節(jié)奏等多種模式、多種色彩顯示,還可與其他支持AURA SYNC的燈帶、顯卡、外設(shè)等可發(fā)光配件以相同的模式、速度顯示燈效,幫助玩家打造更加宏偉的整機燈效。
▲ROG ZENITH EXTREME主板上的DIMM.2 模組擴展卡可以幫助用戶額外安裝兩塊M.2 SSD。
此外ROG ZENITH EXTREME主板也擁有ROG主板特有的DIMM.2 模組擴展卡,通過一個DDR4插槽可擴展2個M.2 SSD插槽,此創(chuàng)新設(shè)計可以讓用戶在M.2 固態(tài)硬盤上安裝內(nèi)存條散熱馬甲,獲得更高、更穩(wěn)定的性能,也可支持更多的M.2 SSD。加上主板PCB上的M.2插槽,ROG ZENITH EXTREME主板最多可支持三塊M.2 SSD。
▲識別本二維碼,可直接前往ROG ZENITH EXTREME主板的銷售頁面,了解活動詳情。
總體來看,ROG ZENITH EXTREME主板就是一款為銳龍Threadripper處理器量身打造的頂級產(chǎn)品,整合使用了各種功能與高品質(zhì)元件,其官方售價在6999元左右。目前京東交100元定金可抵1000元的活動,使得該主板的售價大降至6099元,比較超值。掃描下圖的二維碼,就可直接前往ROG ZENITH EXTREME的銷售頁面,了解活動詳情。
我們?nèi)绾螠y試(一級標(biāo)題)
本次測試最大的目的就是在技術(shù)規(guī)格、配置相近的情況下,檢驗AMD銳龍Threadripper處理器的性能是否能與價位相近的Core i9-7900X 10核心處理器匹敵。因此首先我們將通過基準(zhǔn)性能、應(yīng)用性能、游戲性能、處理器溫度以及平臺功耗這幾大板塊來進行銳龍Threadripper 1950X、銳龍Threadripper 1920X與Core i9-7900X的對比測試,同時,我們將對兩款銳龍Threadripper處理器進行超頻測試,以考察在采用超多核心設(shè)計時,處理器是否還擁有超頻能力。
測試平臺一覽
主板:ROG Zenith Extreme、華碩PRIME X299-DELUXE
處理器:銳龍Threadripper 1950X、銳龍Threadripper 1920X
內(nèi)存:芝奇TridentZ DDR4 3200 32GB內(nèi)存套裝(8GB×4)
硬盤:三星960PRO 512GB SSD+東芝饑餓鯊512GB SATA SSD+希捷3TB HDD
顯卡:ROG-STRIX-GTX1080TI-O11G-GAMING
散熱器:TT FLOE RIING360水冷散熱器
電源:TT TOUGH POWER DPS G 1250W電源
處理器性能測試
測試點評:首先從處理器基準(zhǔn)測試來看,采用16核心設(shè)計的AMD銳龍Threadripper 1950X顯然有非常巨大的優(yōu)勢,憑借核心數(shù)量多的優(yōu)勢,它在所有考察了多線程運算的測試項目中都取得了領(lǐng)先。如CINEBENCH R15多核心渲染性能達(dá)到3051cb,32個框框同時渲染的速度遠(yuǎn)遠(yuǎn)超過以往任何一款消費級處理器,幾乎也就看了兩條朋友圈的時間,渲染就完成了。
而采用12核心設(shè)計的銳龍Threadripper 1920X在大部分多線程測試中相對于10核心設(shè)計的Core i9-7900X也有一定的優(yōu)勢。當(dāng)然英特爾Core i9-7900X處理器憑借雙核心可工作在4.5GHz的頻率優(yōu)勢,在單線程性能方面則有更好的表現(xiàn)。
內(nèi)存性能測試
▲AMD銳龍Threadripper 1950X內(nèi)存性能
▲AMD銳龍Threadripper 1920X內(nèi)存性能
▲Core i9-7900X內(nèi)存性能
測試點評:內(nèi)存性能方面,雖然AMD銳龍Threadripper處理器的官方規(guī)格為最高支持四通道DDR4 2666內(nèi)存,但在ROG ZENITH EXTREME主板的配合下,兩款A(yù)MD銳龍Threadripper處理器都能與Core i9-7900X處理器一樣,實現(xiàn)對四通道DDR4 3200的支持。
而從傳輸帶寬來看AMD銳龍Threadripper處理器已經(jīng)可與Core i9-7900X匹敵,尤其是其近90000MB/s寫入帶寬優(yōu)勢突出,達(dá)到了一個四通道內(nèi)存系統(tǒng)的正常表現(xiàn)。不過在內(nèi)存延遲上,銳龍?zhí)幚砥鲀?nèi)存延遲較高的問題在Threadripper處理器上仍然存在,因此其總體內(nèi)存性能較Core i9系統(tǒng)還是有小幅差距。
應(yīng)用性能測試
測試點評:
在應(yīng)用性能測試中,我們采用了多種實際軟件、實際工作負(fù)荷進行體驗。如特別采用HandBrake視頻轉(zhuǎn)碼工具測試了AMD銳龍Threadripper處理器與Core i9-7900X處理器將4K視頻(容量達(dá)3.64GB)轉(zhuǎn)碼為1080p H.265視頻的消耗時間。采用著名的3D繪圖制作軟件3ds MAX來渲染由三匹玻璃馬組成的模型進行渲染,輸出分辨率更設(shè)定在4K(4096×2731)。對于CG行業(yè)來說,渲染是一道非常消耗時間的工作,特別是渲染表現(xiàn)光線折射、反射等效果的玻璃材質(zhì)。可以看到這些軟件對于超多核心處理器都有很好的支持,銳龍Threadripper 1950X在渲染中比Core i9-7900X少用了307秒,也就是足足5分鐘的時間。
此外我們還在著名的MATLAB商業(yè)運算軟件TLAB中循環(huán)200次進行5000×5000的二維離散傅里葉變換,數(shù)據(jù)類型為單精度,兩款A(yù)MD銳龍Threadripper處理器的用時也要更少一些,表現(xiàn)更好。
總體來看當(dāng)前工作應(yīng)用軟件對超多核心處理器已經(jīng)有很好的支持,這也使得銳龍Threadripper 1950X在所有應(yīng)用性能測試中的表現(xiàn)要更勝一籌,比Core i9-7900X更適合在高負(fù)荷工作中使用。而對于銳龍Threadripper 1920X處理器來說,由于它的核心數(shù)只比Core i9-7900X多兩顆,而Core i9-7900X在頻率上又有優(yōu)勢,因此兩者在實際應(yīng)用中可以說是各有勝負(fù)。
游戲性能測試
測試點評:在大部分依賴處理器單線程性能的游戲中,毫無疑問Core i9-7900X處理器要有優(yōu)勢一些,如在《殺手6》、《孤島危機3》中都取得了明顯領(lǐng)先。當(dāng)然現(xiàn)在不少新游戲、DirectX 12游戲?qū)Χ嗪诵牡闹С衷絹碓胶?,同時加上不少著重畫質(zhì)的游戲更依賴顯卡性能,因此在這些游戲中,三款處理器的差異很小。甚至在《殺出重圍:人類分裂》、《坦克世界》中,銳龍Threadripper 1950X還有非常小幅度的領(lǐng)先。
綜合來說,AMD銳龍Threadripper處理器在游戲性能上與Core i9處理器仍有一定差距,但差距不大,且都能為玩家在最高畫質(zhì)設(shè)定加抗鋸齒的環(huán)境下,帶來流暢的游戲體驗。
完全勝出:多任務(wù)運行測試
在日常使用中,很多人實際上是需要同時執(zhí)行多個任務(wù)的,如需要同時運行游戲、直播、直播錄像、視頻轉(zhuǎn)碼的游戲主播;同時運行游戲、渲染或轉(zhuǎn)碼的設(shè)計人員。讓電腦邊工作、邊游戲,做事娛樂兩不誤可以說是很多人的夢想,但以前礙于處理器核心數(shù)太少,這樣的需求難以實現(xiàn),而AMD銳龍Threadripper處理器的一大設(shè)計目的就是讓這個夢想成真。
測試點評:
可以看到,在單獨運行《殺手6》時,Core i9-7900X系統(tǒng)的確有較大的幀速優(yōu)勢,不過一旦同時開啟虎牙直播進行游戲直播,并開啟直播錄像與Handbrake視頻轉(zhuǎn)碼,其游戲平均幀速就從原來的159fps大幅下滑至僅僅60fps。而兩款A(yù)MD銳龍Threadripper處理器的抗壓性則非常好,游戲幀速都仍然維持在75~77fps左右,其游戲幀速在多任務(wù)環(huán)境下反超Core i9-7900X。
而在一邊運行《孤島危機3》,一邊進行3ds Max渲染時,Core i9-7900X所受到的影響就更大了,渲染時間從原來的2614秒大幅增加到4058秒,渲染時間足足增加了1444秒即約24分鐘,顯然邊玩游戲邊工作是非常影響效率,不可取的。而銳龍Threadripper 1950X在此環(huán)境下的渲染時間則僅增加了6分鐘多一點,銳龍Threadripper 1920X的渲染時間也只增加了約10分鐘。
也就是說原本三款處理器在單一渲染任務(wù)下的渲染速度差距并不是太大,但在多任務(wù)環(huán)境下,借助核心、線程數(shù)優(yōu)勢,AMD銳龍Threadripper處理器就可以獲得快得多的渲染速度,讓電腦真正具備邊玩、邊工作的能力。
功耗與溫度測試
測試點評:那么更多的核心數(shù)是否會為處理器帶來更高的功耗與溫度呢?我們特別測試了三款處理器的待機功耗與溫度,并通過Prime95 In-place large FFTS測試了它們的滿載功耗與溫度。從測試來看,雖然兩款A(yù)MD銳龍Threadripper處理器的溫度的確比Core i9-7900X要高一些,但都控制在合理范圍內(nèi),如滿載溫度均在70℃以內(nèi)。
功耗方面,AMD銳龍Threadripper的表現(xiàn)也并不驚人,銳龍Threadripper 1920X的功耗比Core i9-7900X低一些,擁有16核心的銳龍Threadripper 1950X滿載功耗也就比Core i9-7900X高了約10W。
▲搭載銳龍Threadripper 1950X滿載工作時,ROG ZENITH EXTREME主板供電電路的最高溫度只有67.7℃。
▲搭載銳龍Threadripper 1920X滿載工作時,ROG ZENITH EXTREME主板供電電路的最高溫度更低,只有63.7℃。
值得一提的是,借助主板做工優(yōu)秀的8相供電電路,以及AMD銳龍Threadripper僅僅180W的TDP,它們在滿載狀態(tài)下,也沒有給主板帶來明顯的壓力。銳龍Threadripper 1950X滿載運行半小時后,ROG ZENITH EXTREME主板供電電路的最高溫度只有67.7℃,供電電路區(qū)域的平均溫度僅53.8℃;銳龍Threadripper 1920X滿載運行半小時后,ROG ZENITH EXTREME主板供電電路的最高溫度只有63.7℃,供電電路區(qū)域的平均溫度僅51.7℃,ROG ZENITH EXTREME主板可以輕松地支持AMD頂級處理器滿載運行。
超頻測試
▲在ROG ZENITH EXTREME的配合下,我們可將銳龍Threadripper 1950X處理器、銳龍Threadripper 1920X處理器分別超頻到4.0GHz、4.1GHz。
既然銳龍Threadripper 1950X處理器在默認(rèn)狀態(tài)下的滿載溫度并不高,那么它的頻率是否還有一定的提升空間呢?
接下來,我們還在ROG ZENITH EXTREME主板BIOS中對兩款銳龍Threadripper 1920X處理器進行了超頻嘗試。而對銳龍Threadripper的超頻非常簡單。對于銳龍Threadripper 1950X處理器來說,只要將電壓設(shè)定在1.37V左右,它就可以在水冷散熱環(huán)境下,以4GHz頻率穩(wěn)定運行像Handbrake 4K視頻轉(zhuǎn)1080p H.265、CINEBENCH R15處理器多線程渲染這種重載工作,其性能又有一定提升,如CINEBENCH R15渲染性能從3051cb提升到3341cb,提升幅度近10%。
對銳龍Threadripper 1920X處理器而言,則只需要將工作電壓設(shè)定為1.352V,它就可以非常穩(wěn)定地工作在4.1GHz,并通過Prime95 In-place large FFTS半小時烤機測試,超頻能力與超頻穩(wěn)定性比銳龍Threadripper 1950X要更好一些。超頻后的性能提升幅度也比較明顯,CINEBENCH R15渲染性能從2435cb提升到2743cb,提升幅度達(dá)12.6%。
▲超頻后,銳龍Threadripper 1950X的SiSoftware Sandra算數(shù)處理器性能達(dá)到近500GOPS,堪稱當(dāng)前消費級處理器中的王者。
▲銳龍Threadripper 1920X處理器超頻后的CINEBENCH R15渲染性能也得到了很大的提升
讓競爭來得更猛烈一些吧!
整體來看,AMD銳龍Threadripper 1920X顯然是打了一場有準(zhǔn)備的戰(zhàn)爭。
銳龍Threadripper 1950X處理器的多線程性能全面優(yōu)于Core i9-7900X,銳龍Threadripper 1920X與Core i9-7900X相比雖是互有勝負(fù),但關(guān)鍵的是,在價格方面,兩款A(yù)MD銳龍Threadripper處理器也有優(yōu)勢。目前銳龍Threadripper 1950X的實際售價僅為8499-550-100(電子消費卡)=7849元,銳龍Threadripper 1920X的實際售價為6999-550-100(電子消費卡)=6349元。
兩款產(chǎn)品都比市場售價仍在7999元,10核心20線程配置的Core i9 7900X還要便宜。顯然,對于那些渲染、3D建模、音視頻轉(zhuǎn)碼等充分利用處理器多線程性能的工作或者同時運行游戲、渲染、直播、轉(zhuǎn)碼的游戲主播、設(shè)計工作人員來說,頂級的AMD銳龍Threadripper將是除了Core i9處理器之外一個新的、頗具吸引力的選擇。而頂級處理器也將因為AMD銳龍Threadripper處理器的到來掀起一陣“血雨腥風(fēng)”——價格、規(guī)格方面雙方都會爆發(fā)更加激烈的競爭,當(dāng)然最終受益的還是我們消費者,因此讓這樣的競爭來得更猛烈一些吧。