日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給任然
發(fā)送

3

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

本文作者: 任然 2019-01-30 17:52
導語:初代“特供”型號哦~

(注:本文內(nèi)容源自Anandtech,雷鋒網(wǎng)翻譯)

對前沿半導體感興趣的人都知道,Intel最新的制造工藝已經(jīng)跳票許久了。10nm工藝首次發(fā)布是在2014年,最初定于2016年量產(chǎn),但卻一直延期至今。雖然首批使用10nm工藝的移動處理器在2017年底出貨,卻是以“特供”筆記本電腦的形式與國內(nèi)一些大學合作推出。

Intel的10nm處理器屬于第8代酷睿系列,型號是i3 8121U。該處理器的ARK頁面(Intel的在線數(shù)據(jù)庫)已經(jīng)公開,其核心代號為Cannon Lake,屬于14nm Skylake核心的改良版,于2018年第二季度正式發(fā)布。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

i3 8121U的TDP為15W,雙核四線程設(shè)計,基礎(chǔ)頻率2.2GHz,睿頻頻率3.2GHz。這比同為15W的14nm Kaby Lake處理器甚至還要更低一些。最為新奇的是,雖然這是一顆移動處理器,卻支持服務(wù)器和高端桌面平臺處理器才有的AVX-512指令集,可以像企業(yè)級硬件一樣處理向量運算。

i3 8121U的頻率不進反退,讓人們對Intel 10nm工藝的實際性能表現(xiàn)產(chǎn)生了絲絲疑慮。雷鋒網(wǎng)從外媒SemiAccurate的一篇研究文章中獲悉,目前(指i3 8121U推出時)Intel的10nm工藝還存在很多問題和困難,其收益只有10%,遠低于預(yù)計中的60%,其中SAQP、COAG、Cobalt和調(diào)優(yōu)等環(huán)節(jié)遠遠落后于計劃和預(yù)期。

其后的幾個月,坊間傳聞Intel 10nm工藝嚴重受阻,甚至將要放棄10nm的研發(fā)工作,也有傳聞稱Intel將降低標準以實現(xiàn)這一制程,但都被Intel一一辟謠。好在今年的CES上,Intel展示了10nm工藝的全新Sunny Cove架構(gòu)Ice Lake處理器,算是讓關(guān)注新制程的人們吃了一顆定心丸。

雖然Ice Lake暫時還未落地,不過外媒Anandtech卻通過各種渠道,弄到了使用Cannon Lake處理器的“特供”筆記本電腦,并對其進行了詳細的測試。

10nm工藝難在哪?

2017年9月,Intel在技術(shù)與制造日上展示了一個10nm Cannon Lake芯片的完整300mm晶圓,外媒Techinsights測得該芯片的芯片面積約為70.5mm2,也就是說,i3 8121U是Intel迄今為止最小的雙核處理器,但與當時的Skylake處理器(六代酷睿)相比,i3 8121U采用了CPU和GPU分離的設(shè)計,集成度更低。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

業(yè)內(nèi)衡量半導體工藝好壞的常用標準之一,是芯片中每平方毫米集成度晶體管數(shù)量有關(guān)。CPU中并不都是運算晶體管,還有SRAM單元,以及一些被設(shè)計成區(qū)域間熱緩沖區(qū)的“死”硅。晶體管的計數(shù)也有不同的方法,一個2輸入的NAND邏輯單元比一個復雜的掃描觸發(fā)器邏輯單元要小得多。

Intel將單位面積上的晶體管數(shù)量劃分為2輸入NAND單元和掃描觸發(fā)器單元,其中2輸入NAND單元的晶體管密度是90.78MTr/mm2(百萬晶體管每平方毫米),掃描觸發(fā)器單元的密度為115.74 MTr/mm2,在為其賦予60/40的權(quán)重后計算出10nm工藝的晶體管密度為100.8MTr/mm2,是14nm工藝37.5MTr/mm2的2.7倍。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Intel還在國際電子器件會議上披露,具體取決于所需的功能,10nm工藝的邏輯庫有10種類型,包括短庫(高密度庫),中高庫(高性能庫)和高庫(超高性能庫)等。庫越短,電路功耗越低,晶體管密度越高,但峰值性能也越低。因此Intel的10nm工藝其實有多種不同的密度,實際上只有密度最高的短庫可以達到100.8MTr/mm2。

在實際芯片制造中,通常會混合使用多種庫,較短的庫適用于I/O和非核心區(qū)等對性能不敏感的部位以節(jié)約成本,較高的庫通過較低的密度和較高的驅(qū)動電流,通常使用在對性能敏感的核心區(qū)域。

為了更好的理解Intel 10nm工藝,首先要討論Fin(鰭)、Gate(柵極)、單元機制,以及定義與晶體管和FinFET相關(guān)的一些術(shù)語。

晶體管的源極-漏極由鰭(灰色)提供,該鰭穿過柵極(綠色)并嵌入氧化物中,這里的關(guān)鍵指標是鰭的高度、寬度和柵長,半導體工藝的目標是使每一個都盡可能小、單元性能盡可能高。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Intel在其22nm工藝中,使用了包含多個鰭片的三柵極晶體管來增加總驅(qū)動電流,以獲得更好的性能。這就引入了一個新的度量:“鰭間距”,即鰭之間的距離。如果一個鰭通過了多個柵極,柵極之間的距離稱為“柵極距”。

鰭和柵極之間接觸的越多,鰭間距越小,泄漏就越低,性能也就越好,這可以增加驅(qū)動電流,也能控制寄生電容和柵電容。其后的14nm工藝中,鰭的高度、寬度和柵長都變得更短,每個鰭穿過的柵極也更多,因而獲得了更好的性能。

而到了10nm工藝,Intel也在積極設(shè)計鰭結(jié)構(gòu),鰭間距從42nm縮減到34nm,鰭寬度從8nm縮減至7nm以避免寄生電容。改動看起來并不多,但在這個尺度上每nm都非常重要。Intel還通過添加共形鈦層來改善源極和漏極擴散區(qū)域,鰭和溝槽之間的接觸區(qū)域(柵極下方的灰色尖頭)也需要讓接觸電阻最小化。在10nm工藝中,Intel將其從鎢接觸改為鈷接觸,使接觸線電阻降低了60%,種種這些改進,讓技術(shù)變得極其具有挑戰(zhàn)性。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

鰭與柵極組合起來就是基本的電路單元,從22nm制程的掃描電子顯微鏡的圖像來看,單元有6片鰭的和2片鰭的(當然也有其他規(guī)格的),柵極長度不盡相同,每個單元內(nèi)都有活躍的鰭傳遞電流和非活躍的鰭作為間隔。

在10nm工藝上,使用高密度庫的單元總共有8個鰭,其中5個是活動鰭,這些單元可用于I/O等不需要很高性能或?qū)Τ杀久舾械碾娐凡糠?。高性能庫和超高性能庫則分別有10個和12個鰭,各自相比前者多出一個額外的P鰭和N鰭,有助于提供額外的驅(qū)動電流,以適當?shù)男薁奚鼇頁Q取峰值性能的提升。

在單元之間,通常會有許多作為間隔物的偽柵極。在Intel 14nm工藝中,每個單元的兩端都有一個偽柵極,這意味著兩個單元之間會有兩個偽柵極。而在10nm工藝中,兩個相鄰的單元可以共享一個偽柵極,這將帶來更大的密度優(yōu)勢,Intel表示最多可節(jié)約20%芯片面積。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

晶體管內(nèi)部,柵極通常靠兩支長度略微超出單元尺寸的觸點給源極和漏極加電,這不可避免的要占據(jù)額外的平面尺寸。在10nm工藝中,至少在目前Cannon Lake處理器使用的版本中,Intel通過一種被稱為“有源柵極接觸”(COAG)的設(shè)計,將柵極觸點垂直放置在單元上。這一設(shè)計為制造過程增加了好幾個步驟(一次蝕刻、一次沉積和一次拋光),但可以為芯片提供大約10%的面積縮放。

前文已經(jīng)言道,外媒SemiAccurate上的一篇研究文章曾表示,COAG是一種風險較高的實施方案,雖然Intel已經(jīng)把它造出來并且正常工作了,但它并不像預(yù)期的那樣可靠。用于Cannon Lake核心的COAG似乎只能運行在低性能&低功率,或高性能&高功率的工況下,希望未來Intel能在新一代10nm Ice Lake處理器正式發(fā)售時詳細說明關(guān)于COAG的改進情況。

回到晶體管密度上,衡量晶體管密度的另一種方法是CPP*MMP,即將柵間距(接觸多晶硅間距Contact Poly Pitch)乘以鰭間距(最小金屬間距)。種種這些改進加在一起,使Intel的CPP*MMP尺寸只有54nm*44nm,相比臺積電和三星的7nm也只是略輸一點點,這也是Intel一直強調(diào)前兩者只是商業(yè)命名的原因。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

揭開架構(gòu)之秘

雖然i3 8121U的Cannon Lake核心仍處于NDA中,但經(jīng)過科技圈眾多同仁一年以來孜孜不倦的研究,終于還是基本揭開了其架構(gòu)的面紗。

整體而言,Cannon Lake核心的設(shè)計很像是PC端Skylake核心與服務(wù)器端Skylake-SP核心的混合體。雖然它使用了PC端標準的4+1解碼單元、8個執(zhí)行單元以及L1+L2+L3緩存結(jié)構(gòu),但也從服務(wù)器端引入了一個AVX-512單元,并且L1數(shù)據(jù)緩存的讀寫速度分別達到了每周期2*512Byte和1*512Byte。

進一步來看,Cannon Lake核心也體現(xiàn)了一小部分第二代10nm Sunny Cove架構(gòu)的設(shè)計,一些Skylake和Skylake-SP核心上沒有的指令,在Cannon Lake和Sunny Cove上都有存在。

除此之外,雖然目前不太清楚Cannon Lake核心的架構(gòu)前端設(shè)計變化,但還是可以看出重排序緩沖區(qū)的大小是與Skylake核心相同的224條微指令,而Sunny Cove架構(gòu)的大部分特性改進(存儲帶寬加倍、執(zhí)行端口更多以及執(zhí)行端口功能改進)都沒有出現(xiàn)在Cannon Lake核心上。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Cannon Lake支持的新指令包括IFMA(Integer fusion Multiply Add,整數(shù)融合乘加法)、VBMI(Vector Byte operation instructions,矢量字節(jié)操作指令),以及基于硬件的SHA(Secure Hash Algorithm,安全哈希算法)等。

其中,IFMA是52位整數(shù)融合乘法加法(FMA),其行為與AVX512浮點FMA相同,延遲為4個時鐘周期,每個時鐘周期的吞吐量為2(對于xmm/ymm/zmm為4和1)。該指令通常被用于輔助加密功能,但也意味著可以執(zhí)行任意精度的算術(shù)運算。

VBMI指令集提供了VPERMB、VPERMI2B、VPERMT2B和VPMULTISHIFTQB四條指令,在字節(jié)混洗方案中非常有用。

而硬件加速SHA則純粹是為加密算法加速而設(shè)計的,不過測試表明,Cannon Lake核心有了它后速度仍然比Goldmont(下代Atom處理器的核心)和AMD的Zen都慢,這意味著起碼基于硬件的SHA在i3 8121U上并不是特別有用。

除了增加新指令,Intel通常還會在新核心上改進現(xiàn)有的指令,用于增加吞吐量或減少延遲(或兩者兼而有之)。Cannon Lake核心還支持Vector-AES特性,它允許AES指令一次使用更多的AVX-512單元從而使吞吐量倍增。

在Cannon Lake核心上,最大的變化是可以硬件支持64位整數(shù)除法,不再需要分割成幾條指令,18個時鐘周期內(nèi)就可以完成64bit的IDIV。相比之下,Zen執(zhí)行同樣的運算需要45個時鐘周期,Skylake核心則需要97時鐘周期。

對于字符串的塊存儲,所有REP STOS*系列指令都可以使用512bit執(zhí)行寫入端口,吞吐量為每時鐘周期61bit,相比之下,Skylake-SP為43bit,Skylake為31bit,Zen為14bit。

對于全字整數(shù)矢量,AVX512BW命令VPERMW的等待時間從6個時鐘周期減小到4個,并且每個時鐘的吞吐量增加一倍。與向量類似,使用VMOVSS和VMOVSD命令移動或合并單/雙精度標量的向量現(xiàn)在與其他MOV命令的行為相同。

對指令集的其他有益調(diào)整包括使ZMM劃分和平方根更快一個時鐘,并將一些GATHER函數(shù)的吞吐量從每四個時鐘一個增加到每三個時鐘一個;回歸則以舊x87指令的形式出現(xiàn),其中x87 DIV、SQRT、REP CMPS、LFENCE和MFENCE都變慢一了個時鐘,其他指令則慢的更多,目的是讓人們棄用這些老舊的指令。

Cannon Lake核心相對不足的地方包括:VPCONFLICT*命令具有3個時鐘周期的延遲,吞吐量為每時鐘周期一條,速度仍然很慢;DWORD ZMM表單的延遲為26個時鐘,吞吐量為每20個時鐘1個;不支持Skylake-SP核心的緩存行寫回功能CLWB;不支持SGX(軟件保護擴展)。

處理器規(guī)格對比

在i3 8121U的測試中,使用i3 8130U移動處理器作為對比,這是一款Kaby Lake核心的雙核四線程處理器,使用14nm工藝制造,TDP同樣為15W,基礎(chǔ)頻率與i3 8121U相同,睿頻頻率則反而要稍高一些。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

對于這種15W TDP的移動處理器,會很容易撞上溫度墻導致降頻。測試中i3 8121U降頻非常頻繁,在AVX2應(yīng)用中干脆是運行在2.2GHz的基準頻率狀態(tài),AVX-512應(yīng)用中甚至會降頻至基準線以下的1.8GHz。

相比之下,使用14nm成熟工藝的i3 8130U在AVX2應(yīng)用中仍能維持2.8GHz的頻率,比如在POV-Ray測試項中,i3 8130U可以更快的完成測試,性能相比i3 8121U高出26%。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

不過盡管i3 8121U在運行AVX-512應(yīng)用時頻率很低,但先進的指令集仍然帶來了出色的性能,在3DPM測試中,開啟AVX-512指令集的i3 8121U在1.8GHz下成績?yōu)?846分,6倍于2.8GHz但只支持AVX2指令集的i3 8130U。

內(nèi)存性能和功耗測試

在緩存/內(nèi)存延遲測試中,i3 8121U和i3 8130U處理器都禁用了睿頻,迫使它們以相同的2.2 GHz頻率運行,以便進行奇偶性和直接的架構(gòu)比較。Cannon Lake核心的緩存/內(nèi)存子系統(tǒng)與Skylake核心相同的,沒有任何其他改進,理論上表現(xiàn)出的性能也應(yīng)該基本相同。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

在這項測試中,兩顆處理器的緩存訪問延遲幾乎相同,但Cannon Lake核心的i3 8121U的內(nèi)存訪問延遲要高出Kaby Lake核心的i3 8130U多達50%,一上來就震驚了四座(當然這不是啥好事)。

盡管為i3 8121U配套的DDR4 2400內(nèi)存時序17-17-17,略輸于i3 8130U的16-16-16,但這一丟丟時序差異遠不足以有如此大的影響,能想到的唯一原因是,Cannon Lake核心訪問內(nèi)存控制器有非常大的額外開銷,這或許就是封堵了幽靈和熔斷漏洞的副作用。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

而功耗方面比較撲朔迷離,我們知道,Intel在處理器硬件中設(shè)置了兩個關(guān)鍵的功耗限制——PL1和PL2,前者控制穩(wěn)態(tài)功耗,后者控制短時間睿頻功耗。

在大多數(shù)情況下,處理器的穩(wěn)態(tài)功耗和TDP相同,如i3 8130U就是這樣,處理器的穩(wěn)態(tài)功耗為15W,然而同為15W TDP的i3 8121U的穩(wěn)態(tài)功耗僅為12.6W。由PL2控制的峰值功耗也是同樣,i3 8130U的峰值功耗可以達到24.2 W,而i3 8121U最高只能沖到18.7W,且睿頻的持續(xù)時間也要比i3 8130U短很多。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

糟心的是,雖然i3 8121U的功耗墻更低,但由于其頻率更低性能更差,實際執(zhí)行運算所消耗的能量反而更多。在POV-Ray測試項中,Kaby Lake核心的i3 8130U的總耗能只有768 mWh,而Cannon Lake核心的i3 8121U的總耗能為867mWh,足足高了12.9%。

2.2GHz同頻測試:SPEC2006

除了功耗,關(guān)于Cannon Lake核心的另一個問題在于它是否是一個高效的架構(gòu)設(shè)計。為了進行直接的IPC比較,我們將兩顆處理器固定住2.2 GHz同頻率上運行SPEC2006 測試。

SPEC2006是一個重要的基準測試軟件,它與其他測試軟件的區(qū)別在于所處理的數(shù)據(jù)集更大更復雜。作為基準測試更有代表性,它可以充分展示架構(gòu)的更多細節(jié)。

從測試結(jié)果來看,兩款不同核心的處理器性能相差無幾,Kaby Lake核心的i3 8130U在與SIMD相關(guān)的462.libquantum和470.lbm測試項中似乎比Cannon Lake核心的i3 8121U更有優(yōu)勢,這也許與二者內(nèi)存延遲性能有關(guān)。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試:系統(tǒng)綜合性能

系統(tǒng)測試部分重點關(guān)注實際用戶體驗,將包括應(yīng)用加載時間、圖像處理、簡單科學物理、仿真、神經(jīng)仿真、優(yōu)化計算和3D模型開發(fā)等測試項。

GIMP應(yīng)用加載時間

系統(tǒng)響應(yīng)速度是最關(guān)乎用戶體驗的指標,一個很好的測試用例是看應(yīng)用加載需要多長時間。在這一測試中,Cannon Lake核心的i3 8121U表現(xiàn)的特別好。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

FCAT圖像處理

FCAT軟件采用錄制的視頻,并將顏色數(shù)據(jù)處理成幀時間數(shù)據(jù),以便系統(tǒng)可以繪制可視化的幀率。

這一測試是單線程的,在基準頻率下,Cannon Lake核心的i3 8121U與Kaby Lake核心的i3 8130U耗時差距在半秒之內(nèi),i3 8121U略微領(lǐng)先。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

3DPM粒子運動計算

3DPM測試是一個定制的基準測試,旨在模擬3D空間中六個點的不同粒子運動算法。算法的一個關(guān)鍵部分是使用了相對快速的隨機數(shù)生成,最終在代碼中實現(xiàn)依賴鏈。在這一測試中,我們在六種算法上運行一個原子粒子集,每次20秒,暫停10秒,并報告粒子移動的總速率,以每秒數(shù)百萬次運動為單位。

在不啟動AVX,Cannon Lake核心的i3 8121U敗給了Kaby Lake核心的i3 8130U。但各自啟動AVX后,i3 8121U竟然跑出了4519的超高分,甚至擊敗了4185分的18核Core i9 7980XE處理器,非常瘋狂。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Dolphin 5.0模擬器

Dolphin 5.0是一款GameCube/Wii主機模擬器,可以在PC上玩到這些老款游戲主機的獨占大作。不過,模擬這兩臺使用Power架構(gòu)處理器的主機通常需要一顆不弱的處理器才行。

在這一測試中,兩款處理器的同頻性能大致相同。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

DigiCortex海蛞蝓大腦模擬

DigiCortex基準測試最初設(shè)計用于神經(jīng)元和突觸活動的模擬和可視化,該軟件具有多種基準模式,本次使用小基準測試,模擬32000個神經(jīng)元和18億個突觸,規(guī)模相當于海蛞蝓的大腦。

模擬類型分為“非激發(fā)”和“激發(fā)”兩種模式,前者受內(nèi)存影響更大,后者更依賴純粹的處理器性能。測試中使用了后者,兩款處理器的同頻性能大致相同。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

y-Cruncher科學計算

y-Cruncher是一款幫助計算各種數(shù)學常數(shù)的工具,軟件支持通過二進制、單線程和多線程等不同優(yōu)化方式運行,甚至包括AVX-512優(yōu)化的二進制文件。本次測試基于單線程和多線程方式,計算2.5億位圓周率。

測試結(jié)果不出意外是 Cannon Lake核心的i3 8121U獲勝,到目前為止,所有可以利用AVX-512指令集的軟件都是i3 8121U獲勝。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Agisoft Photoscan 2D圖像轉(zhuǎn)3D模型

PhotoScan可以將許多2D圖像轉(zhuǎn)換為3D模型,這是模型開發(fā)和歸檔中的一個重要工具,依賴于許多單線程和多線程算法。

測試使用了PhotoScan v1.3.3版本,其中包含了84 x 1800萬像素的大數(shù)據(jù)集,通過一個相當快速的算法變體,最后對比轉(zhuǎn)換過程總時間。

在這一測試中,兩款處理器的同頻性能大致相同。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試:渲染性能

渲染性能通常是處理器在專業(yè)環(huán)境下的關(guān)鍵指標,從3D渲染到光柵化,涵蓋網(wǎng)格、紋理、碰撞、鋸齒、物理等方面。大多數(shù)渲染器都支持CPU渲染,少數(shù)可以支持GPU或FPGA和ASIC等專用芯片。對于大型工作室來說,CPU仍然是首選的硬件。

Corona 1.3渲染

Corona是3DS Max和Cinema 4D等軟件的高級性能渲染器,基準測試的GUI可顯示正在構(gòu)建的場景,并將渲染時間反饋給用戶。

本次測試使用了直接輸出結(jié)果的命令行版本,輸出的結(jié)果也不是報告時間,而是報告六次運行中每秒的平均光線數(shù),因為單位時間內(nèi)的性能比例通常更容易理解。

Corona只支持到AVX2指令集,無法充分發(fā)揮Cannon Lake 核心的特性。在這一測試中,i3 8121U同頻性能落后i3 8130U約10%。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

Blender 3D創(chuàng)作軟件

Blender是一個開源的高級渲染工具,支持大量可配置項,被世界上許多知名的動畫工作室所使用。該軟件的開發(fā)小組最近發(fā)布了一個基準測試包,本次測試通過命令行運行該套件中的“bmw27”場景子測試,并測量完成渲染的時間。

Blender同樣只支持到AVX2指令集,在這一測試中,兩款處理器的同頻性能大致相同,Cannon Lake 核心的i3 8121U有微弱優(yōu)勢。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

LuxMark引擎

使用LuxRender引擎開發(fā)的基準測試提供了幾個不同的場景和API,本次測試選擇在C ++和OpenCL代碼路徑上運行簡單的“Ball”場景,以粗略渲染開始,并在兩分鐘內(nèi)慢慢提高質(zhì)量,最終結(jié)果以每秒渲染的光線數(shù)展示。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

POV-Ray光線追蹤

Persistence of Vision光線追蹤引擎是另一個眾所周知的基準測試工具,在AMD發(fā)布Ryzen處理器之前一直默默無聞,而后Intel和AMD都開始向開源項目的主要分支提交代碼。

本次測試使用從命令行調(diào)用所有內(nèi)核的內(nèi)置基準。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試:辦公性能

Office測試套件旨在專注于更多行業(yè)標準,如辦工流程和系統(tǒng)會議等,但是我們也將編譯器性能捆綁在本節(jié)中。對于必須對硬件進行總體評估的用戶來說,這些通常是最需要考慮的基準測試。

3DMark物理計算

游戲測試軟件3DMark的每個測試場景均包括一個物理測試子項。按復雜程度排列的依次為Ice Storm、Cloud Gate、Sky Diver、Fire Strike和Time Spy。

在所有測試場景中,兩款處理器的同頻性能都大致相同。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

GeekBench 4

GeekBench 4是常用的跨平臺測試工具,重點尋求峰值吞吐量的一系列算法,包括加密、壓縮、快速傅里葉變換、存儲器操作、n體物理、矩陣運算、直方圖處理和HTML解析等,常用于移動設(shè)備測試。

考慮到其通用性和流行程度,本次也加入了這款軟件的單線程和多線程測試。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試:編碼性能

隨著流媒體和短視頻內(nèi)容的興起,越來越多的家庭用戶和游戲玩家需要將視頻文件進行轉(zhuǎn)換,處理器的編碼和轉(zhuǎn)碼性能變得越來越重要,本次編碼測試也主要圍繞這些重要的場景進行。

Handbrake視頻轉(zhuǎn)碼

Handbrake是一種流行的開源視頻轉(zhuǎn)換軟件,最新的版本可利用AVX-512和OpenCL來加速某些類型的轉(zhuǎn)碼和算法。本次測試使用的CPU轉(zhuǎn)碼。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

7-Zip壓縮解壓

在壓縮/解壓應(yīng)用中,開源的7-Zip是很歡迎的工具之一。本次猜測是使用最新的v18.05版本,它內(nèi)置有基準測試,從命令行運行基準測試,報告壓縮、解壓縮和綜合得分。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

WinRAR壓縮解壓

在大多數(shù)人的系統(tǒng)中通常都有WinRAR,它是20多年前的第一批壓縮解壓工具之一。它沒有內(nèi)置基準測試,本次使用一個包含超過30個60秒視頻文件和2000個零碎小文件的文件夾,以正常壓縮率運行壓縮。

WinRAR是可變線程的,但也容易受到緩存的影響,因此測試需運行它10次并取最后五次的平均值,使結(jié)果可以展示CPU純粹的原始計算性能。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

AES加密

許多移動設(shè)備默認使用的文件系統(tǒng)都提供了加密功能以保護內(nèi)容,PC上的Windows也有,通常由BitLocker或第三方軟件應(yīng)用。本次使用已停產(chǎn)的TrueCrypt作為其內(nèi)置基準測試,可直接在內(nèi)存中測試多種加密算法,支持AES指令集但不支持AVX-512。測試采用的數(shù)據(jù)是AES加密/解密組合,以每秒千兆字節(jié)為單位。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

雷鋒網(wǎng)總結(jié)

Intel在10nm工藝上確實進行了很多改進,如果每一步都能完美運行,那么10nm應(yīng)該在去年就成了??蓡栴}是在半導體設(shè)計中,有幾百個不同的特性,改動任何一個都可能會導致其他幾個甚至幾十個特性變差,這正是Intel在10nm工藝方面遇到的最大問題。

仍記得2018年的CES上,Intel對10nm工藝相關(guān)的問題緘口不言,從這曇花一現(xiàn)的Cannon Lake核心來看,唯一稱得上亮眼的表現(xiàn)只有AVX-512性能,很明顯第一代10nm還遠遠沒有準備好邁入黃金時段,Intel是在試圖冷處理這一代處理器,也肯定不會正式公開發(fā)售它們。

意大利炮(面)來了?深度解析Intel初代10nm Cannon Lake處理器

在Intel給出的這張圖中,右側(cè)顯示10nm工藝及其改型可依靠較低的動態(tài)電容擁有較低的功率,然而數(shù)軸的左側(cè)則顯示10nm和10nm+工藝的單個晶體管性能其實還要低于當前的14nm++工藝,要到下下下一代的10nm++工藝才能真正實現(xiàn)全面領(lǐng)先,而從i3 8121U的表現(xiàn)來看,很大概率上也意味著在第三代10nm++工藝實施之前,業(yè)界很可能都無法看到真正突破性的10nm處理器(一竿子支到三零零零年了……)。

預(yù)計將在今年下半年問世的Ice Lake處理器會使用第二代10nm+工藝,電氣性能將非常接近14nm++工藝,或許那時Intel在10nm工藝上打響真正的第一炮吧。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:

編輯

觀點離經(jīng)叛道的骨灰級硬件愛好者
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說