意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

本文作者：任然

2019-01-30 17:52

導語：初代“特供”型號哦~

（注：本文內(nèi)容源自Anandtech，雷鋒網(wǎng)翻譯）

對前沿半導體感興趣的人都知道，Intel最新的制造工藝已經(jīng)跳票許久了。10nm工藝首次發(fā)布是在2014年，最初定于2016年量產(chǎn)，但卻一直延期至今。雖然首批使用10nm工藝的移動處理器在2017年底出貨，卻是以“特供”筆記本電腦的形式與國內(nèi)一些大學合作推出。

Intel的10nm處理器屬于第8代酷睿系列，型號是i3 8121U。該處理器的ARK頁面（Intel的在線數(shù)據(jù)庫）已經(jīng)公開，其核心代號為Cannon Lake，屬于14nm Skylake核心的改良版，于2018年第二季度正式發(fā)布。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

i3 8121U的TDP為15W，雙核四線程設(shè)計，基礎(chǔ)頻率2.2GHz，睿頻頻率3.2GHz。這比同為15W的14nm Kaby Lake處理器甚至還要更低一些。最為新奇的是，雖然這是一顆移動處理器，卻支持服務(wù)器和高端桌面平臺處理器才有的AVX-512指令集，可以像企業(yè)級硬件一樣處理向量運算。

i3 8121U的頻率不進反退，讓人們對Intel 10nm工藝的實際性能表現(xiàn)產(chǎn)生了絲絲疑慮。雷鋒網(wǎng)從外媒SemiAccurate的一篇研究文章中獲悉，目前（指i3 8121U推出時）Intel的10nm工藝還存在很多問題和困難，其收益只有10%，遠低于預(yù)計中的60%，其中SAQP、COAG、Cobalt和調(diào)優(yōu)等環(huán)節(jié)遠遠落后于計劃和預(yù)期。

其后的幾個月，坊間傳聞Intel 10nm工藝嚴重受阻，甚至將要放棄10nm的研發(fā)工作，也有傳聞稱Intel將降低標準以實現(xiàn)這一制程，但都被Intel一一辟謠。好在今年的CES上，Intel展示了10nm工藝的全新Sunny Cove架構(gòu)Ice Lake處理器，算是讓關(guān)注新制程的人們吃了一顆定心丸。

雖然Ice Lake暫時還未落地，不過外媒Anandtech卻通過各種渠道，弄到了使用Cannon Lake處理器的“特供”筆記本電腦，并對其進行了詳細的測試。

10nm工藝難在哪？

2017年9月，Intel在技術(shù)與制造日上展示了一個10nm Cannon Lake芯片的完整300mm晶圓，外媒Techinsights測得該芯片的芯片面積約為70.5mm2，也就是說，i3 8121U是Intel迄今為止最小的雙核處理器，但與當時的Skylake處理器（六代酷睿）相比，i3 8121U采用了CPU和GPU分離的設(shè)計，集成度更低。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

業(yè)內(nèi)衡量半導體工藝好壞的常用標準之一，是芯片中每平方毫米集成度晶體管數(shù)量有關(guān)。CPU中并不都是運算晶體管，還有SRAM單元，以及一些被設(shè)計成區(qū)域間熱緩沖區(qū)的“死”硅。晶體管的計數(shù)也有不同的方法，一個2輸入的NAND邏輯單元比一個復雜的掃描觸發(fā)器邏輯單元要小得多。

Intel將單位面積上的晶體管數(shù)量劃分為2輸入NAND單元和掃描觸發(fā)器單元，其中2輸入NAND單元的晶體管密度是90.78MTr/mm2（百萬晶體管每平方毫米），掃描觸發(fā)器單元的密度為115.74 MTr/mm2，在為其賦予60/40的權(quán)重后計算出10nm工藝的晶體管密度為100.8MTr/mm2，是14nm工藝37.5MTr/mm2的2.7倍。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

Intel還在國際電子器件會議上披露，具體取決于所需的功能，10nm工藝的邏輯庫有10種類型，包括短庫（高密度庫），中高庫（高性能庫）和高庫（超高性能庫）等。庫越短，電路功耗越低，晶體管密度越高，但峰值性能也越低。因此Intel的10nm工藝其實有多種不同的密度，實際上只有密度最高的短庫可以達到100.8MTr/mm2。

在實際芯片制造中，通常會混合使用多種庫，較短的庫適用于I/O和非核心區(qū)等對性能不敏感的部位以節(jié)約成本，較高的庫通過較低的密度和較高的驅(qū)動電流，通常使用在對性能敏感的核心區(qū)域。

為了更好的理解Intel 10nm工藝，首先要討論Fin（鰭）、Gate（柵極）、單元機制，以及定義與晶體管和FinFET相關(guān)的一些術(shù)語。

晶體管的源極-漏極由鰭（灰色）提供，該鰭穿過柵極（綠色）并嵌入氧化物中，這里的關(guān)鍵指標是鰭的高度、寬度和柵長，半導體工藝的目標是使每一個都盡可能小、單元性能盡可能高。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

Intel在其22nm工藝中，使用了包含多個鰭片的三柵極晶體管來增加總驅(qū)動電流，以獲得更好的性能。這就引入了一個新的度量：“鰭間距”，即鰭之間的距離。如果一個鰭通過了多個柵極，柵極之間的距離稱為“柵極距”。

鰭和柵極之間接觸的越多，鰭間距越小，泄漏就越低，性能也就越好，這可以增加驅(qū)動電流，也能控制寄生電容和柵電容。其后的14nm工藝中，鰭的高度、寬度和柵長都變得更短，每個鰭穿過的柵極也更多，因而獲得了更好的性能。

而到了10nm工藝，Intel也在積極設(shè)計鰭結(jié)構(gòu)，鰭間距從42nm縮減到34nm，鰭寬度從8nm縮減至7nm以避免寄生電容。改動看起來并不多，但在這個尺度上每nm都非常重要。Intel還通過添加共形鈦層來改善源極和漏極擴散區(qū)域，鰭和溝槽之間的接觸區(qū)域（柵極下方的灰色尖頭）也需要讓接觸電阻最小化。在10nm工藝中，Intel將其從鎢接觸改為鈷接觸，使接觸線電阻降低了60％，種種這些改進，讓技術(shù)變得極其具有挑戰(zhàn)性。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

鰭與柵極組合起來就是基本的電路單元，從22nm制程的掃描電子顯微鏡的圖像來看，單元有6片鰭的和2片鰭的（當然也有其他規(guī)格的），柵極長度不盡相同，每個單元內(nèi)都有活躍的鰭傳遞電流和非活躍的鰭作為間隔。

在10nm工藝上，使用高密度庫的單元總共有8個鰭，其中5個是活動鰭，這些單元可用于I/O等不需要很高性能或?qū)Τ杀久舾械碾娐凡糠?。高性能庫和超高性能庫則分別有10個和12個鰭，各自相比前者多出一個額外的P鰭和N鰭，有助于提供額外的驅(qū)動電流，以適當?shù)男薁奚鼇頁Q取峰值性能的提升。

在單元之間，通常會有許多作為間隔物的偽柵極。在Intel 14nm工藝中，每個單元的兩端都有一個偽柵極，這意味著兩個單元之間會有兩個偽柵極。而在10nm工藝中，兩個相鄰的單元可以共享一個偽柵極，這將帶來更大的密度優(yōu)勢，Intel表示最多可節(jié)約20%芯片面積。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

晶體管內(nèi)部，柵極通常靠兩支長度略微超出單元尺寸的觸點給源極和漏極加電，這不可避免的要占據(jù)額外的平面尺寸。在10nm工藝中，至少在目前Cannon Lake處理器使用的版本中，Intel通過一種被稱為“有源柵極接觸”（COAG）的設(shè)計，將柵極觸點垂直放置在單元上。這一設(shè)計為制造過程增加了好幾個步驟（一次蝕刻、一次沉積和一次拋光），但可以為芯片提供大約10％的面積縮放。

前文已經(jīng)言道，外媒SemiAccurate上的一篇研究文章曾表示，COAG是一種風險較高的實施方案，雖然Intel已經(jīng)把它造出來并且正常工作了，但它并不像預(yù)期的那樣可靠。用于Cannon Lake核心的COAG似乎只能運行在低性能&低功率，或高性能&高功率的工況下，希望未來Intel能在新一代10nm Ice Lake處理器正式發(fā)售時詳細說明關(guān)于COAG的改進情況。

回到晶體管密度上，衡量晶體管密度的另一種方法是CPP*MMP，即將柵間距（接觸多晶硅間距Contact Poly Pitch）乘以鰭間距（最小金屬間距）。種種這些改進加在一起，使Intel的CPP*MMP尺寸只有54nm*44nm，相比臺積電和三星的7nm也只是略輸一點點，這也是Intel一直強調(diào)前兩者只是商業(yè)命名的原因。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

揭開架構(gòu)之秘

雖然i3 8121U的Cannon Lake核心仍處于NDA中，但經(jīng)過科技圈眾多同仁一年以來孜孜不倦的研究，終于還是基本揭開了其架構(gòu)的面紗。

整體而言，Cannon Lake核心的設(shè)計很像是PC端Skylake核心與服務(wù)器端Skylake-SP核心的混合體。雖然它使用了PC端標準的4+1解碼單元、8個執(zhí)行單元以及L1+L2+L3緩存結(jié)構(gòu)，但也從服務(wù)器端引入了一個AVX-512單元，并且L1數(shù)據(jù)緩存的讀寫速度分別達到了每周期2*512Byte和1*512Byte。

進一步來看，Cannon Lake核心也體現(xiàn)了一小部分第二代10nm Sunny Cove架構(gòu)的設(shè)計，一些Skylake和Skylake-SP核心上沒有的指令，在Cannon Lake和Sunny Cove上都有存在。

除此之外，雖然目前不太清楚Cannon Lake核心的架構(gòu)前端設(shè)計變化，但還是可以看出重排序緩沖區(qū)的大小是與Skylake核心相同的224條微指令，而Sunny Cove架構(gòu)的大部分特性改進（存儲帶寬加倍、執(zhí)行端口更多以及執(zhí)行端口功能改進）都沒有出現(xiàn)在Cannon Lake核心上。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

Cannon Lake支持的新指令包括IFMA（Integer fusion Multiply Add，整數(shù)融合乘加法）、VBMI（Vector Byte operation instructions，矢量字節(jié)操作指令），以及基于硬件的SHA（Secure Hash Algorithm，安全哈希算法）等。

其中，IFMA是52位整數(shù)融合乘法加法（FMA），其行為與AVX512浮點FMA相同，延遲為4個時鐘周期，每個時鐘周期的吞吐量為2（對于xmm/ymm/zmm為4和1）。該指令通常被用于輔助加密功能，但也意味著可以執(zhí)行任意精度的算術(shù)運算。

VBMI指令集提供了VPERMB、VPERMI2B、VPERMT2B和VPMULTISHIFTQB四條指令，在字節(jié)混洗方案中非常有用。

而硬件加速SHA則純粹是為加密算法加速而設(shè)計的，不過測試表明，Cannon Lake核心有了它后速度仍然比Goldmont（下代Atom處理器的核心）和AMD的Zen都慢，這意味著起碼基于硬件的SHA在i3 8121U上并不是特別有用。

除了增加新指令，Intel通常還會在新核心上改進現(xiàn)有的指令，用于增加吞吐量或減少延遲（或兩者兼而有之）。Cannon Lake核心還支持Vector-AES特性，它允許AES指令一次使用更多的AVX-512單元從而使吞吐量倍增。

在Cannon Lake核心上，最大的變化是可以硬件支持64位整數(shù)除法，不再需要分割成幾條指令，18個時鐘周期內(nèi)就可以完成64bit的IDIV。相比之下，Zen執(zhí)行同樣的運算需要45個時鐘周期，Skylake核心則需要97時鐘周期。

對于字符串的塊存儲，所有REP STOS*系列指令都可以使用512bit執(zhí)行寫入端口，吞吐量為每時鐘周期61bit，相比之下，Skylake-SP為43bit，Skylake為31bit，Zen為14bit。

對于全字整數(shù)矢量，AVX512BW命令VPERMW的等待時間從6個時鐘周期減小到4個，并且每個時鐘的吞吐量增加一倍。與向量類似，使用VMOVSS和VMOVSD命令移動或合并單/雙精度標量的向量現(xiàn)在與其他MOV命令的行為相同。

對指令集的其他有益調(diào)整包括使ZMM劃分和平方根更快一個時鐘，并將一些GATHER函數(shù)的吞吐量從每四個時鐘一個增加到每三個時鐘一個；回歸則以舊x87指令的形式出現(xiàn)，其中x87 DIV、SQRT、REP CMPS、LFENCE和MFENCE都變慢一了個時鐘，其他指令則慢的更多，目的是讓人們棄用這些老舊的指令。

Cannon Lake核心相對不足的地方包括：VPCONFLICT*命令具有3個時鐘周期的延遲，吞吐量為每時鐘周期一條，速度仍然很慢；DWORD ZMM表單的延遲為26個時鐘，吞吐量為每20個時鐘1個；不支持Skylake-SP核心的緩存行寫回功能CLWB；不支持SGX（軟件保護擴展）。

處理器規(guī)格對比

在i3 8121U的測試中，使用i3 8130U移動處理器作為對比，這是一款Kaby Lake核心的雙核四線程處理器，使用14nm工藝制造，TDP同樣為15W，基礎(chǔ)頻率與i3 8121U相同，睿頻頻率則反而要稍高一些。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

對于這種15W TDP的移動處理器，會很容易撞上溫度墻導致降頻。測試中i3 8121U降頻非常頻繁，在AVX2應(yīng)用中干脆是運行在2.2GHz的基準頻率狀態(tài)，AVX-512應(yīng)用中甚至會降頻至基準線以下的1.8GHz。

相比之下，使用14nm成熟工藝的i3 8130U在AVX2應(yīng)用中仍能維持2.8GHz的頻率，比如在POV-Ray測試項中，i3 8130U可以更快的完成測試，性能相比i3 8121U高出26％。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

不過盡管i3 8121U在運行AVX-512應(yīng)用時頻率很低，但先進的指令集仍然帶來了出色的性能，在3DPM測試中，開啟AVX-512指令集的i3 8121U在1.8GHz下成績?yōu)?846分，6倍于2.8GHz但只支持AVX2指令集的i3 8130U。

內(nèi)存性能和功耗測試

在緩存/內(nèi)存延遲測試中，i3 8121U和i3 8130U處理器都禁用了睿頻，迫使它們以相同的2.2 GHz頻率運行，以便進行奇偶性和直接的架構(gòu)比較。Cannon Lake核心的緩存/內(nèi)存子系統(tǒng)與Skylake核心相同的，沒有任何其他改進，理論上表現(xiàn)出的性能也應(yīng)該基本相同。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

在這項測試中，兩顆處理器的緩存訪問延遲幾乎相同，但Cannon Lake核心的i3 8121U的內(nèi)存訪問延遲要高出Kaby Lake核心的i3 8130U多達50%，一上來就震驚了四座（當然這不是啥好事）。

盡管為i3 8121U配套的DDR4 2400內(nèi)存時序17-17-17，略輸于i3 8130U的16-16-16，但這一丟丟時序差異遠不足以有如此大的影響，能想到的唯一原因是，Cannon Lake核心訪問內(nèi)存控制器有非常大的額外開銷，這或許就是封堵了幽靈和熔斷漏洞的副作用。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

而功耗方面比較撲朔迷離，我們知道，Intel在處理器硬件中設(shè)置了兩個關(guān)鍵的功耗限制——PL1和PL2，前者控制穩(wěn)態(tài)功耗，后者控制短時間睿頻功耗。

在大多數(shù)情況下，處理器的穩(wěn)態(tài)功耗和TDP相同，如i3 8130U就是這樣，處理器的穩(wěn)態(tài)功耗為15W，然而同為15W TDP的i3 8121U的穩(wěn)態(tài)功耗僅為12.6W。由PL2控制的峰值功耗也是同樣，i3 8130U的峰值功耗可以達到24.2 W，而i3 8121U最高只能沖到18.7W，且睿頻的持續(xù)時間也要比i3 8130U短很多。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

糟心的是，雖然i3 8121U的功耗墻更低，但由于其頻率更低性能更差，實際執(zhí)行運算所消耗的能量反而更多。在POV-Ray測試項中，Kaby Lake核心的i3 8130U的總耗能只有768 mWh，而Cannon Lake核心的i3 8121U的總耗能為867mWh，足足高了12.9%。

2.2GHz同頻測試：SPEC2006

除了功耗，關(guān)于Cannon Lake核心的另一個問題在于它是否是一個高效的架構(gòu)設(shè)計。為了進行直接的IPC比較，我們將兩顆處理器固定住2.2 GHz同頻率上運行SPEC2006 測試。

SPEC2006是一個重要的基準測試軟件，它與其他測試軟件的區(qū)別在于所處理的數(shù)據(jù)集更大更復雜。作為基準測試更有代表性，它可以充分展示架構(gòu)的更多細節(jié)。

從測試結(jié)果來看，兩款不同核心的處理器性能相差無幾，Kaby Lake核心的i3 8130U在與SIMD相關(guān)的462.libquantum和470.lbm測試項中似乎比Cannon Lake核心的i3 8121U更有優(yōu)勢，這也許與二者內(nèi)存延遲性能有關(guān)。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試：系統(tǒng)綜合性能

系統(tǒng)測試部分重點關(guān)注實際用戶體驗，將包括應(yīng)用加載時間、圖像處理、簡單科學物理、仿真、神經(jīng)仿真、優(yōu)化計算和3D模型開發(fā)等測試項。

GIMP應(yīng)用加載時間

系統(tǒng)響應(yīng)速度是最關(guān)乎用戶體驗的指標，一個很好的測試用例是看應(yīng)用加載需要多長時間。在這一測試中，Cannon Lake核心的i3 8121U表現(xiàn)的特別好。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

FCAT圖像處理

FCAT軟件采用錄制的視頻，并將顏色數(shù)據(jù)處理成幀時間數(shù)據(jù)，以便系統(tǒng)可以繪制可視化的幀率。

這一測試是單線程的，在基準頻率下，Cannon Lake核心的i3 8121U與Kaby Lake核心的i3 8130U耗時差距在半秒之內(nèi)，i3 8121U略微領(lǐng)先。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

3DPM粒子運動計算

3DPM測試是一個定制的基準測試，旨在模擬3D空間中六個點的不同粒子運動算法。算法的一個關(guān)鍵部分是使用了相對快速的隨機數(shù)生成，最終在代碼中實現(xiàn)依賴鏈。在這一測試中，我們在六種算法上運行一個原子粒子集，每次20秒，暫停10秒，并報告粒子移動的總速率，以每秒數(shù)百萬次運動為單位。

在不啟動AVX，Cannon Lake核心的i3 8121U敗給了Kaby Lake核心的i3 8130U。但各自啟動AVX后，i3 8121U竟然跑出了4519的超高分，甚至擊敗了4185分的18核Core i9 7980XE處理器，非常瘋狂。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

Dolphin 5.0模擬器

Dolphin 5.0是一款GameCube/Wii主機模擬器，可以在PC上玩到這些老款游戲主機的獨占大作。不過，模擬這兩臺使用Power架構(gòu)處理器的主機通常需要一顆不弱的處理器才行。

在這一測試中，兩款處理器的同頻性能大致相同。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

DigiCortex海蛞蝓大腦模擬

DigiCortex基準測試最初設(shè)計用于神經(jīng)元和突觸活動的模擬和可視化，該軟件具有多種基準模式，本次使用小基準測試，模擬32000個神經(jīng)元和18億個突觸，規(guī)模相當于海蛞蝓的大腦。

模擬類型分為“非激發(fā)”和“激發(fā)”兩種模式，前者受內(nèi)存影響更大，后者更依賴純粹的處理器性能。測試中使用了后者，兩款處理器的同頻性能大致相同。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

y-Cruncher科學計算

y-Cruncher是一款幫助計算各種數(shù)學常數(shù)的工具，軟件支持通過二進制、單線程和多線程等不同優(yōu)化方式運行，甚至包括AVX-512優(yōu)化的二進制文件。本次測試基于單線程和多線程方式，計算2.5億位圓周率。

測試結(jié)果不出意外是 Cannon Lake核心的i3 8121U獲勝，到目前為止，所有可以利用AVX-512指令集的軟件都是i3 8121U獲勝。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

Agisoft Photoscan 2D圖像轉(zhuǎn)3D模型

PhotoScan可以將許多2D圖像轉(zhuǎn)換為3D模型，這是模型開發(fā)和歸檔中的一個重要工具，依賴于許多單線程和多線程算法。

測試使用了PhotoScan v1.3.3版本，其中包含了84 x 1800萬像素的大數(shù)據(jù)集，通過一個相當快速的算法變體，最后對比轉(zhuǎn)換過程總時間。

在這一測試中，兩款處理器的同頻性能大致相同。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試：渲染性能

渲染性能通常是處理器在專業(yè)環(huán)境下的關(guān)鍵指標，從3D渲染到光柵化，涵蓋網(wǎng)格、紋理、碰撞、鋸齒、物理等方面。大多數(shù)渲染器都支持CPU渲染，少數(shù)可以支持GPU或FPGA和ASIC等專用芯片。對于大型工作室來說，CPU仍然是首選的硬件。

Corona 1.3渲染

Corona是3DS Max和Cinema 4D等軟件的高級性能渲染器，基準測試的GUI可顯示正在構(gòu)建的場景，并將渲染時間反饋給用戶。

本次測試使用了直接輸出結(jié)果的命令行版本，輸出的結(jié)果也不是報告時間，而是報告六次運行中每秒的平均光線數(shù)，因為單位時間內(nèi)的性能比例通常更容易理解。

Corona只支持到AVX2指令集，無法充分發(fā)揮Cannon Lake 核心的特性。在這一測試中，i3 8121U同頻性能落后i3 8130U約10%。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

Blender 3D創(chuàng)作軟件

Blender是一個開源的高級渲染工具，支持大量可配置項，被世界上許多知名的動畫工作室所使用。該軟件的開發(fā)小組最近發(fā)布了一個基準測試包，本次測試通過命令行運行該套件中的“bmw27”場景子測試，并測量完成渲染的時間。

Blender同樣只支持到AVX2指令集，在這一測試中，兩款處理器的同頻性能大致相同，Cannon Lake 核心的i3 8121U有微弱優(yōu)勢。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

LuxMark引擎

使用LuxRender引擎開發(fā)的基準測試提供了幾個不同的場景和API，本次測試選擇在C ++和OpenCL代碼路徑上運行簡單的“Ball”場景，以粗略渲染開始，并在兩分鐘內(nèi)慢慢提高質(zhì)量，最終結(jié)果以每秒渲染的光線數(shù)展示。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

POV-Ray光線追蹤

Persistence of Vision光線追蹤引擎是另一個眾所周知的基準測試工具，在AMD發(fā)布Ryzen處理器之前一直默默無聞，而后Intel和AMD都開始向開源項目的主要分支提交代碼。

本次測試使用從命令行調(diào)用所有內(nèi)核的內(nèi)置基準。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試：辦公性能

Office測試套件旨在專注于更多行業(yè)標準，如辦工流程和系統(tǒng)會議等，但是我們也將編譯器性能捆綁在本節(jié)中。對于必須對硬件進行總體評估的用戶來說，這些通常是最需要考慮的基準測試。

3DMark物理計算

游戲測試軟件3DMark的每個測試場景均包括一個物理測試子項。按復雜程度排列的依次為Ice Storm、Cloud Gate、Sky Diver、Fire Strike和Time Spy。

在所有測試場景中，兩款處理器的同頻性能都大致相同。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

GeekBench 4

GeekBench 4是常用的跨平臺測試工具，重點尋求峰值吞吐量的一系列算法，包括加密、壓縮、快速傅里葉變換、存儲器操作、n體物理、矩陣運算、直方圖處理和HTML解析等，常用于移動設(shè)備測試。

考慮到其通用性和流行程度，本次也加入了這款軟件的單線程和多線程測試。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

2.2GHz同頻測試：編碼性能

隨著流媒體和短視頻內(nèi)容的興起，越來越多的家庭用戶和游戲玩家需要將視頻文件進行轉(zhuǎn)換，處理器的編碼和轉(zhuǎn)碼性能變得越來越重要，本次編碼測試也主要圍繞這些重要的場景進行。

Handbrake視頻轉(zhuǎn)碼

Handbrake是一種流行的開源視頻轉(zhuǎn)換軟件，最新的版本可利用AVX-512和OpenCL來加速某些類型的轉(zhuǎn)碼和算法。本次測試使用的CPU轉(zhuǎn)碼。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

7-Zip壓縮解壓

在壓縮/解壓應(yīng)用中，開源的7-Zip是很歡迎的工具之一。本次猜測是使用最新的v18.05版本，它內(nèi)置有基準測試，從命令行運行基準測試，報告壓縮、解壓縮和綜合得分。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

WinRAR壓縮解壓

在大多數(shù)人的系統(tǒng)中通常都有WinRAR，它是20多年前的第一批壓縮解壓工具之一。它沒有內(nèi)置基準測試，本次使用一個包含超過30個60秒視頻文件和2000個零碎小文件的文件夾，以正常壓縮率運行壓縮。

WinRAR是可變線程的，但也容易受到緩存的影響，因此測試需運行它10次并取最后五次的平均值，使結(jié)果可以展示CPU純粹的原始計算性能。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

AES加密

許多移動設(shè)備默認使用的文件系統(tǒng)都提供了加密功能以保護內(nèi)容，PC上的Windows也有，通常由BitLocker或第三方軟件應(yīng)用。本次使用已停產(chǎn)的TrueCrypt作為其內(nèi)置基準測試，可直接在內(nèi)存中測試多種加密算法，支持AES指令集但不支持AVX-512。測試采用的數(shù)據(jù)是AES加密/解密組合，以每秒千兆字節(jié)為單位。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

雷鋒網(wǎng)總結(jié)

Intel在10nm工藝上確實進行了很多改進，如果每一步都能完美運行，那么10nm應(yīng)該在去年就成了?？蓡栴}是在半導體設(shè)計中，有幾百個不同的特性，改動任何一個都可能會導致其他幾個甚至幾十個特性變差，這正是Intel在10nm工藝方面遇到的最大問題。

仍記得2018年的CES上，Intel對10nm工藝相關(guān)的問題緘口不言，從這曇花一現(xiàn)的Cannon Lake核心來看，唯一稱得上亮眼的表現(xiàn)只有AVX-512性能，很明顯第一代10nm還遠遠沒有準備好邁入黃金時段，Intel是在試圖冷處理這一代處理器，也肯定不會正式公開發(fā)售它們。

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

在Intel給出的這張圖中，右側(cè)顯示10nm工藝及其改型可依靠較低的動態(tài)電容擁有較低的功率，然而數(shù)軸的左側(cè)則顯示10nm和10nm+工藝的單個晶體管性能其實還要低于當前的14nm++工藝，要到下下下一代的10nm++工藝才能真正實現(xiàn)全面領(lǐng)先，而從i3 8121U的表現(xiàn)來看，很大概率上也意味著在第三代10nm++工藝實施之前，業(yè)界很可能都無法看到真正突破性的10nm處理器（一竿子支到三零零零年了……）。

預(yù)計將在今年下半年問世的Ice Lake處理器會使用第二代10nm+工藝，電氣性能將非常接近14nm++工藝，或許那時Intel在10nm工藝上打響真正的第一炮吧。

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

4人收藏

任然

編輯

觀點離經(jīng)叛道的骨灰級硬件愛好者

發(fā)私信

當月熱門文章

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

10nm工藝難在哪？

揭開架構(gòu)之秘

處理器規(guī)格對比

內(nèi)存性能和功耗測試

2.2GHz同頻測試：SPEC2006

2.2GHz同頻測試：系統(tǒng)綜合性能

2.2GHz同頻測試：渲染性能

2.2GHz同頻測試：辦公性能

2.2GHz同頻測試：編碼性能

雷鋒網(wǎng)總結(jié)

意大利炮（面）來了？深度解析Intel初代10nm Cannon Lake處理器

10nm工藝難在哪？