日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
芯片 正文
發(fā)私信給趙之齊
發(fā)送

0

成本下探30%,中科曙光IB產(chǎn)品沖擊RoCE性價比「護城河」

本文作者: 趙之齊   2026-03-18 15:32
導(dǎo)語:在RoCE和英偉達(dá)IB之外,高速網(wǎng)絡(luò)的第三個選項出現(xiàn)了。

智算集群的建設(shè)瓶頸,正在經(jīng)歷轉(zhuǎn)移。

過去兩年,行業(yè)還聚焦在算力規(guī)模上,仿佛誰拿到了更多GPU,誰就掌握了AI競爭的入場券。但當(dāng)萬卡集群逐漸落地,一個更隱蔽的瓶頸浮出水面:網(wǎng)絡(luò)。

中科曙光高級副總裁李斌算了這樣一筆賬:“原來以CPU為中心的計算單元,雙路的計算節(jié)點插一張網(wǎng)卡就夠了;現(xiàn)在以GPU為中心的計算節(jié)點,一臺機器要配八張甚至更多的網(wǎng)卡?!?/p>

由此算下來,如今網(wǎng)絡(luò)的用量相比以往的數(shù)據(jù)中心,提高了十到二十倍。

數(shù)量膨脹背后,智算集群也對網(wǎng)絡(luò)性能提出更苛刻的要求:

萬卡集群的訓(xùn)練,需要網(wǎng)絡(luò)時延在納秒級內(nèi),且傳輸精度做到無損。而現(xiàn)實是,無論選擇英偉達(dá)主導(dǎo)的IB(InfiniBand)路線,還是運維復(fù)雜的RoCE路線,國內(nèi)用戶都一定程度上“受制于人”。

成本下探30%,中科曙光IB產(chǎn)品沖擊RoCE性價比「護城河」

正是這樣的背景下,中科曙光歷時三年推出國產(chǎn)原生IB架構(gòu)高速網(wǎng)絡(luò)產(chǎn)品scaleFabric,試圖在智算網(wǎng)絡(luò)的咽喉要道上,占據(jù)一席之地。


IB和RoCE,二分天下?

隨著AI需求飆漲,行業(yè)已經(jīng)逐漸發(fā)現(xiàn),大規(guī)模計算系統(tǒng)的效率不等于系統(tǒng)的峰值算力,在集群實際運行中,接近一半的算力會被浪費掉。

也就是說,單卡算力再強,如果網(wǎng)絡(luò)無法在規(guī)定時間內(nèi)完成數(shù)據(jù)交換,大部分算力只能在等待中被浪費。MFU(模型算力利用率)的天花板,很大程度上是由網(wǎng)絡(luò)決定的。

目前,萬卡集群高速互聯(lián)需求下,市場能滿足的技術(shù)路線主要有兩條:IB(InfiniBand)和RoCE(RDMA over Converged Ethernet)。前者是專為高性能計算設(shè)計的原生RDMA架構(gòu),后者則是基于以太網(wǎng)的RDMA技術(shù)方案。

過往,二者的場景和區(qū)別還比較涇渭分明:

IB性能卓越但價格昂貴,是超算和頂級AI集群的首選;RoCE成本較低,且互聯(lián)網(wǎng)廠商在CPU云時代便以以太網(wǎng)為基礎(chǔ),成熟的運維體系也讓他們在智算時代更傾向于繼續(xù)沿用以太網(wǎng)路線。

然而,AI帶來算力需求爆發(fā)的當(dāng)下,隨著智算集群規(guī)模從千卡邁向萬卡甚至十萬卡,RoCE的先天短板開始顯現(xiàn)——

IB交換機采用VCT交換,可實現(xiàn)“邊收邊轉(zhuǎn)”,交換時延可控制在300納秒以內(nèi);而RoCE交換機則采用“存儲-轉(zhuǎn)發(fā)”交換,需完整接收數(shù)據(jù)包后再轉(zhuǎn)發(fā),時延普遍在500納秒以上。

在流量控制機制上,IB采用基于信用的精細(xì)化流控,發(fā)送前會確認(rèn)接收端資源,從根源避免丟包;RoCE依賴的PFC(Priority Flow Control)暫停機制則是粗粒度流控,容易出現(xiàn)丟包、PFC死鎖或風(fēng)暴,必須依賴擁塞控制且需人工調(diào)優(yōu)水線。

盡管RoCE廠商在追趕IB的性能,但用戶也已經(jīng)在“用腳投票”。例如,在感受到IB的性能優(yōu)勢后,微軟如今已開始將部分核心AI訓(xùn)練業(yè)務(wù)從以太轉(zhuǎn)向了IB。

然而,對于國內(nèi)智算用戶而言,選擇IB同樣面臨困境:

英偉達(dá)一家獨大,采購價格高昂,且供貨周期和產(chǎn)品迭代并不穩(wěn)定。并且,英偉達(dá)在B300等最新芯片中已標(biāo)配CX8網(wǎng)絡(luò)模塊,這意味著采購其芯片,往往就被強制綁定使用英偉達(dá)自家的IB網(wǎng)絡(luò)產(chǎn)品。

面對性能較遜色的RoCE與高價壟斷的IB,國產(chǎn)算力高速網(wǎng)絡(luò)需要一條新出路。


國產(chǎn)IB的正式突圍

中科曙光scaleFabric,試圖打破這一僵局。

這是國內(nèi)首款全棧自研原生IB架構(gòu)高速網(wǎng)絡(luò)產(chǎn)品:從底層的112G SerDes IP、交換芯片、網(wǎng)卡,到上層的交換機硬件和管理軟件,全是自主研發(fā)產(chǎn)品,歷時三年研發(fā)。

從公開的性能數(shù)據(jù)看,scaleFabric對標(biāo)的是英偉達(dá)目前主流的NDR(指 400Gb/s InfiniBand 網(wǎng)絡(luò))產(chǎn)品

性能層面,中國科學(xué)院計算技術(shù)研究所王展表示,通信層面上,曙光的產(chǎn)品基本上和英偉達(dá)在同一水平。其端到端通信時延在0.93微秒,交換機轉(zhuǎn)發(fā)時延260納秒,與英偉達(dá)NDR持平;單端口帶寬達(dá)到800G,較RoCE主流交換機領(lǐng)先一到兩代,整機交換容量64T;在典型AI訓(xùn)練任務(wù)中,實測網(wǎng)絡(luò)效率提升40%以上。

可靠性層面,由于采用了原生IB的信用流控機制,scaleFabric實現(xiàn)了真無損網(wǎng)絡(luò),避免了RoCE方案中常見的PFC風(fēng)暴風(fēng)險。曙光透露,該產(chǎn)品已在近萬卡規(guī)模的集群中持續(xù)穩(wěn)定運行超過10個月。

當(dāng)然,對用戶而言,最敏感的變量依然是成本。曙光透露,在同等規(guī)模集群中,scaleFabric的整體網(wǎng)絡(luò)成本較進(jìn)口IB方案可降低約30%

這一價格優(yōu)勢一旦被驗證,RoCE賴以生存的“性價比護身符”將受到巨大沖擊

不過,這套國產(chǎn)IB產(chǎn)品的誕生也并非坦途。

中科曙光高速網(wǎng)絡(luò)互聯(lián)產(chǎn)品部總工程師萬偉直言,研發(fā)中的第一個難點是鏈路技術(shù):起初大家想買現(xiàn)成的IB方案,但是根本不符合要求,最后只能招團隊從零做起。

其次,在目標(biāo)設(shè)定上,團隊并非簡單對標(biāo)英偉達(dá)IB,而是立志在關(guān)鍵規(guī)格上實現(xiàn)超越,這也帶來了巨大的技術(shù)挑戰(zhàn)。萬偉感慨,所幸團隊最終在國家的支持下得以攻克難關(guān)、取得成功。

李斌補充說,當(dāng)前業(yè)界存在RoCE、ScaleOut、ScaleUP等多種技術(shù)路線,百花齊放,而曙光的選擇是在原生RDMA架構(gòu)基礎(chǔ)上,為超大規(guī)模系統(tǒng)上的性能和擴展性做深度考量。

他對市場競爭格局有清醒的判斷:“目前這個市場的主要玩家還是英偉達(dá)。我們對于產(chǎn)品的定位,是期待在IB的技術(shù)路線能實現(xiàn)技術(shù)上的國產(chǎn)化替代,實現(xiàn)業(yè)務(wù)上真正的市場占比替代。我們希望打破一家獨大的局面,把整個技術(shù)做開放,市場的蛋糕大家共享。”

盡管英偉達(dá)的領(lǐng)先地位短期難以撼動,但國產(chǎn)IB的突破,已為智算網(wǎng)絡(luò)自主之路點亮希望。

雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說