日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發(fā)私信給劉伊倫
發(fā)送

0

磐脈920亮相,平頭哥算存網(wǎng)版圖閉環(huán)

本文作者: 劉伊倫   2026-04-30 09:37
導語:算力、網(wǎng)力和存力的全布局,讓平頭哥在國內(nèi)AI基建競賽中占據(jù)關(guān)鍵一席。

“在網(wǎng)絡(luò)結(jié)構(gòu)未充分優(yōu)化的情況下,大規(guī)模AI集群的GPU利用率通常僅維持在30%—40%區(qū)間。”平頭哥產(chǎn)品總監(jiān)李旭慧表示。

算力集群本質(zhì)上是一個強同步系統(tǒng):上千張GPU需要在同一時間完成計算并交換數(shù)據(jù)。一旦某個節(jié)點通信出現(xiàn)延遲,整個集群的計算進程就會被迫等待,系統(tǒng)效率最終由最慢路徑?jīng)Q定。

當集群規(guī)模進一步擴展,網(wǎng)絡(luò)瓶頸被進一步放大:突發(fā)推理流量帶來的數(shù)據(jù)洪峰、復雜拓撲導致的鏈路擁塞,以及依賴系統(tǒng)級PCIe總線所形成的長數(shù)據(jù)路徑,都在不斷侵蝕算力效率。

在這一背景下,行業(yè)正在形成一個新的共識:決定AI系統(tǒng)效率的關(guān)鍵,正在從單點算力性能,轉(zhuǎn)向整個算力網(wǎng)絡(luò)系統(tǒng)的協(xié)同能力。

4月28日,在2026數(shù)字中國建設(shè)峰會上,平頭哥正式發(fā)布旗下首款智能網(wǎng)卡“磐脈920”。

磐脈920被定義為AI原生智能網(wǎng)卡,其搭載自主設(shè)計的智能網(wǎng)卡芯片,采用PCIe 5.0與112G PAM4以太網(wǎng)技術(shù),最大支持400Gbps吞吐帶寬,收發(fā)包率達到400Mpps。

據(jù)雷峰網(wǎng)了解,磐脈920已進入量產(chǎn)階段,首批產(chǎn)品已于本月上線,相關(guān)訂單正在加速交付。

隨著磐脈920的發(fā)布,平頭哥已完成數(shù)據(jù)中心四大核心芯片的布局:真武系列AI 芯片、倚天系列CPU、磐脈系列智能網(wǎng)卡,以及鎮(zhèn)岳系列存儲主控芯片,覆蓋算力、網(wǎng)絡(luò)與存力三大關(guān)鍵環(huán)節(jié)。

當Agent驅(qū)動的流量結(jié)構(gòu)變得更加碎片化與不可預測,算力、網(wǎng)絡(luò)與存儲之間的協(xié)同邊界被持續(xù)放大,智能網(wǎng)卡還能在多大程度上繼續(xù)釋放系統(tǒng)效率?

AI算力越強越浪費?通信路徑讓GPU利用率「卡」在30%

“從行業(yè)趨勢來看,AI算力增長很快,網(wǎng)絡(luò)已經(jīng)成為明顯的短板。”李旭慧說到。

這一問題在訓練與推理分化中被進一步放大。

隨著智能體開始進入規(guī)?;瘧?,AI系統(tǒng)的負載結(jié)構(gòu)正在發(fā)生轉(zhuǎn)移:推理與訓練的占比逐步從1:1向4:1演進。

在這一變化下,網(wǎng)絡(luò)不再只是訓練階段的支撐系統(tǒng),而是同時承載高頻、突發(fā)、混合型的推理流量,整體負載從相對可預測的同步通信,轉(zhuǎn)向高度動態(tài)的不確定性結(jié)構(gòu),對帶寬與時延能力提出持續(xù)性挑戰(zhàn)。

但現(xiàn)有網(wǎng)絡(luò)體系仍存在明顯代際差異。

傳統(tǒng)TCP網(wǎng)卡依賴內(nèi)核與軟件棧完成數(shù)據(jù)搬移,本質(zhì)上仍是“CPU參與型”的通信路徑;RDMA雖然通過繞過內(nèi)核、減少拷貝開銷來降低時延,但在大規(guī)模AI集群中,仍會受到多層交換拓撲、跨節(jié)點同步機制以及全局一致性調(diào)度等因素的制約。

DPU與AI專用網(wǎng)卡的路徑也開始分化。

DPU通常集成CPU核并支持可編程能力,同時需要掛載內(nèi)存,整體更偏向通用計算場景下的資源虛擬化與云資源管理。而在AI訓練與推理場景中,核心需求并不是計算擴展,而是大規(guī)模、低時延、對稱通信能力,因此更輕量的專用網(wǎng)卡架構(gòu)被認為更具針對性。

從實際效果來看,這類通信瓶頸會直接影響集群效率。

在大規(guī)模訓練系統(tǒng)中,如果網(wǎng)絡(luò)不匹配,GPU利用率往往只能維持在30%左右,即便優(yōu)化較好也很難超過60%。其根源并不只在單點帶寬,而在于整個系統(tǒng)的拓撲結(jié)構(gòu)與通信路徑難以完全對稱。CPU、GPU、網(wǎng)卡與多級交換機共同構(gòu)成復雜路徑,一旦鏈路時延不均,就會被同步機制放大為整體性能損耗。

因此,網(wǎng)絡(luò)優(yōu)化的關(guān)鍵不只在于帶寬提升,更在于對通信路徑的調(diào)度與均衡能力。例如在相近時延條件下進行路徑探測與流量分發(fā),使系統(tǒng)盡可能避免“快慢不均”的資源浪費,從而提升整體算力利用效率。

帶寬利用率提升至90%、系統(tǒng)成本下降30%,磐脈920「重構(gòu)」集群通信效率邊界

“磐脈920搭載平頭哥自研芯片架構(gòu),每秒可處理4億個網(wǎng)絡(luò)數(shù)據(jù)包,提供400G網(wǎng)絡(luò)帶寬,單秒傳輸能力相當于100部高清視頻數(shù)據(jù)量?!?/strong>李旭慧告訴雷峰網(wǎng)(公眾號:雷峰網(wǎng))。

磐脈920以AI集群通信瓶頸為核心出發(fā)點,從“路徑、調(diào)度與架構(gòu)”三個層面重構(gòu)數(shù)據(jù)流轉(zhuǎn)方式。

在傳輸層面,磐脈920通過多路徑RDMA機制,打破傳統(tǒng)RDMA依賴單一路徑的限制,使數(shù)據(jù)流量能夠在多鏈路之間并行調(diào)度,從而降低熱點擁塞概率并提升整體帶寬利用率,顯著縮短訓練場景中的任務(wù)完成時間。

在調(diào)度層面,其集成細粒度網(wǎng)絡(luò)感知能力與可編程擁塞控制算法,能夠?qū)︽溌窢顟B(tài)與流量變化進行實時監(jiān)測,并在突發(fā)流量或擁塞發(fā)生前后動態(tài)調(diào)整傳輸策略,實現(xiàn)對不同業(yè)務(wù)流的差異化調(diào)度與優(yōu)先級保障,從而降低網(wǎng)絡(luò)抖動對關(guān)鍵任務(wù)的影響。

同時,通過選擇性重傳與擁塞狀態(tài)實時監(jiān)控機制,進一步降低跨域長尾時延,使鏈路帶寬利用率由約60%提升至接近90%。

這一調(diào)度能力的基礎(chǔ),來自其更底層的智能感知算力網(wǎng)絡(luò)設(shè)計。磐脈920具備55種網(wǎng)絡(luò)感知手段與最多32種擁塞控制算法組合能力,能夠?qū)︽溌愤M行細粒度檢測與收發(fā)包級控制,使擁塞感知時間較傳統(tǒng)軟件方案提升約10倍,并可實現(xiàn)7級業(yè)務(wù)優(yōu)先級保障。

更關(guān)鍵的變化發(fā)生在系統(tǒng)架構(gòu)層面。

磐脈920在網(wǎng)卡內(nèi)部引入PCIe Switch,實現(xiàn)直連GPU、SSD,減少對外部交換芯片與冗余數(shù)據(jù)路徑的依賴,從而構(gòu)建更短的數(shù)據(jù)傳輸鏈路,降低系統(tǒng)復雜度與通信開銷。

這種“內(nèi)生式網(wǎng)絡(luò)結(jié)構(gòu)”重構(gòu)了數(shù)據(jù)流轉(zhuǎn)路徑,也直接帶來整體系統(tǒng)成本約30%的下降。

圍繞這一架構(gòu),磐脈920進一步集成可編程網(wǎng)絡(luò)能力與硬件加速引擎,支持對數(shù)據(jù)面、控制面及網(wǎng)絡(luò)事件的靈活編排,并具備多種網(wǎng)絡(luò)感知手段與擁塞控制算法組合能力,使系統(tǒng)能夠根據(jù)不同AI負載動態(tài)調(diào)整通信策略。

在實際部署中,這一設(shè)計不僅提升了網(wǎng)絡(luò)利用效率,也顯著降低了集群部署與運維復雜度,使AI系統(tǒng)從數(shù)小時級部署收斂至分鐘級響應。

磐脈920面向開放市場測試

據(jù)悉,磐脈920項目早在三年前便已啟動立項,平頭哥團隊在持續(xù)三年的工程化迭代中,逐步將其性能打磨至當前市場第一梯隊水平。

在數(shù)據(jù)中心基礎(chǔ)設(shè)施這一長周期賽道中,技術(shù)能力只是起點,真正決定產(chǎn)品價值的,是能否完成從“可用”到“可規(guī)模化商用”的跨越。

基于這一判斷,磐脈920的設(shè)計并未局限于單一場景,而是圍繞多類算力基礎(chǔ)設(shè)施需求展開系統(tǒng)性布局,并在不同層級的數(shù)據(jù)流通與計算場景中形成適配能力:

在智算集群中,磐脈920主要支撐大規(guī)模AI訓練的高性能互聯(lián),保障萬卡級集群的低時延、高穩(wěn)定通信;在通算集群中,通過網(wǎng)絡(luò)卸載與容器化能力,降低網(wǎng)絡(luò)開銷,提升整體算力利用效率;在存儲場景中,為分布式存儲提供低時延、高帶寬與穩(wěn)定流量支撐,保障海量數(shù)據(jù)的持續(xù)讀寫;在數(shù)據(jù)庫與大數(shù)據(jù)分析場景中,則通過優(yōu)化數(shù)據(jù)傳輸路徑,提升整體數(shù)據(jù)處理與分析效率。

“磐脈920并非定制開發(fā)的專用網(wǎng)卡,而是一款面向開放市場的通用型產(chǎn)品?!?/strong>李旭慧表示。

在這一產(chǎn)品策略下,磐脈920的開放屬性也開始進一步外溢。

磐脈將首先在阿里云數(shù)據(jù)中心實現(xiàn)部署。阿里云所提供的高復雜度云計算場景,作為核心訓練環(huán)境,通過“標桿級負載”持續(xù)拉動產(chǎn)品能力上限。

在此基礎(chǔ)上,磐脈920依托通用網(wǎng)卡的產(chǎn)品定位,已進一步向外部服務(wù)器廠商、部件廠商及多類云廠商開放測試。

從產(chǎn)品布局來看,磐脈920的發(fā)布,并非一次單點技術(shù)突破,而是平頭哥數(shù)據(jù)中心芯片體系的一次關(guān)鍵補位。

至此,真武AI芯片、倚天CPU、鎮(zhèn)岳存儲主控與磐脈智能網(wǎng)卡分別覆蓋智能計算、通用處理、數(shù)據(jù)存儲和網(wǎng)絡(luò)互聯(lián),算力、存力與網(wǎng)力三類核心能力在芯片層完成閉環(huán)。這意味著,平頭哥已經(jīng)具備從“提供單一算力器件”走向“構(gòu)建完整算力基礎(chǔ)設(shè)施能力”的底層條件。

當算力集群效率越來越取決于通信與協(xié)同能力,網(wǎng)絡(luò)不再是附屬組件,而成為決定系統(tǒng)上限的核心變量。

在這一邏輯下,同時掌握算、存、網(wǎng)三類核心芯片能力的廠商,將不再只是參與某一環(huán)節(jié)的競爭者,而是有機會重新定義AI基礎(chǔ)設(shè)施的性能邊界與成本結(jié)構(gòu)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄