磐脈920亮相，平頭哥算存網(wǎng)版圖閉環(huán)

本文作者：劉伊倫

2026-04-30 09:37

導語：算力、網(wǎng)力和存力的全布局，讓平頭哥在國內(nèi)AI基建競賽中占據(jù)關(guān)鍵一席。

“在網(wǎng)絡(luò)結(jié)構(gòu)未充分優(yōu)化的情況下，大規(guī)模AI集群的GPU利用率通常僅維持在30%—40%區(qū)間。”平頭哥產(chǎn)品總監(jiān)李旭慧表示。

算力集群本質(zhì)上是一個強同步系統(tǒng)：上千張GPU需要在同一時間完成計算并交換數(shù)據(jù)。一旦某個節(jié)點通信出現(xiàn)延遲，整個集群的計算進程就會被迫等待，系統(tǒng)效率最終由最慢路徑?jīng)Q定。

當集群規(guī)模進一步擴展，網(wǎng)絡(luò)瓶頸被進一步放大：突發(fā)推理流量帶來的數(shù)據(jù)洪峰、復雜拓撲導致的鏈路擁塞，以及依賴系統(tǒng)級PCIe總線所形成的長數(shù)據(jù)路徑，都在不斷侵蝕算力效率。

在這一背景下，行業(yè)正在形成一個新的共識：決定AI系統(tǒng)效率的關(guān)鍵，正在從單點算力性能，轉(zhuǎn)向整個算力網(wǎng)絡(luò)系統(tǒng)的協(xié)同能力。

4月28日，在2026數(shù)字中國建設(shè)峰會上，平頭哥正式發(fā)布旗下首款智能網(wǎng)卡“磐脈920”。

磐脈920被定義為AI原生智能網(wǎng)卡，其搭載自主設(shè)計的智能網(wǎng)卡芯片，采用PCIe 5.0與112G PAM4以太網(wǎng)技術(shù)，最大支持400Gbps吞吐帶寬，收發(fā)包率達到400Mpps。

據(jù)雷峰網(wǎng)了解，磐脈920已進入量產(chǎn)階段，首批產(chǎn)品已于本月上線，相關(guān)訂單正在加速交付。

隨著磐脈920的發(fā)布，平頭哥已完成數(shù)據(jù)中心四大核心芯片的布局：真武系列AI 芯片、倚天系列CPU、磐脈系列智能網(wǎng)卡，以及鎮(zhèn)岳系列存儲主控芯片，覆蓋算力、網(wǎng)絡(luò)與存力三大關(guān)鍵環(huán)節(jié)。

當Agent驅(qū)動的流量結(jié)構(gòu)變得更加碎片化與不可預測，算力、網(wǎng)絡(luò)與存儲之間的協(xié)同邊界被持續(xù)放大，智能網(wǎng)卡還能在多大程度上繼續(xù)釋放系統(tǒng)效率？

AI算力越強越浪費？通信路徑讓GPU利用率「卡」在30%

“從行業(yè)趨勢來看，AI算力增長很快，網(wǎng)絡(luò)已經(jīng)成為明顯的短板。”李旭慧說到。

這一問題在訓練與推理分化中被進一步放大。

隨著智能體開始進入規(guī)?；瘧?，AI系統(tǒng)的負載結(jié)構(gòu)正在發(fā)生轉(zhuǎn)移：推理與訓練的占比逐步從1:1向4:1演進。

在這一變化下，網(wǎng)絡(luò)不再只是訓練階段的支撐系統(tǒng)，而是同時承載高頻、突發(fā)、混合型的推理流量，整體負載從相對可預測的同步通信，轉(zhuǎn)向高度動態(tài)的不確定性結(jié)構(gòu)，對帶寬與時延能力提出持續(xù)性挑戰(zhàn)。

但現(xiàn)有網(wǎng)絡(luò)體系仍存在明顯代際差異。

傳統(tǒng)TCP網(wǎng)卡依賴內(nèi)核與軟件棧完成數(shù)據(jù)搬移，本質(zhì)上仍是“CPU參與型”的通信路徑；RDMA雖然通過繞過內(nèi)核、減少拷貝開銷來降低時延，但在大規(guī)模AI集群中，仍會受到多層交換拓撲、跨節(jié)點同步機制以及全局一致性調(diào)度等因素的制約。

DPU與AI專用網(wǎng)卡的路徑也開始分化。

DPU通常集成CPU核并支持可編程能力，同時需要掛載內(nèi)存，整體更偏向通用計算場景下的資源虛擬化與云資源管理。而在AI訓練與推理場景中，核心需求并不是計算擴展，而是大規(guī)模、低時延、對稱通信能力，因此更輕量的專用網(wǎng)卡架構(gòu)被認為更具針對性。

從實際效果來看，這類通信瓶頸會直接影響集群效率。

在大規(guī)模訓練系統(tǒng)中，如果網(wǎng)絡(luò)不匹配，GPU利用率往往只能維持在30%左右，即便優(yōu)化較好也很難超過60%。其根源并不只在單點帶寬，而在于整個系統(tǒng)的拓撲結(jié)構(gòu)與通信路徑難以完全對稱。CPU、GPU、網(wǎng)卡與多級交換機共同構(gòu)成復雜路徑，一旦鏈路時延不均，就會被同步機制放大為整體性能損耗。

因此，網(wǎng)絡(luò)優(yōu)化的關(guān)鍵不只在于帶寬提升，更在于對通信路徑的調(diào)度與均衡能力。例如在相近時延條件下進行路徑探測與流量分發(fā)，使系統(tǒng)盡可能避免“快慢不均”的資源浪費，從而提升整體算力利用效率。

帶寬利用率提升至90%、系統(tǒng)成本下降30%，磐脈920「重構(gòu)」集群通信效率邊界

“磐脈920搭載平頭哥自研芯片架構(gòu)，每秒可處理4億個網(wǎng)絡(luò)數(shù)據(jù)包，提供400G網(wǎng)絡(luò)帶寬，單秒傳輸能力相當于100部高清視頻數(shù)據(jù)量?！?/strong>李旭慧告訴雷峰網(wǎng)(公眾號：雷峰網(wǎng))。

磐脈920以AI集群通信瓶頸為核心出發(fā)點，從“路徑、調(diào)度與架構(gòu)”三個層面重構(gòu)數(shù)據(jù)流轉(zhuǎn)方式。

在傳輸層面，磐脈920通過多路徑RDMA機制，打破傳統(tǒng)RDMA依賴單一路徑的限制，使數(shù)據(jù)流量能夠在多鏈路之間并行調(diào)度，從而降低熱點擁塞概率并提升整體帶寬利用率，顯著縮短訓練場景中的任務(wù)完成時間。

在調(diào)度層面，其集成細粒度網(wǎng)絡(luò)感知能力與可編程擁塞控制算法，能夠?qū)︽溌窢顟B(tài)與流量變化進行實時監(jiān)測，并在突發(fā)流量或擁塞發(fā)生前后動態(tài)調(diào)整傳輸策略，實現(xiàn)對不同業(yè)務(wù)流的差異化調(diào)度與優(yōu)先級保障，從而降低網(wǎng)絡(luò)抖動對關(guān)鍵任務(wù)的影響。

同時，通過選擇性重傳與擁塞狀態(tài)實時監(jiān)控機制，進一步降低跨域長尾時延，使鏈路帶寬利用率由約60%提升至接近90%。

這一調(diào)度能力的基礎(chǔ)，來自其更底層的智能感知算力網(wǎng)絡(luò)設(shè)計。磐脈920具備55種網(wǎng)絡(luò)感知手段與最多32種擁塞控制算法組合能力，能夠?qū)︽溌愤M行細粒度檢測與收發(fā)包級控制，使擁塞感知時間較傳統(tǒng)軟件方案提升約10倍，并可實現(xiàn)7級業(yè)務(wù)優(yōu)先級保障。

更關(guān)鍵的變化發(fā)生在系統(tǒng)架構(gòu)層面。

磐脈920在網(wǎng)卡內(nèi)部引入PCIe Switch，實現(xiàn)直連GPU、SSD，減少對外部交換芯片與冗余數(shù)據(jù)路徑的依賴，從而構(gòu)建更短的數(shù)據(jù)傳輸鏈路，降低系統(tǒng)復雜度與通信開銷。

這種“內(nèi)生式網(wǎng)絡(luò)結(jié)構(gòu)”重構(gòu)了數(shù)據(jù)流轉(zhuǎn)路徑，也直接帶來整體系統(tǒng)成本約30%的下降。

圍繞這一架構(gòu)，磐脈920進一步集成可編程網(wǎng)絡(luò)能力與硬件加速引擎，支持對數(shù)據(jù)面、控制面及網(wǎng)絡(luò)事件的靈活編排，并具備多種網(wǎng)絡(luò)感知手段與擁塞控制算法組合能力，使系統(tǒng)能夠根據(jù)不同AI負載動態(tài)調(diào)整通信策略。

在實際部署中，這一設(shè)計不僅提升了網(wǎng)絡(luò)利用效率，也顯著降低了集群部署與運維復雜度，使AI系統(tǒng)從數(shù)小時級部署收斂至分鐘級響應。

磐脈920面向開放市場測試

據(jù)悉，磐脈920項目早在三年前便已啟動立項，平頭哥團隊在持續(xù)三年的工程化迭代中，逐步將其性能打磨至當前市場第一梯隊水平。

在數(shù)據(jù)中心基礎(chǔ)設(shè)施這一長周期賽道中，技術(shù)能力只是起點，真正決定產(chǎn)品價值的，是能否完成從“可用”到“可規(guī)模化商用”的跨越。

基于這一判斷，磐脈920的設(shè)計并未局限于單一場景，而是圍繞多類算力基礎(chǔ)設(shè)施需求展開系統(tǒng)性布局，并在不同層級的數(shù)據(jù)流通與計算場景中形成適配能力：

在智算集群中，磐脈920主要支撐大規(guī)模AI訓練的高性能互聯(lián)，保障萬卡級集群的低時延、高穩(wěn)定通信；在通算集群中，通過網(wǎng)絡(luò)卸載與容器化能力，降低網(wǎng)絡(luò)開銷，提升整體算力利用效率；在存儲場景中，為分布式存儲提供低時延、高帶寬與穩(wěn)定流量支撐，保障海量數(shù)據(jù)的持續(xù)讀寫；在數(shù)據(jù)庫與大數(shù)據(jù)分析場景中，則通過優(yōu)化數(shù)據(jù)傳輸路徑，提升整體數(shù)據(jù)處理與分析效率。

“磐脈920并非定制開發(fā)的專用網(wǎng)卡，而是一款面向開放市場的通用型產(chǎn)品?！?/strong>李旭慧表示。

在這一產(chǎn)品策略下，磐脈920的開放屬性也開始進一步外溢。

磐脈將首先在阿里云數(shù)據(jù)中心實現(xiàn)部署。阿里云所提供的高復雜度云計算場景，作為核心訓練環(huán)境，通過“標桿級負載”持續(xù)拉動產(chǎn)品能力上限。

在此基礎(chǔ)上，磐脈920依托通用網(wǎng)卡的產(chǎn)品定位，已進一步向外部服務(wù)器廠商、部件廠商及多類云廠商開放測試。

從產(chǎn)品布局來看，磐脈920的發(fā)布，并非一次單點技術(shù)突破，而是平頭哥數(shù)據(jù)中心芯片體系的一次關(guān)鍵補位。

至此，真武AI芯片、倚天CPU、鎮(zhèn)岳存儲主控與磐脈智能網(wǎng)卡分別覆蓋智能計算、通用處理、數(shù)據(jù)存儲和網(wǎng)絡(luò)互聯(lián)，算力、存力與網(wǎng)力三類核心能力在芯片層完成閉環(huán)。這意味著，平頭哥已經(jīng)具備從“提供單一算力器件”走向“構(gòu)建完整算力基礎(chǔ)設(shè)施能力”的底層條件。

當算力集群效率越來越取決于通信與協(xié)同能力，網(wǎng)絡(luò)不再是附屬組件，而成為決定系統(tǒng)上限的核心變量。

在這一邏輯下，同時掌握算、存、網(wǎng)三類核心芯片能力的廠商，將不再只是參與某一環(huán)節(jié)的競爭者，而是有機會重新定義AI基礎(chǔ)設(shè)施的性能邊界與成本結(jié)構(gòu)。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

分享：

相關(guān)文章

平頭哥磐脈920 智能網(wǎng)卡

智源：FlagOS完成DeepSeekV4八款芯片Day0 適配，實現(xiàn) ...

阿里財報電話會：平頭哥GPU芯片已累計規(guī)?；桓?7萬 ...

阿里云漲價，平頭哥真武芯片漲幅最高達34％

阿里AI芯片露真容 “通云哥”黃金三角浮出水面

劉伊倫

編輯

微信YONGGANLL6662，歡迎交流

發(fā)私信

當月熱門文章

國產(chǎn)芯片錯過「組團反殺」英偉達機會，或因死磕自研互聯(lián)協(xié)議

華東大廠采購3家國產(chǎn)芯片公司數(shù)萬張卡；大廠擴建6000P計劃受阻；上市AI芯片公司綁定專屬服務(wù)器代工伙伴；相變浸沒液冷推廣不暢

萬卡集群利用率不足20%，TaaS平臺如何破解算力「空轉(zhuǎn)」難題？

當參數(shù)不再決定勝負，AI時代的企業(yè)級SSD靠什么「贏」？｜MemoryS 2026

硅基員工批量上線，企業(yè)安全的首要任務(wù)是辦理「Agent身份證」

最新文章

推理卡毛利率下滑超7%，天數(shù)智芯「降價換量」的買賣值不值？

英韌科技董事長吳子寧：從空轉(zhuǎn)到滿載，AI SSD如何把閑置算力變成「有效算力」？丨存儲芯片十人談

DeepSeek V4首發(fā)適配背后：昇騰為什么堅持不做CUDA兼容層？

摩爾線程最新財報：營收持續(xù)高增，推進十萬卡級集群建設(shè)

Agent時代CPU重回C位，英特爾數(shù)據(jù)中心不再只賣芯片

耳機降噪跑不動大模型，安克「被迫」造了顆存算一體芯片

熱門搜索

Waymo SpaceX 豐田網(wǎng)易 Nokia Dropbox 新基建字節(jié) Spotify iPhone 7 東芝