日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
芯片 正文
發(fā)私信給楊依婷
發(fā)送

0

KV Cache需求暴漲32倍,AI如何重寫存儲產(chǎn)業(yè)鏈的「舊分工」?| MemoryS 2026觀察

本文作者: 楊依婷   2026-04-10 15:55
導(dǎo)語:“誰能解決AI時代數(shù)據(jù)搬運的功耗和延遲,誰就能定義下一個10年?!?

作者 | 楊依婷

編輯 | 包永剛

去年的CFMS|MemoryS峰會上,存儲廠商們討論的是:價格何時企穩(wěn)、QLC何時上量、AI PC何時落地。彼時,“AI會讓存儲變得更基礎(chǔ)、更關(guān)鍵”,還更像是一種行業(yè)判斷,一種面向未來的趨勢預(yù)演。

一年之后,站在MemoryS 2026的會場里,問題已經(jīng)徹底變了。

人們談?wù)摰牟辉僦皇俏辉杀?、顆粒供給和容量節(jié)奏,而是GPU利用率、token成本、系統(tǒng)調(diào)度效率,甚至物理AI場景中的實時決策能力。那些原本屬于AI基礎(chǔ)設(shè)施和系統(tǒng)架構(gòu)層面的議題,正在越來越頻繁地出現(xiàn)在存儲產(chǎn)業(yè)的討論中心。

在傳統(tǒng)計算架構(gòu)里,存儲的職責(zé)更多是“存”。數(shù)據(jù)被寫入、留存,在需要時調(diào)取,不需要時則靜靜停留在系統(tǒng)邊緣。它長期是BOM成本中的一項,是容量規(guī)劃的問題,而很少直接參與算力效率的定義。

但在大模型訓(xùn)練與推理時代,這一角色被徹底改寫。

KV Cache的訪問延遲,開始直接影響token生成速率;Checkpoint的寫入效率,決定著GPU在訓(xùn)練過程中的等待時間;SSD的IOPS密度,則進一步影響大模型推理場景下的并發(fā)能力和系統(tǒng)吞吐。

存儲開始進入計算主路徑,它決定數(shù)據(jù)流動的速度,也在某種程度上決定GPU算力能否被充分兌現(xiàn)。而這,正在反向重塑整個存儲產(chǎn)業(yè)鏈的分工邏輯。

存儲進入計算路徑,舊分工開始失效

AI推理有一個被反復(fù)討論的瓶頸:KV Cache。

大模型在處理長上下文時,需要把每一層、每一個token生成過程中的Key和Value結(jié)果臨時保存下來,以避免重復(fù)計算。上下文越長,并發(fā)越高,這部分緩存的體量就越驚人。

當(dāng)高帶寬顯存無法繼續(xù)承接,KV Cache只能向下一層存儲介質(zhì)下沉,NVMe SSD由此正式進入大模型推理的實時數(shù)據(jù)路徑。

如果說過去SSD的使命是“提升加載速度”,那么在AI時代,它開始直接約束或決定推理吞吐的上限。

慧榮科技總經(jīng)理茍嘉章的總結(jié)更為直接:“新一代存儲,正在從數(shù)據(jù)存儲進入計算存儲?!?/p>

這句話幾乎點破了整個行業(yè)變化的本質(zhì)。一旦存儲進入計算路徑,它就不再只是靜態(tài)保存數(shù)據(jù),而是開始影響token生成效率:訪問時延影響輸出速度,IOPS密度決定并發(fā)能力,寫入效率左右Checkpoint節(jié)奏,最終共同作用于單位token成本。

也正因如此,AI場景對存儲提出的要求,已經(jīng)明顯超出了“標(biāo)準(zhǔn)顆粒 + 通用主控 + 標(biāo)準(zhǔn)模組產(chǎn)線”這套舊模式的能力邊界。

2026年,全球也許沒有任何一款主流AI存儲產(chǎn)品能夠?qū)崿F(xiàn)供需平衡。

表面看,這是先進產(chǎn)能持續(xù)向高毛利AI產(chǎn)品傾斜,消費級市場被進一步擠壓;但更深層的問題在于,即便產(chǎn)能跟上,舊有分工模式也難以高效承接AI場景對定制化、快速迭代的需求。

存儲廠商集體越界

當(dāng)存儲真正進入計算路徑,產(chǎn)業(yè)鏈上原本清晰的角色邊界開始松動:主控廠介入系統(tǒng)定義,模組廠延伸至固件與方案優(yōu)化,各自補全過去并不屬于自己的能力版圖。

以慧榮為例,傳統(tǒng)主控的核心任務(wù),是管理閃存介質(zhì)、優(yōu)化讀寫效率,并在穩(wěn)定性、兼容性和壽命之間尋找平衡。但在AI時代,這套能力模型已經(jīng)不夠。

如今,慧榮開始反復(fù)強調(diào)一種新的能力——性能動態(tài)調(diào)節(jié)。

慧榮科技總經(jīng)理茍嘉章在與雷峰網(wǎng)交流時多次強調(diào),主控需要“根據(jù)工作負(fù)載、功耗和需求量,在動態(tài)中快速調(diào)整”。這已經(jīng)不再是傳統(tǒng)意義上的硬件參數(shù)調(diào)優(yōu),而是直接響應(yīng)英偉達(dá)新架構(gòu)中“上下文內(nèi)存存儲(Context Memory Storage)”對實時調(diào)度的需求。

KV Cache需求暴漲32倍,AI如何重寫存儲產(chǎn)業(yè)鏈的「舊分工」?| MemoryS 2026觀察

換句話說,主控正在從“閃存控制器”,演變?yōu)锳I存儲系統(tǒng)里的調(diào)度層,它不只是負(fù)責(zé)把數(shù)據(jù)寫進去、讀出來,更開始參與數(shù)據(jù)在GPU、顯存和SSD之間的流動節(jié)奏定義。

這種變化,也在推動主控廠進一步向下游延伸。

慧榮正在積極與長江存儲聯(lián)合推進車規(guī)級方案,目標(biāo)是在第三季度末至第四季度實現(xiàn)規(guī)模上量,直接供貨國內(nèi)車廠。過去賣芯片的公司,如今越來越多地以“聯(lián)合方案提供方”的身份出現(xiàn)。

這意味著主控廠的商業(yè)角色也在變化:一方面向上理解AI工作負(fù)載,把主控納入系統(tǒng)調(diào)度;另一方面向下輸出完整方案,從賣芯片走向賣系統(tǒng)能力。

未來存儲產(chǎn)業(yè)的競爭,不再只發(fā)生在顆粒、主控或模組層,而是進一步延伸到封裝架構(gòu)、異構(gòu)互連和系統(tǒng)級協(xié)同,是生態(tài)、技術(shù)、產(chǎn)能、客戶、資本的綜合戰(zhàn)爭。

端側(cè)AI反向定義存儲

AI對存儲的重構(gòu),顯然不只發(fā)生在數(shù)據(jù)中心。

另一條同樣重要的戰(zhàn)場正在端側(cè)迅速展開——AI PC、機器人、游戲掌機、智能眼鏡,乃至更多尚未被完全定義的新型終端,都在把存儲推向更核心的位置。

正如眾多廠商在峰會上提到的,物理AI/端側(cè)AI將迎來更廣泛的發(fā)展,并帶來更智能化的體驗。而這些更新更好的體驗將帶來更多的產(chǎn)品溢價,足以抵抗存儲價格上漲的壓力。 “

這句話背后,點出了端側(cè)AI最現(xiàn)實的商業(yè)邏輯:只要體驗提升足夠明顯,存儲成本就不再只是成本,而會轉(zhuǎn)化為產(chǎn)品價值的一部分。

但與數(shù)據(jù)中心不同,端側(cè)AI面臨的不是單一性能問題,而是高度碎片化的場景挑戰(zhàn)。

一臺AI PC,需要在本地運行大模型,對存儲的核心訴求是大容量 + 高速讀?。灰慌_機器人,需要在高震動、高移動性的復(fù)雜環(huán)境中持續(xù)穩(wěn)定運行,同時還要支持后期擴容;一副智能眼鏡,則把需求進一步推向極致的小尺寸、低功耗和高集成度。

可插拔、可擴容、高抗震、小尺寸、高容量——這些要求往往彼此拉扯,很難通過同一款標(biāo)準(zhǔn)化模組同時滿足。

這也是為什么,端側(cè)AI正在比數(shù)據(jù)中心更早倒逼存儲方案走向場景化重構(gòu)。

佰維給出的解法非常具有代表性。

針對機器人場景,其推出了一套 “BGA SSD + Mini SSD” 的組合方案:BGA SSD直接焊接在主板上,以更強抗震性承擔(dān)系統(tǒng)盤角色,保障操作系統(tǒng)和本地AI模型穩(wěn)定運行;Mini SSD則采用類SIM卡槽設(shè)計,支持用戶無工具插拔,作為數(shù)據(jù)盤解決嵌入式設(shè)備后期無法擴容的長期痛點。

這套方案的關(guān)鍵,并不只是形態(tài)創(chuàng)新,而是它背后的產(chǎn)品邏輯:把“穩(wěn)定”和“靈活”拆分為兩個獨立部件,并分別做到最優(yōu)。這本質(zhì)上已經(jīng)不是傳統(tǒng)意義上的“賣一塊SSD”,而是在重新定義機器人存儲架構(gòu)。

更值得關(guān)注的是,佰維的動作并未停留在單一產(chǎn)品層面。

它正在推動Mini SSD從企業(yè)級方案,進一步走向行業(yè)標(biāo)準(zhǔn)。通過聯(lián)合產(chǎn)業(yè)鏈上下游成立IP公司,并同步制定激勵機制和權(quán)益金分配規(guī)則,佰維試圖把“可插拔存儲”推進為下一代AI終端的標(biāo)準(zhǔn)能力。

其目標(biāo)場景并不局限于機器人,而是進一步覆蓋AI PC、游戲掌機等多類設(shè)備——這些終端當(dāng)前仍采用不同形態(tài)的本地存儲方案,而Mini SSD的野心,是用統(tǒng)一接口去重新組織它們。

換句話說,它爭奪的不只是產(chǎn)品份額,而是下一代端側(cè)AI設(shè)備的標(biāo)準(zhǔn)定義權(quán)。

而在這個過程中,過去那套面向PC和手機時代的標(biāo)準(zhǔn)化存儲模組,已經(jīng)越來越難承接碎片化、多形態(tài)、高迭代的終端需求。

更深層的變化在于,設(shè)備與存儲之間的關(guān)系,正在發(fā)生方向性的逆轉(zhuǎn)——過去,是設(shè)備定義存儲:設(shè)備要做什么,存儲就被動適配什么。

而現(xiàn)在,隨著本地AI能力越來越依賴容量、帶寬、功耗和形態(tài)協(xié)同,存儲開始反過來影響設(shè)備形態(tài)、產(chǎn)品定義,乃至最終用戶體驗。

下一戰(zhàn):功耗、延遲、智能

AI最大的痛點并非算力不足,而是數(shù)據(jù)在存儲與計算單元間的頻繁搬運,降低系統(tǒng)效率。如何減少數(shù)據(jù)在存儲與計算單元之間的頻繁搬運,已成為行業(yè)共同攻關(guān)的核心命題。

這句話放在一年前,可能還有點抽象。但經(jīng)過過去一年產(chǎn)業(yè)鏈上下游一連串幾乎同步發(fā)生的變化之后,它開始落到一個個極其具體的技術(shù)指標(biāo)上:KV Cache的訪問時延、Checkpoint的寫入效率、單位token成本等等。

過去十年,產(chǎn)業(yè)比拼的是單位容量的成本;下一個十年,勝負(fù)手將取決于數(shù)據(jù)在計算與存儲之間流動的效率、功耗與智能。

至于那些仍固守在舊分工里、只盯著顆粒價格波動的玩家,留給他們的時間,或許真的不多了。

雷峰網(wǎng)(公眾號:雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說