華為發(fā)布AIDC數(shù)據(jù)基礎(chǔ)設(shè)施全棧方案，覆蓋數(shù)據(jù)湖至智能體框架五大層級

本文作者：胡敏

2026-05-25 13:27

導語：在巴黎IDI峰會上，華為正式發(fā)布AI DC數(shù)據(jù)基礎(chǔ)設(shè)施全棧方案。

當?shù)貢r間5月21日，以“數(shù)據(jù)覺醒，存力躍遷”為主題的2026華為創(chuàng)新數(shù)據(jù)基礎(chǔ)設(shè)施論壇在巴黎舉行。會上，華為正式發(fā)布華為AIDC 數(shù)據(jù)基礎(chǔ)設(shè)施全棧方案，覆蓋數(shù)據(jù)湖、知識與記憶平臺、模型工程與資源調(diào)度、智能體框架、數(shù)據(jù)韌性平臺五大核心層級，旨在助力企業(yè)加速推進 AI 數(shù)據(jù)中心建設(shè)、實現(xiàn) AI 規(guī)?；涞?。

華為數(shù)據(jù)存儲產(chǎn)品線總裁袁遠將此次方案發(fā)布置于一個清晰的時代判斷之下："當下，AI 正深刻改變企業(yè)運營模式。Agent 加速普及，成為新型數(shù)字生產(chǎn)力主體，逐步成長為企業(yè)的常態(tài)化'數(shù)字員工'；同時，AI 應(yīng)用持續(xù)深化，企業(yè) Token 消耗量迎來爆發(fā)式增長。"

他引用的數(shù)字印證了這一判斷：目前全球活躍智能體超過 3000 萬，預(yù)計 5 年內(nèi)將達到 22 億；每分鐘 Token 處理量已從去年的 60 億增至今年的 150 億。"Token 將像空氣和水一樣，成為我們生活的基礎(chǔ)設(shè)施。"

在此背景下，袁遠指出，企業(yè)要加速 AI 落地，需推動現(xiàn)有 IT 架構(gòu)向 AI DC 數(shù)據(jù)基礎(chǔ)設(shè)施快速演進，圍繞數(shù)據(jù)湖、知識與記憶平臺、算力、模型、Agent 框架與數(shù)據(jù)韌性等核心方向開展系統(tǒng)性規(guī)劃與建設(shè)。

AI 數(shù)據(jù)湖：OceanStor Pacific + 千億級語義檢索

據(jù)雷峰網(wǎng)了解，在數(shù)據(jù)湖層，華為主推OceanStor Pacific 全閃分布式存儲，以 11 PB/2U 的業(yè)界領(lǐng)先高容量密度實現(xiàn)最優(yōu) TCO，用于海量數(shù)據(jù)的存儲與匯聚。

配合硬件的是華為DME Omni-Dataverse 統(tǒng)一數(shù)據(jù)空間，支持多模態(tài)、跨站點數(shù)據(jù)實時入湖與全局可視可管，同時具備千億千維向量數(shù)據(jù)秒級檢索能力，實現(xiàn)高質(zhì)量數(shù)據(jù)的匯聚與供給。

袁遠以某自動駕駛企業(yè)為例說明了這一能力的現(xiàn)實意義，該企業(yè)需要管理來自雷達、傳感器和環(huán)境數(shù)據(jù)超過 1000 PB 的訓練數(shù)據(jù)，并在極端駕駛場景（如雨天紅燈、奔跑的行人）中快速召回特定條件下的海量圖像。"數(shù)據(jù)質(zhì)量決定模型質(zhì)量，在千億文件中找到正確的數(shù)據(jù)，是訓練成功的關(guān)鍵。"

知識與記憶平臺：CMS 與"3+1"AI 數(shù)據(jù)平臺雙線并進

平臺層是華為此次方案的核心，針對不同客戶規(guī)模提供兩套差異化產(chǎn)品。

面向超大規(guī)模推理集群，華為推出業(yè)界首個支持異構(gòu)算力的上下文記憶存儲 CMS（Context Memory Storage）。CMS 支持 KV 語義直通或采用專用 DPU 進行語義卸載，可擴展為 PB 級共享 KV Cache 池，將推理首 Token 時延（TTFT）降低90%，顯著提升大規(guī)模推理集群的響應(yīng)效率。

面向企業(yè) AI 推理場景，華為首創(chuàng)"3+1" AI 數(shù)據(jù)平臺，將三類能力整合為一體：

知識庫：檢索精度超過 95%，作為模型運行的前置知識底座；
KV Cache 加速：解決多輪推理中的冗余計算問題，大幅節(jié)約推理成本與時間；
持續(xù)進化的記憶庫：讓智能體積累經(jīng)驗、越用越聰明。

三者由UCM 技術(shù)統(tǒng)一調(diào)度與管理，整體可提升推理精準性30%。

袁遠以一家金融機構(gòu)的 AI 編碼項目為例加以佐證：該項目部分任務(wù)需要多達 200 輪推理迭代，若每輪都將全量數(shù)據(jù)重新送入 GPU，既耗時又昂貴。KV Cache 的引入正是解決這一問題的關(guān)鍵。

模型工程與資源調(diào)度：ModelEngine 實現(xiàn)"一卡多用"

在模型工程層，華為ModelEngine提供模型開箱即用與模型網(wǎng)關(guān)能力，支持零代碼適配新模型、一鍵部署，大幅降低模型上線門檻。

資源調(diào)度方面，ModelEngine 結(jié)合算力資源細粒度切分與智能調(diào)度，最大可實現(xiàn)XPU 卡 1:10 切分，即一張 GPU 卡同時承載多個模型任務(wù)，實現(xiàn)"一卡多用"，顯著提升資源利用率、降低硬件成本。

袁遠以某大型醫(yī)院的通用 AI 平臺項目為例——該醫(yī)院同時部署超過 30 個模型，覆蓋檢測系統(tǒng)、臨床實踐和科研任務(wù)，白天需要面向患者的實時推理，夜間切換為科研訓練，GPU 調(diào)度壓力極大。ModelEngine 的彈性調(diào)度能力正是針對此類場景設(shè)計。

智能體框架：Nexent 將上線周期縮短 80%

在技術(shù)棧頂層，華為ModelEngine Nexent 智能體平臺以降低開發(fā)門檻為核心設(shè)計目標：支持通過自然語言交互方式直接生成 Agent，無需專業(yè)編碼能力，使 Agent 上線周期縮短80%；同時支持對 Skill、提示詞、記憶的自動優(yōu)化，助力 Agent 持續(xù)演進、越用越聰明。

袁遠援引中國某頂級銀行的案例作為注腳：該行計劃用智能體替代全部人工客服，目標是在一個月內(nèi)上線 120 個智能體，同時保證智能體在金融合規(guī)邊界內(nèi)持續(xù)自我進化。Nexent 提供的正是從開發(fā)到部署再到演化的全流程支撐。

"如果你是醫(yī)生、金融從業(yè)者或教師，通過這套圖形化工具，你就可以自己開發(fā)智能體，"袁遠說。

數(shù)據(jù)韌性平臺：端到端四層防護

安全是華為此次方案的橫切關(guān)注點。袁遠將企業(yè) AI 落地面臨的安全威脅歸納為四類：智能體濫用（誤刪文件、篡改規(guī)則等不可預(yù)期操作）、模型投毒（惡意數(shù)據(jù)污染訓練過程）、數(shù)據(jù)篡改（修改關(guān)鍵任務(wù)的推理結(jié)果）、勒索軟件入侵（破壞數(shù)據(jù)湖完整性）。

華為的應(yīng)對方案是構(gòu)建防濫用、防投毒、防篡改、防勒索的端到端數(shù)據(jù)保護體系，針對 Agent、模型、平臺與基礎(chǔ)設(shè)施等不同維度的潛在風險，逐層部署差異化防護技術(shù)。"安全必須從一開始就嵌入每一層，而不是事后打補丁，"袁遠說。

"AI 的下半程在于數(shù)據(jù)，"袁遠在演講結(jié)尾表達了華為的長期判斷，"AI 為 IT 產(chǎn)業(yè)帶來了無限機遇。華為數(shù)據(jù)存儲將堅持技術(shù)創(chuàng)新，持續(xù)沉淀 AI 行業(yè)化落地經(jīng)驗，和全產(chǎn)業(yè)共同努力，幫助客戶加速邁向智能時代。"

在他看來，算力、模型、智能體這三個 AI 發(fā)展章節(jié)已經(jīng)先后上演，而真正決定企業(yè) AI 競爭力高下的下一章，屬于數(shù)據(jù)。雷峰網(wǎng)(公眾號：雷峰網(wǎng))將持續(xù)關(guān)注華為 AI 基礎(chǔ)設(shè)施領(lǐng)域的最新進展。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

胡敏

主筆

關(guān)注云計算、企服，歡迎找我爆料。微信：mindy1857，加好友請備注公司、姓名及來意

掃描關(guān)注作者微信

發(fā)私信

當月熱門文章