日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
企業(yè)服務(wù) 正文
發(fā)私信給胡敏
發(fā)送

0

華為發(fā)布AIDC數(shù)據(jù)基礎(chǔ)設(shè)施全棧方案,覆蓋數(shù)據(jù)湖至智能體框架五大層級

本文作者: 胡敏   2026-05-25 13:27
導語:在巴黎IDI峰會上,華為正式發(fā)布AI DC數(shù)據(jù)基礎(chǔ)設(shè)施全棧方案。

當?shù)貢r間5月21日,以“數(shù)據(jù)覺醒,存力躍遷”為主題的2026華為創(chuàng)新數(shù)據(jù)基礎(chǔ)設(shè)施論壇在巴黎舉行。會上,華為正式發(fā)布華為AIDC 數(shù)據(jù)基礎(chǔ)設(shè)施全棧方案,覆蓋數(shù)據(jù)湖、知識與記憶平臺、模型工程與資源調(diào)度、智能體框架、數(shù)據(jù)韌性平臺五大核心層級,旨在助力企業(yè)加速推進 AI 數(shù)據(jù)中心建設(shè)、實現(xiàn) AI 規(guī)?;涞?。

華為數(shù)據(jù)存儲產(chǎn)品線總裁袁遠將此次方案發(fā)布置于一個清晰的時代判斷之下:"當下,AI 正深刻改變企業(yè)運營模式。Agent 加速普及,成為新型數(shù)字生產(chǎn)力主體,逐步成長為企業(yè)的常態(tài)化'數(shù)字員工';同時,AI 應(yīng)用持續(xù)深化,企業(yè) Token 消耗量迎來爆發(fā)式增長。"

他引用的數(shù)字印證了這一判斷:目前全球活躍智能體超過 3000 萬,預(yù)計 5 年內(nèi)將達到 22 億;每分鐘 Token 處理量已從去年的 60 億增至今年的 150 億。"Token 將像空氣和水一樣,成為我們生活的基礎(chǔ)設(shè)施。"

在此背景下,袁遠指出,企業(yè)要加速 AI 落地,需推動現(xiàn)有 IT 架構(gòu)向 AI DC 數(shù)據(jù)基礎(chǔ)設(shè)施快速演進,圍繞數(shù)據(jù)湖、知識與記憶平臺、算力、模型、Agent 框架與數(shù)據(jù)韌性等核心方向開展系統(tǒng)性規(guī)劃與建設(shè)。

AI 數(shù)據(jù)湖:OceanStor Pacific + 千億級語義檢索

據(jù)雷峰網(wǎng)了解,在數(shù)據(jù)湖層,華為主推OceanStor Pacific 全閃分布式存儲,以 11 PB/2U 的業(yè)界領(lǐng)先高容量密度實現(xiàn)最優(yōu) TCO,用于海量數(shù)據(jù)的存儲與匯聚。

配合硬件的是華為DME Omni-Dataverse 統(tǒng)一數(shù)據(jù)空間,支持多模態(tài)、跨站點數(shù)據(jù)實時入湖與全局可視可管,同時具備千億千維向量數(shù)據(jù)秒級檢索能力,實現(xiàn)高質(zhì)量數(shù)據(jù)的匯聚與供給。

袁遠以某自動駕駛企業(yè)為例說明了這一能力的現(xiàn)實意義,該企業(yè)需要管理來自雷達、傳感器和環(huán)境數(shù)據(jù)超過 1000 PB 的訓練數(shù)據(jù),并在極端駕駛場景(如雨天紅燈、奔跑的行人)中快速召回特定條件下的海量圖像。"數(shù)據(jù)質(zhì)量決定模型質(zhì)量,在千億文件中找到正確的數(shù)據(jù),是訓練成功的關(guān)鍵。"

知識與記憶平臺:CMS 與"3+1"AI 數(shù)據(jù)平臺雙線并進

平臺層是華為此次方案的核心,針對不同客戶規(guī)模提供兩套差異化產(chǎn)品。

面向超大規(guī)模推理集群,華為推出業(yè)界首個支持異構(gòu)算力的上下文記憶存儲 CMS(Context Memory Storage)。CMS 支持 KV 語義直通或采用專用 DPU 進行語義卸載,可擴展為 PB 級共享 KV Cache 池,將推理首 Token 時延(TTFT)降低90%,顯著提升大規(guī)模推理集群的響應(yīng)效率。

面向企業(yè) AI 推理場景,華為首創(chuàng)"3+1" AI 數(shù)據(jù)平臺,將三類能力整合為一體:

  • 知識庫:檢索精度超過 95%,作為模型運行的前置知識底座;

  • KV Cache 加速:解決多輪推理中的冗余計算問題,大幅節(jié)約推理成本與時間;

  • 持續(xù)進化的記憶庫:讓智能體積累經(jīng)驗、越用越聰明。

三者由UCM 技術(shù)統(tǒng)一調(diào)度與管理,整體可提升推理精準性30%。

袁遠以一家金融機構(gòu)的 AI 編碼項目為例加以佐證:該項目部分任務(wù)需要多達 200 輪推理迭代,若每輪都將全量數(shù)據(jù)重新送入 GPU,既耗時又昂貴。KV Cache 的引入正是解決這一問題的關(guān)鍵。

模型工程與資源調(diào)度:ModelEngine 實現(xiàn)"一卡多用"

在模型工程層,華為ModelEngine提供模型開箱即用與模型網(wǎng)關(guān)能力,支持零代碼適配新模型、一鍵部署,大幅降低模型上線門檻。

資源調(diào)度方面,ModelEngine 結(jié)合算力資源細粒度切分與智能調(diào)度,最大可實現(xiàn)XPU 卡 1:10 切分,即一張 GPU 卡同時承載多個模型任務(wù),實現(xiàn)"一卡多用",顯著提升資源利用率、降低硬件成本。

袁遠以某大型醫(yī)院的通用 AI 平臺項目為例——該醫(yī)院同時部署超過 30 個模型,覆蓋檢測系統(tǒng)、臨床實踐和科研任務(wù),白天需要面向患者的實時推理,夜間切換為科研訓練,GPU 調(diào)度壓力極大。ModelEngine 的彈性調(diào)度能力正是針對此類場景設(shè)計。

智能體框架:Nexent 將上線周期縮短 80%

在技術(shù)棧頂層,華為ModelEngine Nexent 智能體平臺以降低開發(fā)門檻為核心設(shè)計目標:支持通過自然語言交互方式直接生成 Agent,無需專業(yè)編碼能力,使 Agent 上線周期縮短80%;同時支持對 Skill、提示詞、記憶的自動優(yōu)化,助力 Agent 持續(xù)演進、越用越聰明。

袁遠援引中國某頂級銀行的案例作為注腳:該行計劃用智能體替代全部人工客服,目標是在一個月內(nèi)上線 120 個智能體,同時保證智能體在金融合規(guī)邊界內(nèi)持續(xù)自我進化。Nexent 提供的正是從開發(fā)到部署再到演化的全流程支撐。

"如果你是醫(yī)生、金融從業(yè)者或教師,通過這套圖形化工具,你就可以自己開發(fā)智能體,"袁遠說。

數(shù)據(jù)韌性平臺:端到端四層防護

安全是華為此次方案的橫切關(guān)注點。袁遠將企業(yè) AI 落地面臨的安全威脅歸納為四類:智能體濫用(誤刪文件、篡改規(guī)則等不可預(yù)期操作)、模型投毒(惡意數(shù)據(jù)污染訓練過程)、數(shù)據(jù)篡改(修改關(guān)鍵任務(wù)的推理結(jié)果)、勒索軟件入侵(破壞數(shù)據(jù)湖完整性)。

華為的應(yīng)對方案是構(gòu)建防濫用、防投毒、防篡改、防勒索的端到端數(shù)據(jù)保護體系,針對 Agent、模型、平臺與基礎(chǔ)設(shè)施等不同維度的潛在風險,逐層部署差異化防護技術(shù)。"安全必須從一開始就嵌入每一層,而不是事后打補丁,"袁遠說。

"AI 的下半程在于數(shù)據(jù),"袁遠在演講結(jié)尾表達了華為的長期判斷,"AI 為 IT 產(chǎn)業(yè)帶來了無限機遇。華為數(shù)據(jù)存儲將堅持技術(shù)創(chuàng)新,持續(xù)沉淀 AI 行業(yè)化落地經(jīng)驗,和全產(chǎn)業(yè)共同努力,幫助客戶加速邁向智能時代。"

在他看來,算力、模型、智能體這三個 AI 發(fā)展章節(jié)已經(jīng)先后上演,而真正決定企業(yè) AI 競爭力高下的下一章,屬于數(shù)據(jù)。雷峰網(wǎng)(公眾號:雷峰網(wǎng))將持續(xù)關(guān)注華為 AI 基礎(chǔ)設(shè)施領(lǐng)域的最新進展。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說