日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

本文作者: 包永剛   2025-12-26 17:30
導語:算力密度提升50%,效能提升10倍,花港架構如何實現(xiàn)?

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

作者|包永剛

編輯|林覺民

仲冬的北京略帶寒意,但摩爾線程首屆開發(fā)者大會(MDC)會場內熱度十足。1000平方米的展區(qū)匯聚了上千位開發(fā)者,他們關注智能機器人、數(shù)字人、Agent等前沿技術,也在探討AI for Science、氣象預測等尖端應用。

展區(qū)中央的數(shù)字文娛與視頻多媒體區(qū)最為引人注目:有人沉浸在eVTOL全動飛行模擬器的操控體驗中,也有人在國產GPU驅動的經典拳皇和3A大作的游戲世界里激戰(zhàn)。“國內能展示街霸游戲的,目前可能只有我們?!币晃还こ處燑c出了摩爾線程在一眾AI算力卡中,同時具備圖形能力的稀缺性。

如果只是通過文字或視頻了解摩爾線程這家國內為數(shù)不多做全功能GPU的公司,可能只是一個模糊概念。身處展區(qū),一次性展示十個 GPU 的應用案例,足以讓人理解 GPU 的一部分價值;而當近百個應用同時鋪開時,帶來的則是雙重沖擊——一方面是對全功能 GPU 能力邊界的直觀感知,另一方面,這些應用案例全部來自一家僅成立五年的國產 GPU 公司。

摩爾線程將全功能GPU的能力轉化為覆蓋從消費到垂直行業(yè)、從圖形到AI再到高性能計算的廣泛應用,這不僅是其獨特價值的具象化呈現(xiàn),也讓人切實感受到全功能GPU的“奧義”所在。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

中國工程院院士、清華大學教授鄭緯民

正如中國工程院院士、清華大學教授鄭緯民所言:“做GPU必須同時支持三個特性:完整的圖形流水線、張量計算核心以支持AI,以及高精度浮點單元滿足高性能計算?!?/p>

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

摩爾線程創(chuàng)始人、董事長兼CEO張建中

摩爾線程創(chuàng)始人、董事長兼CEO張建中指出:“全功能GPU內置多種計算引擎,涵蓋AI計算、3D圖形渲染、物理仿真與科學計算,以及超高清視頻編解碼?!币簿褪钦f,“AI+3D圖形+高性能計算”,摩爾線程在一顆芯片上同時做到了。

在首屆開發(fā)者大會上,摩爾線程發(fā)布了新一代全功能GPU架構花港,以及基于花港的AI訓推一體芯片華山、專業(yè)圖形圖像計算芯片廬山、全新的AI SoC長江,以及升級的MUSA 5.0軟件棧和AI BOOK。

顯然,在摩爾線程的藍圖里,全功能GPU應用的寬度不僅滿足傳統(tǒng)應用的需求,更能捕捉AI浪潮中的各類機會,將創(chuàng)新潛力轉化為可觸達的現(xiàn)實價值。

近百個應用案例,讓國產全功能GPU獨特性更「具像化」

在1000平方米的展區(qū)里,最容易被感知的,是圖形能力。無論是《拳皇》這樣的經典游戲,還是賽車、射擊等高負載場景,GPU始終是玩家體驗的核心。自2022年11月發(fā)布消費級顯卡MTT S80起,摩爾線程幾乎每30天更新一次驅動,已實現(xiàn)對China Top 50熱門游戲的100%兼容,并對其中44款完成專項優(yōu)化。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

在視頻與專業(yè)渲染場景中,GPU圖形能力的價值被進一步放大。摩爾線程的端側實時視頻超分技術MTVSR,可實現(xiàn)2–4倍實時超分效果,同時降低視頻存儲和傳輸成本。在行業(yè)級場景中,基于摩爾線程MTT X300的國產視景系統(tǒng)——微視威eVTOL全動飛行模擬器,已通過中國民航局5級鑒定,首次打通全國產化視景渲染鏈路。

當全功能GPU的圖形渲染與AI能力被同時調用,應用向更復雜的醫(yī)療、教育和工業(yè)場景延伸。智慧醫(yī)療領域,錦瑟醫(yī)療的篝火云平臺基于MTT S4000,將AI推理、三維重建與高性能渲染整合在同一平臺,將二維醫(yī)學影像實時轉化為三維模型,通過XR設備呈現(xiàn)給醫(yī)生,成為手術過程中的“第三只眼”。

火熱的智算場景中,摩爾線程通過KUAE集群的零中斷容錯方案,實現(xiàn)大規(guī)模訓練全程不中斷;在推理側,與硅基流動對MTT S5000進行深度優(yōu)化,在DeepSeek 671B全量模型的實際推理中,MTT S5000單卡Prefill吞吐突破4000 tokens/s,Decode吞吐突破1000 tokens/s,樹立國產推理在低延遲和高吞吐的新標桿。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

熱門的具身智能賽道,景業(yè)智能的VR遙操作機器人系統(tǒng)已與MTT E300 AI模組適配,并與MTT S80協(xié)同工作。操作者通過VR眼鏡,即可在高風險環(huán)境中完成精細作業(yè),讓“人以遙操、機器代勞”成為現(xiàn)實。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

在更廣闊的AI推理市場中,天思智慧、聯(lián)達興、全愛科技、紫光計算機等合作伙伴基于摩爾線程全功能GPU推出多款AI Box,將算力延伸至具身智能、Agent、制造、辦公、交通、教育和醫(yī)療等場景。

科學計算同樣是全功能GPU優(yōu)勢的重要展示。摩爾線程聯(lián)合北京大學高毅勤課題組,基于國產SPONGE和DSDP軟件,打造軟硬件協(xié)同的生命科學解決方案;硒鉬科技的AI for Science(AI4S)平臺也已完成對MTT S4000適配。在CAD、工業(yè)設計與專業(yè)可視化領域,基于MTT S50與X300的國產工作站方案正逐步投入使用。

展區(qū)集中呈現(xiàn)的近百個合作應用案例涵蓋圖形渲染、智能視頻、AI計算與高性能計算,跨越云端與端側,覆蓋游戲、醫(yī)療、具身智能及AI4S等方向。

這些案例并非零散羅列,而反復印證同一事實:同一架構下不同型號的全功能GPU可同時承擔圖形、AI與計算任務,其應用廣度相較傳統(tǒng)GPGPU呈現(xiàn)出明顯量級差異。

摩爾線程能在短短五年就能展現(xiàn)出如此多的應用,關鍵在于其一路狂奔。

下一代花港架構亮相,華山和廬山新品解開性能束縛

摩爾線程自成立之初便選擇全功能GPU路線,自2022年量產第一代架構蘇堤以來,以一年一代的速度快速迭代。2023年發(fā)布春曉架構,2024年量產曲院架構,2025年量產平湖架構。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

每代架構都推出滿足不同市場需求的產品:蘇堤架構的S10滿足信創(chuàng)PC GPU國產化需求;春曉架構的S80和S3000,前者為國內游戲玩家首款國產消費級顯卡,后者滿足云桌面需求;曲院架構S4000為首個訓推一體AI集成卡,在2024年組建千卡集群;平湖架構S5000構建萬卡集群,支撐萬億參數(shù)大模型訓練。

2026年,摩爾線程將推出基于全新指令集的下一代架構——花港。張建中表示:“在國產工藝發(fā)展相對緩慢時,我們必須尋找更多方法提升算力密度。通過全新指令集,將算力密度提升50%,并通過精心打磨架構,將效能提升10倍。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

為了實現(xiàn)巨大提升,花港架構進行多項優(yōu)化:

  • 計算精度優(yōu)化:全精度端到端技術,并特別優(yōu)化FP8、FP6、FP4低精度單元以提升能效;

  • 擴展能力增強:支持十萬卡以上計算集群,異步編程模型充分發(fā)揮每個算力單元性能,提高整體利用率;

  • 圖形渲染升級:流水線重新改組,搭建新一代AI生成式渲染架構(AGR),渲染能力進一步提升;第二代光線追蹤加速引擎速度較上一代提升5-6倍,完整支持DirectX 12 Ultimate;

  • 安全性加強:提供四層安全防護,從安全域、信任域、保護域到功能域,全方位守護信息安全。

基于花港架構,摩爾線程推出兩款新品:AI訓推一體芯片華山和專業(yè)圖形圖像計算芯片廬山,為國產芯片性能打開新上限。

華山是一款高性能AI推理與訓練芯片,浮點計算性能位于業(yè)界最領先的兩款GPU之間,訪存帶寬和高速互聯(lián)同時提升,結合異步編程技術,實現(xiàn)高效線程同步、線程束特化和常駐核函數(shù),綜合性能極具競爭力。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

華山在眾多特性中有兩個尤為突出,一個是新一代TensorCore不僅支持從FP4到FP64的全精度計算,同時對FP8、FP6和FP4等低精度單元進行了優(yōu)化,這是業(yè)界發(fā)展的方向。

還有開放支持多種類的以太協(xié)議的特性。張建中表示,Scale-Up時,如果摩爾線程堅持自己的MTLink路線,很多用戶無法使用其他的Switch,所以華山不僅支持MTLink 4.0,還支持許多國內合作伙伴的以太網協(xié)議,充分兼容不同的硬件生態(tài)。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

得益于新一代Scale-up系統(tǒng),目前華山的能力能夠實現(xiàn)1024個GPU的超節(jié)點。在此次開發(fā)者大會上,摩爾線程發(fā)布了MTT C256超節(jié)點的架構規(guī)劃。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

廬山作為花港架構專業(yè)圖形計算產品,相比S80,游戲性能提升15倍,AI計算性能提升64倍,幾何處理提升16倍,光線追蹤提升50倍,顯著增強紋理填充、原子訪存能力及顯存容量。3A游戲、CAD、CAE等場景均可勝任。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

無論華山還是廬山,在花港架構支撐下性能大幅躍升,解開國產芯片性能束縛。這既得益于摩爾線程在全功能GPU路線上的持續(xù)迭代,也源于其技術和專利積累,截至2025年6月30日,公司累計授權專利514項,其中發(fā)明專利468項。

要充分釋放花港架構潛力,MUSA和開發(fā)者成為關鍵。

開放的MUSA生態(tài),摩爾線程千億價值的基石

MUSA(Meta-computing Unified System Architecture)是摩爾線程自主研發(fā)的元計算統(tǒng)一系統(tǒng)架構,覆蓋從芯片架構、指令集、編程模型到軟件運行庫及驅動程序框架等的全棧技術體系。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

鄭緯民院士說,“過去是全球分工,現(xiàn)在講主權AI。決定主權AI成敗的關鍵,在于是否有足夠多的開發(fā)者愿意長期在這套棧上寫代碼。開發(fā)者是生態(tài)的核心,不是廠家,廠家需要與開發(fā)者一塊努力把生態(tài)做好?!?/p>

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

如何才能把生態(tài)做好?北京智源人工智能研究院AI框架研發(fā)負責人敖玉龍說:“包容和兼容,包容意味著涵蓋多條技術路線;兼容意味著不必打造完全不同的生態(tài)。”

摩爾線程正是以此為思路構建MUSA生態(tài)。摩爾線程聯(lián)合創(chuàng)始人、首席技術官張鈺勃說,“MUSA軟件棧在編程模型、方式和加速庫功能上與國際主流高度一致,最大限度降低開發(fā)者學習成本。但這樣難以追趕國際主流,怎樣才能突破?

“有兩個思路,一個是通過更高級抽象的DSL領域專業(yè)編程語言,將底層創(chuàng)新精確發(fā)揮;另一個是與開發(fā)者深度融合,實現(xiàn)軟硬件協(xié)同設計1+1>2的效果?!睆堚暡M一步表示。

沿著這個思路 ,MUSA 5.0在全棧統(tǒng)一性、極致效能和生態(tài)開放性上取得關鍵突破:

  • 編程生態(tài)升級:原生MUSA C,深度兼容 TileLang、Triton 等編程語言,為開發(fā)者提供靈活高效的全棧開發(fā)體驗。

  • 計算效能優(yōu)化:核心計算庫muDNN實現(xiàn)GEMM/FlashAttention效率超98%,通信效率達97%,編譯器性能提升3倍,并集成高性能算子庫,顯著加速訓練與推理全流程。

  • 開源生態(tài)擴大:計劃逐步開源計算加速庫、通信庫及系統(tǒng)管理框架在內的核心組件,向開發(fā)者社區(qū)開放深度優(yōu)化的底層能力。

  • 前沿特性拓展:即將推出兼容跨代GPU指令架構的中間語言MTX、面向渲染+AI融合計算的編程語言muLang、量子計算融合框架MUSA-Q,以及計算光刻庫muLitho,持續(xù)拓展全功能GPU的算力邊界。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

MUSA 5.0作為連接開發(fā)者和摩爾線程最重要的橋梁,也需好用的開發(fā)平臺。

為此,摩爾推出了搭載長江智能SoC的AIBOOK。新一代長江AI SoC集成CPU、GPU、NPU、VPU、DPU、DSP、ISP等單元,提供高達50TOPS端側AI算力,內置1TB SSD、32G/64G高速存儲,預裝Linux內核AIOS系統(tǒng)及各種開發(fā)工具,支持主流操作系統(tǒng),實現(xiàn)真正的“開箱即用”,成為開發(fā)者在AI時代的超級個體。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

此外,基于長江SoC的迷你型計算設備MTT AICube也將推出,為開發(fā)者提供更多選擇。摩爾線程還將推出面向前沿領域的完整方案,如端云一體化具身智能方案MT Robot,幫助開發(fā)者縮短產品上市周期。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

目前,摩爾學院用戶總量已經達到了20萬,這是階段性成就,摩爾線程的目標是擁有百萬級的MUSA開發(fā)者。

首屆開發(fā)者大會,讓摩爾線程全功能GPU的獨特優(yōu)勢更「具像化」

這并非空想,全功能GPU已經決定了摩爾線程能夠探索的應用,包括圖形渲染、AI與高性能計算,而MUSA生態(tài)的繁榮程度,則決定了在各個市場的應用厚度和不可替代性。廣度與厚度的乘積,正是支撐摩爾線程千億價值的基石。

從首屆開發(fā)者大會的近百個應用案例,到MUSA生態(tài)與花港架構的落地,摩爾線程正以完整技術體系和開放生態(tài),將潛力轉化為切實價值。雷峰網(公眾號:雷峰網)

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

分享:
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說