0
雷峰網(wǎng)(公眾號:雷峰網(wǎng))獨家獲悉,國內(nèi)一家專注超快流式推理芯片的創(chuàng)業(yè)公司——「寒序科技」宣布完成數(shù)千萬元融資,投資方為啟高資本、賽意產(chǎn)業(yè)基金,源合資本擔(dān)任本輪獨家財務(wù)顧問。
此前,寒序科技一直較為低調(diào),其AI推理系列(SpinPU-E Series)產(chǎn)品的相關(guān)進展在過去兩年間并未對外系統(tǒng)披露。
知情人士透露,寒序科技首顆芯片樣片回片測試結(jié)果“非常理想”,關(guān)鍵指標(biāo)中,其「單位面積帶寬」與Groq LPU(Language Process Unit,語言處理單元)披露一致,達到驚人的100 GB/s/mm^(2),這是衡量AI芯片推理性能的最重要指標(biāo),也是直指2000Tokens/s的底氣。
在業(yè)內(nèi)看來,這類能力決定了大模型(LLMs)推理時能否真正把“流式輸出”、“高Tokens/s”做出來。關(guān)鍵的是,這家公司下一代芯片已經(jīng)在流片中,以“片上MRAM+SRAM”和“確定性流式乘加單元”,目標(biāo)性能指向夸張的2000Tokens/s+,反觀目前主流對話模型推理速度僅約30-50Tokens/s。
在當(dāng)前推理芯片競爭中,這幾乎是最具辨識度的硬指標(biāo)之一。也因此,接近項目的人士將其評價為:國內(nèi)少有的、真正沿著Groq方向往下打的團隊。
值得注意的是,業(yè)內(nèi)近期普遍傳聞,NVIDIA已以約200億美元估值級別鎖定Groq的推理技術(shù)合作,并計劃在NVIDIA GTC 2026即將發(fā)布的新一代AI推理系統(tǒng)中采用Groq芯片設(shè)計。寒序方案被業(yè)界認(rèn)為是最貼近該方案的超大帶寬流式處理芯片。
與GPU路線不同,這家公司選擇的是更聚焦、更極致的產(chǎn)品定義:不卷大而全,不卷通用訓(xùn)練,而把資源壓到推理速度上,核心理念四個字——唯「快」不破。
寒序科技成立于2023年8月,源于國內(nèi)磁學(xué)研究重要高地「北京大學(xué)磁學(xué)中心」。核心團隊是國內(nèi)首個有能力跑通從物理、材料、器件到異質(zhì)集成、芯片設(shè)計、算法的交叉團隊。
有接近本輪融資的人士告訴雷峰網(wǎng),這家公司之所以近期開始對外釋放信息,一個重要背景是:其關(guān)鍵技術(shù)與樣片驗證已經(jīng)走過最危險階段。目前,該公司新一輪融資也已在推進中。
更多創(chuàng)業(yè)項目,添加微信 ydinitialheart 了解。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。