0
| 本文作者: 徐咪 | 2025-07-30 11:38 |
Rock是石頭,石頭是這個世界最基本的組成元素,堅硬、基礎、隨處可見。
RockAI希望成為智能世界的石頭。
01
離線智能
據AI科技評論了解,在發(fā)布的18個月里,已經有量產設備搭載了Yan的大模型能力,這讓這個以非Transformer路線著稱的大模型建設者,一躍成為端側智能中不可忽視的重要玩家。
如果打開官網,你第一眼就會看見醒目的一行大字,那是它給自己定義的使命:“讓世界上每一臺設備擁有自己的智能”。RockAI聯(lián)合創(chuàng)始人鄒佳思對AI科技評論說,這句話里其實有兩個關鍵詞,“每一臺設備”和“自己的”。
前者意味著一個更高兼容能力、成本更友好、能力更普惠的設備,而后者則意味著一個擁有自主進化能力、不斷生長的、可以廣泛交互協(xié)作智能終端。
這不僅意味著RockAI在走一條非Transformer的智能岔路,也在走一條并不激進推高智能上限的技術小徑。
但鄒佳思不同意這是一條小徑。
“端側是一個龐大的市場”,他說,“這是世界上絕大部分人都需要的智能”。這不僅是因為,這是一個發(fā)展中國家人口主導的世界,它意味著也是因為人與智能的關系是需要體面的。
這種體面的方式之一就是離線的智能體。離線是端側的潛臺詞,這意味著它只屬于用戶本人,不會將用戶的數據上傳到某個龐大冰冷轟鳴又陌生的服務器里,而只躺在用戶最熟悉的被卡通硅膠殼包裹的手機里,拉絲金屬制成的電腦里。
端側很難,離線很難,但只端側離線又是不夠的。
小路也是路,是路就必須走。
鄒佳思說,從1.3發(fā)布以來,干的最多的一件事情:踩坑。踩技術的坑,踩場景的坑——Yan落地量產設備量是這么來的,Yan 2.0 Preview也是這么來的。
自從1.3發(fā)布以來,不斷有人問:2.0什么時候來?為什么還不來?如果來了,會長什么樣?
RockAI選擇在WAIC交出一個初步的答案:
Yan 2.0 Preview。
這符合RockAI一貫以來的謙遜,Yan 2.0 Preview是這家公司的第四代產品,在此之前是1.0、1.2、1.3。他們拒絕像Transformer社區(qū)等科技世界常見的那樣,將性能提升作為每一代產品的差異。
然而,這其實是RockAI目前最接近自己使命的一個產品。鄒佳思對AI科技評論說,Yan 2.0 Preview有兩個提升。
一個是視覺感知能力的躍升。
他們針對視頻模態(tài)進行稀疏取幀,降低視覺信息的時序冗余,再通過視覺編碼器對選取的視頻幀進行逐幀編碼,生成視覺Token。采用Token Merge(ToME)的策略來降低視覺Token之間的語義冗余,進而減少視覺Token的序列長度。
鄒佳思表示,這讓Yan 2.0 Preview可以擁有比1.3更加連貫的視頻理解能力,“過去只是看圖,而現在真的能看視頻了”。
但更加重磅的是基于訓推同步的自主學習能力。
RockAI通過可微的記憶模塊來實現信息的存儲、檢索和遺忘。在這種架構下,記憶可以不斷更新。尤其是通過創(chuàng)新機制實現了記憶強度的動態(tài)調節(jié):既能通過門控式更新保留長期依賴,又能基于輸入分布特性靈活整合新知識。這讓Yan 2.0 Preview可以像生物大腦一樣,不斷忘記不重要的事情,留下重要的。
過去,訓推同步往往是與大模型一體機相伴相生的,但RockAI決定將訓推同步的概念下放到個人的端側設備上。這種嘗試,在外界看來,或許顯得有些瘋狂——因為這個概念之前沒人做,也沒被太多應用端從業(yè)者認真思考過,所以即便將產品做出來,它將如何被應用也是個待明確的問題。
據鄒佳思透露,RockAI在和一些玩具公司做初步的探索。比如和一些國際頭部玩具公司探討能夠自主學習的AI玩具,孩子可以對自己的玩具說話、下指令,而玩具會自己學習成長,從而成為屬于孩子自己的獨一無二的精神伴侶。
“我們把Preview版本放出來,也是希望看到更多上下游的需求”,鄒佳思說,“我們絕對相信它有廣闊的應用空間?!倍皬V闊的空間”,意味著它絕對不僅僅只在玩具場景得到使用。
如果說1.0是文本模型,1.3是具有圖片與音頻能力的多模態(tài)能力,那么2.0將成為一個能看懂視頻、能自主學習、實現實時人機交互的全新智能底座。
02
場景、場景,還是場景
“踩技術的坑”,只是RockAI過去一年兩大“年度工作總結”中的一個。而比技術的坑更大的,則是“場景的坑”。
場景很難,鄒佳思對AI科技評論說,演示和落地之間存在鴻溝,量產化落地難上加難。
假如說,Yan1.2部署在樹莓派可以算得上一個寫在公司手冊里的里程碑事件。那么Yan1.3發(fā)布后,公司拿到了出海頭部硬件公司的訂單,則又算得上是業(yè)務里程的一大步。
鄒佳思至今都記得,當合作伙伴把搭載著Yan1.3能力的PC拿給海外經銷商的時候,合作伙伴的震動與興奮。甚至一些實力雄厚的“巨頭”友商代表,都專門到展臺前面詢問離線端側功能是怎么實現的。
斷網其實是一件比很多人想象得更重要的事情。
“離線端側大模型在海外的需求是非常旺盛的”,鄒佳思對AI科技評論表示,只是其中很多需求還沒有獲得最佳的解決方案。
首先,對于出海的硬件企業(yè)來說,海外關于信息安全的政策環(huán)境是很多樣的。端側可以規(guī)避大量信息傳輸、上云帶來的政策風險與合規(guī)成本。
“海外對隱私的話題是非常敏感的”,鄒佳思表示,“不同國家對個人信息保護的法律和審查都是不同的,如果要上傳數據,便意味著主機廠需要去層層過關每一個國家的法律和監(jiān)管體系?!?/p>
更不用說海外復雜的網絡環(huán)境。
目前全球主要人口都是生活在第三世界國家,其中生活在農村的人口又遠多于城市的人口。一份國際電信聯(lián)盟2022年的調查數據顯示,歐洲和北美國家,80%至90%的人口使用互聯(lián)網,而在阿拉伯國家和亞太國家這個數字降低至三分之二。而在非洲,互聯(lián)網人口的比例則進一步降低至40%,而最不發(fā)達國家和內陸發(fā)展中國家的互聯(lián)網覆蓋率僅為36%。城鄉(xiāng)差異也是如此,根據上述報告,即便在資源集中的城市,全球只有82%的城市居民可以在家上網,但這一比例竟然是農村的1.8倍。
而這份報告中涉及的只是網絡覆蓋率,尚沒有涉及更加復雜的網絡質量和網絡資費等問題。
RockAI的愿景是“每一臺設備”,不是“每一臺歐美設備”或者“每一臺中國設備”,也不是“每一臺城市設備”,而是不加定語的“每一臺設備”。
“很多設備連NPU、甚至GPU都沒有,只有CPU,你要如何把大模型放進去?目前只有RockAI能做到?!编u佳思表示。
從某種程度上來說,未來一些海外用戶接觸的第一個AI大模型產品,或許就會是Yan。
這也大概也是Yan 2.0 Preview合作伙伴的經銷商們,會對一個AIPC產品驚訝的原因之一。
“他們沒見過這種產品”,鄒佳思說,“不用網絡,直接就能在中低端CPU級設備上跑的AI產品,他們沒見過?!?/p>

為了量產項目,RockAI投入了很多的資源,或許這不能叫投入,而是一場技術投資,這可能源于RockAI一種另辟蹊徑的市場哲學:
“標桿戰(zhàn)略”。
RockAI一直都被認為是一個不喜歡跟隨BenchMark的公司?!拔覀儠y一些榜單,但不會打榜”,鄒佳思說,公司并不是完全排斥榜單,只是對一些榜單的價值和意義確實有過一些懷疑。但未來團隊會做去選擇一些嚴肅的榜單參與,讓外界更直觀看到YAN的成果。
可即便如此,“也不會將重點放在這里”,鄒佳思表示,因為RockAI是一個著重場景落地的團隊,因此公司的業(yè)務邏輯是做“標桿”。
“就像ARM與德州儀器、諾基亞的關系——德州儀器把那時名不見經傳的ARM推薦給了諾基亞,說希望在小型機上試一試。ARM花了很大的力氣去說服諾基亞,最后諾基亞高管點頭了,于是成就了諾基亞當年的手機霸主地位,也成就了今天的ARM。”鄒佳思說。
RockAI或許沒有奢望一個像諾基亞那樣性感的貴人,鄒佳思對標桿的期待就是一個跑通的、大家都能看見的、能被交付到用戶手里的場景。
團隊對潛在的標桿很重視。鄒佳思回憶自己之所以能拿下頭部公司的端側設備訂單,部分因為他們是唯一帶了真實樣機去客戶公司展示的團隊。
“一個見面前2周臨時買的酷睿i5的小盒子,麥克風和顯示器都是現場接的,折騰了十多分鐘”,鄒佳思說那個場景至今在他腦海里,“其實現場挺亂的”,他說,“但是其他廠家都帶著PPT,只有我們帶了真機樣品直接開始演示?!眻F隊甚至沒有來得及好好介紹自己,對方已經有合作的意向了,緩過神來才問:
“你們公司啥時候成立的?”
雖然RockAI是這家頭部公司接觸最晚的,卻是最終拿下合作的。于是才有了開頭,那些激動的海外經銷商和刺探情報的巨頭友商。
榜單可能可以刷分,但用戶是誠實的,商業(yè)訂單也是。設備量產是RockAI的起點,也是YAN生態(tài)的一個起點。
03
留在牌桌上
沒有人會懷疑,RockAI是在跟巨人作戰(zhàn)。就像大衛(wèi)面對歌利亞,當年手里也拿著這么幾塊石頭。大衛(wèi)用甩石機,讓石頭在手中形成一個小而有力的“飛輪”。
當然,YAN與Transformer社區(qū)之間并不是你死我活的關系,它們更像是一條河與大海的潮水競速。
但對于一個閉源為主的大模型生態(tài),節(jié)奏是很關鍵的。因為它既要做底座,也要做應用;既要做上層交互,又要做底層適配。要在技術與場景之間反復“踩坑”。
鄒佳思說,RockAI在過去一年時間里,團隊已經擴張到了近一百人,絕大部分都是研發(fā)。
對于一個商業(yè)公司來說,所謂節(jié)奏的含義,無非就是,哪些快,哪些慢;哪些抓緊,哪些放棄。
鄒佳思不愿意將自己稱為“閉源”大模型,他說RockAI會有自己的開源節(jié)奏,有些可能暫時沒那么快披露,但他們已經對部分核心合作伙伴開源。比如芯片廠商,共享代碼會大幅降低YAN落地的磨合成本。
有些事情RockAI是確實暫緩不做的,比如“生圖”。鄒佳思認為,設備端的主體訴求在感知、決策和行動這三個方面。
“就跟人一樣”,鄒佳思說,“人腦也不會直接輸出圖像,而只是轉而使用工具,YAN其實也一樣?!?/p>
而有些更遠景的事情,暫不落地但卻是行業(yè)趨勢,鄒佳思給RockAI的要求,則是要“留在牌桌上”。
在鄒佳思看來,機器人就是一個場景在未來,但YAN要爭取“留在牌桌上”的賽道。鄒佳思認為,Yan天然是可以探索去跟機器人結合的架構。因為Yan不做生成,主要做以感知和認知為主的多模態(tài)能力。而在實驗中,RockAI發(fā)現,以Yan為主的架構已經能實現部分軌跡復刻的能力了。
“我們這次在展臺上放了一個靈巧手,可以玩游戲”,鄒佳思說,“也有機器狗可以學習人的動作?!?/p>
在RockAI的構想里,它將成為一個橫跨上至無人機,下至機器人機器人、大到手機電腦這樣的核心消費算力設備、小到智能眼鏡、陪伴玩具等探索型低算力設備,每一臺設備都成為
Yan的算力網絡中的一部分,共同構成“群體智能”的未來世界途徑——
誰說小石頭不能成高山呢?雷峰網雷峰網(公眾號:雷峰網)
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。