日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給董子博
發(fā)送

0

上線兩天登頂全球榜單,階躍星辰怎么讓 AI 又「聰明」又「快」?

本文作者: 董子博   2026-02-05 23:00
導(dǎo)語(yǔ):AGI?的路怎么走?階躍星辰的答案是“以巧見(jiàn)大,唯快不破”。

就在昨天,階躍星辰登頂了全球模型榜單——他們最新開(kāi)源的 Agent 基座模型 Step 3.5 Flash,發(fā)布首日便登上全球模型平臺(tái)OpenRouter 的 “最快模型榜”,而發(fā)布后僅用短短兩天,就獲得了OpenRouter“熱度趨勢(shì)榜”排名第一的好成績(jī),其數(shù)據(jù)是基于全球開(kāi)發(fā)者與用戶的實(shí)際模型調(diào)用量。也就是說(shuō),Step 3.5 Flash以硬實(shí)力贏得了用戶的“用腳投票”。

上線兩天登頂全球榜單,階躍星辰怎么讓 AI 又「聰明」又「快」?


(圖為Step 3.5 Flash 登頂 OpenRouter 的Trending 榜單)

對(duì)階躍來(lái)說(shuō),拿下榜單第一并不新鮮,而這個(gè)成績(jī)有意思的地方在于,它點(diǎn)破了當(dāng)前AI應(yīng)用深化的一個(gè)普遍瓶頸:模型越來(lái)越“聰明”,能處理的任務(wù)越來(lái)越復(fù)雜,但用戶和開(kāi)發(fā)者在真實(shí)使用時(shí),最直接的感官體驗(yàn)卻是——“慢”。

這里的“慢”,不是指回答一句“你好”的速度,而是當(dāng)用戶任務(wù)變得復(fù)雜,任務(wù)鏈和工作流明顯變長(zhǎng)(比如分析整篇財(cái)報(bào)、編寫(xiě)復(fù)雜函數(shù)、或同時(shí)完成圖文音視頻多模態(tài)輸出等等)時(shí),AI的處理速度必然下降,用戶的等待時(shí)間可能會(huì)被拖得很長(zhǎng)。

漫長(zhǎng)的等待——本身就嚴(yán)重限制了 AI 在實(shí)際工作流中的可用性;而如果等了半天,AI 拿出的結(jié)果還不能令人滿意,用戶的流失就已成定局。

而過(guò)去外界的一貫認(rèn)知中,“快”=小參數(shù)模型的敏捷調(diào)用、輸出;“慢”=更大參數(shù)量級(jí)的模型和細(xì)致的思考。此前,模型要的是“快”和“好”的平衡,而今天,階躍的Step 3.5 Flash 卻敢于對(duì)世界說(shuō):“我全都要!”



稀疏 MoE 架構(gòu):不要“大而全”,我要“以巧見(jiàn)大”

論速度,Step 3.5 Flash 有多快?

在復(fù)雜推理場(chǎng)景下,保證穩(wěn)定性的同時(shí),Step 3.5 Flash 在 NVDIA Hopper GPU 的最高推理速度可以達(dá)到每秒 350 個(gè) Token,實(shí)現(xiàn)“點(diǎn)擊即輸出”的秒速體驗(yàn)。

榜單上,Step 3.5 Flash 以每秒 167 個(gè) Token 的速度排名第九,但排在它前面的,多是在為專有硬件環(huán)境定制的模型和 8b-120b 規(guī)模不等的小型模型。

上線兩天登頂全球榜單,階躍星辰怎么讓 AI 又「聰明」又「快」?

(圖為 Step 3.5 Flash 在 OpenRouter 的 Fastest 榜位居前列)

而 Step 3.5 Flash 的參數(shù)量是 1960 億,足以作為基座模型為 Agent 提供強(qiáng)勁的動(dòng)力。

上線兩天登頂全球榜單,階躍星辰怎么讓 AI 又「聰明」又「快」?

(Reddit平臺(tái)用戶評(píng)價(jià):終于有東西能在我那只有120GB顯存的破電腦上運(yùn)行了)

跑分測(cè)試上,Step 3.5 Flash 一馬當(dāng)先,并且尤其擅長(zhǎng) Agent 場(chǎng)景和數(shù)學(xué)任務(wù)。在 τ2-Bench、BrowseComp 等測(cè)試,以及 LiveCodeBench V6 代碼挑戰(zhàn)和 AIME 2025 數(shù)學(xué)競(jìng)賽中,Step 3.5 Flash 都拿出了不錯(cuò)的成績(jī)。

上線兩天登頂全球榜單,階躍星辰怎么讓 AI 又「聰明」又「快」?

圖注:Step 3.5 Flash 僅憑 11B 激活參數(shù)(總規(guī)模 196B MoE)便達(dá)到了頂尖級(jí)別的智能水平,足以媲美領(lǐng)先的閉源及開(kāi)源模型(數(shù)據(jù)來(lái)源:階躍星辰官方Tech Report)

實(shí)踐上,Step 3.5 Flash 還在多步推理的結(jié)構(gòu)化輸出、復(fù)雜邏輯求解、后端自動(dòng)化和長(zhǎng)時(shí)間運(yùn)行任務(wù)中,已經(jīng)具備了企業(yè)級(jí)應(yīng)用落地的能力。而針對(duì)高頻工具調(diào)用和對(duì)行為可預(yù)測(cè)性有強(qiáng)要求的系統(tǒng)環(huán)境,Step 3.5 Flash 也能輕松駕馭。

“快”很容易,“強(qiáng)”也很容易。要理解 Step 3.5 Flash 為何能做到又快又強(qiáng),首先要了解的,是它采用的“稀疏混合專家(MoE)架構(gòu)”——這是一個(gè)在追求“超大模型”時(shí)代里,回歸工程理性的設(shè)計(jì)。

傳統(tǒng)的千億參數(shù)大模型像一個(gè)“全能巨人”,處理任何問(wèn)題,無(wú)論難易,都要?jiǎng)佑萌磕X力(激活所有參數(shù))。

每一次都“全力出擊”,這固然能保證能力,但計(jì)算成本極高的同時(shí),也讓推理緩慢、能耗巨大,算力的浪費(fèi)也同樣不可避免。

Step 3.5 Flash 的思路則不同。

作為一個(gè)總參數(shù)量1960億的Agent 原生基座模型,它被精巧地組織成了許多個(gè)“專家小組”。當(dāng)一個(gè)問(wèn)題輸入時(shí),一個(gè)智能的路由機(jī)制會(huì)迅速判斷:“這個(gè)問(wèn)題主要由哪幾個(gè)專家小組來(lái)處理最合適?”然后,只激活這些相關(guān)的“專家”——大約110億參數(shù)——來(lái)工作。

上線兩天登頂全球榜單,階躍星辰怎么讓 AI 又「聰明」又「快」?

(海外用戶評(píng)價(jià):它僅使用11b的活躍參數(shù),所以運(yùn)行速度極快。老實(shí)說(shuō),我對(duì)它毫無(wú)延遲的運(yùn)行表現(xiàn)著迷。)

你可以把它想象成一個(gè)高度專業(yè)化的超級(jí)顧問(wèn)團(tuán)。接到一個(gè)金融分析任務(wù),系統(tǒng)不會(huì)喚醒團(tuán)里的醫(yī)學(xué)專家或文學(xué)教授,而是精準(zhǔn)地調(diào)度金融、數(shù)據(jù)分析、邏輯推理這幾個(gè)小組來(lái)協(xié)同工作。

這種設(shè)計(jì),既能讓每次推理實(shí)際消耗的計(jì)算資源大幅減少,提升了計(jì)算速度,成本也隨之下降;又能背靠“顧問(wèn)團(tuán)”1960 億參數(shù)的“總知識(shí)庫(kù)”,在需要處理復(fù)雜、跨界問(wèn)題時(shí),依然有能力調(diào)動(dòng)不同領(lǐng)域的“專家”進(jìn)行深度協(xié)作,讓輸出保質(zhì)保量。

憑借著更聰明的調(diào)用,Step 3.5 Flash 采用的稀疏 MoE 架構(gòu),打破了“大模型”必須“力大磚飛”的固有印象,讓 AI 的能力和速度,成為了可以兼得的“魚(yú)與熊掌”。


不只是“跑得快”,更是“想得流暢”

光是有了更高效的架構(gòu)還不夠,Step 3.5 Flash 在具體工程實(shí)現(xiàn)上也做了不少優(yōu)化,確保在真實(shí)場(chǎng)景中“跑”得流暢。

首先是處理長(zhǎng)文本的“巧勁”。

人要學(xué)會(huì)快速瀏覽文本,就必須學(xué)會(huì)“一目十行”——AI 也一樣,面對(duì)一個(gè)超長(zhǎng)文本還要快速輸出內(nèi)容,就不能在生成新詞時(shí),每次都全文逐字閱讀理解。這被稱為“全注意力”機(jī)制,雖然輸出效果更好,但 AI 的計(jì)算量會(huì)隨著文本長(zhǎng)度呈平方級(jí)增長(zhǎng),是導(dǎo)致處理長(zhǎng)文本時(shí)速度劇降、延遲飆升的主要原因。

要一目十行,模型就必須采取滑動(dòng)窗口注意力(Sliding-Window Attention, SWA)的機(jī)制。

所謂滑動(dòng)窗口,是基于一個(gè)符合直覺(jué)的觀察:在理解一個(gè)長(zhǎng)句子或段落時(shí),當(dāng)前詞的含義最受其“鄰近”詞匯的影響,而距離很遠(yuǎn)的詞影響相對(duì)較小。在這種機(jī)制下,模型能更專注于一個(gè)窗口中臨近詞匯的內(nèi)容,讀的內(nèi)容變少了,處理速度當(dāng)然更快,成本也自然更低。

而 Step 3.5 Flash 則是博采眾長(zhǎng),采用了 3:1 的滑動(dòng)窗口與全局注意力混合架構(gòu)(SWA + Full Attention),對(duì) 256K 上下文有著高效的處理能力。

不光“看”得快,Step 3.5 Flash 還“寫(xiě)”得快。

傳統(tǒng)的模式,AI 生成 Token,要一個(gè)一個(gè)地“往外蹦”,在追求 AI 快交互的今天,這樣的速度明顯不夠。

而 Step 3.5 Flash 采用了多 Token 預(yù)測(cè)(Multi-Token Prediction, MTP-3) 的技術(shù),一次可以完成多個(gè) Token 的預(yù)測(cè),這相當(dāng)于讓 Token 的輸出從“單車道”變成了“多車道”,直接讓文本生成的吞吐效率翻了倍。

有了稀疏 MoE 架構(gòu),再整合了更先進(jìn)的技術(shù)模式,給市場(chǎng)帶來(lái)的震撼是直接的:AI在處理復(fù)雜、多步任務(wù)時(shí)的“遲滯感”正在被抹平。無(wú)論是代碼生成、長(zhǎng)文檔分析還是需要多輪思考的規(guī)劃任務(wù),響應(yīng)都變得更加即時(shí)和連貫。

Step 3.5 Flash 的出現(xiàn),對(duì)于那些希望將 AI 深度集成到自動(dòng)化工作流中的開(kāi)發(fā)者而言,標(biāo)志著一個(gè)實(shí)用的拐點(diǎn)——一個(gè)既聰明又敏捷的“AI 大腦”已經(jīng)觸手可及。


結(jié)語(yǔ)

模型能力的升級(jí),在今天似乎已經(jīng)不是新鮮事——而 Step 3.5 Flash 的強(qiáng)勢(shì)登場(chǎng),卻打破了過(guò)往的技術(shù)預(yù)設(shè)。

Step 3.5 Flash 所代表的,不僅僅是一個(gè)模型版本的迭代,更是一種技術(shù)路徑的明確:通往更強(qiáng)大的人工智能的道路,不一定只靠無(wú)限制地堆疊參數(shù),通過(guò)架構(gòu)創(chuàng)新和工程優(yōu)化,在效能與能力之間取得精妙平衡,同樣是關(guān)鍵且務(wù)實(shí)的一步。

Step 3.5 Flash 登榜的勝利,不止是模型技術(shù)的勝利,更是模型工程的勝利,是階躍星辰在追尋 AGI 的路上,邁出的堅(jiān)實(shí)一步。

今天,Step 3.5 Flash 已在 OpenRouter、GitHub、階躍 AI APP 和網(wǎng)頁(yè)端等多端同步上線,面向開(kāi)發(fā)者提供免費(fèi)試用與快速部署支持。而同時(shí),階躍星辰也已啟動(dòng)了下一代 Step 4 的研發(fā),并邀請(qǐng)全球開(kāi)發(fā)者“深度參與共創(chuàng)”,讓模型從工程中來(lái),到工程中去,用最“落地”的方式做最“高級(jí)”的事情。

從 Step 3.5 Flash 開(kāi)始,市場(chǎng)便能夠看到一條通往 AGI 更清晰的路徑——通過(guò)構(gòu)建更快、更穩(wěn)、更易獲取的智能基座,降低每一個(gè)創(chuàng)新者構(gòu)建高級(jí)AI應(yīng)用的門(mén)檻。

當(dāng)無(wú)數(shù)開(kāi)發(fā)者可以基于這樣的基座,在面對(duì)千行百業(yè)的具體問(wèn)題時(shí),都能創(chuàng)造出屬于自己的智能體,并且以更便宜、更便捷的方式滿足自己的實(shí)際需求,那時(shí)的我們距離AGI,或許可以又近了一點(diǎn)點(diǎn)。

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)