0
| 本文作者: nebula | 2026-03-26 18:28 |
以O(shè)penClaw為代表的自主執(zhí)行智能體爆火,標(biāo)志著AI應(yīng)用已從“對話交互”向“任務(wù)執(zhí)行”加速演進。企業(yè)在加速擁抱的同時,也面臨著算力浪費、安全合規(guī)等多重挑戰(zhàn)。如何讓智能體真正實現(xiàn)規(guī)?;⒖沙掷m(xù)地落地,成為產(chǎn)業(yè)界共同關(guān)注的核心議題。
3月26日,在中關(guān)村論壇未來產(chǎn)業(yè)創(chuàng)新發(fā)展論壇中,螞蟻數(shù)科大模型技術(shù)創(chuàng)新部總經(jīng)理章鵬在演講中表示,OpenClaw的爆發(fā)將帶來企業(yè)級AI范式革命,推動大模型在產(chǎn)業(yè)場景的落地從‘參數(shù)競賽’走向“Token效能競爭’。”
圖說:螞蟻數(shù)科大模型技術(shù)創(chuàng)新部總經(jīng)理章鵬在中關(guān)村論壇演講
OpenClaw類智能體的快速普及,反映了市場對自主執(zhí)行型智能體的需求,但在真實產(chǎn)業(yè)環(huán)境中,其落地面臨顯著挑戰(zhàn):由于缺乏對行業(yè)規(guī)則、業(yè)務(wù)流程的深度理解,智能體在執(zhí)行復(fù)雜任務(wù)時往往反復(fù)調(diào)用工具,導(dǎo)致Token消耗遠高于有效產(chǎn)出。據(jù)了解,在一些高頻調(diào)用場景中,OpenClaw的Token消耗成本可達集成式Agent成本的數(shù)十倍甚至百倍,這種高投入低產(chǎn)出的模式,讓其在產(chǎn)業(yè)規(guī)模化應(yīng)用中面臨可持續(xù)性難題。
“大模型產(chǎn)業(yè)落地的下半場,核心命題不是模型參數(shù)規(guī)模的競爭,而是單位Token效能的持續(xù)提升。”章鵬認(rèn)為,企業(yè)應(yīng)結(jié)合實際場景與需求,選擇大小模型結(jié)合的AI解決方案,以更低算力成本實現(xiàn)更高業(yè)務(wù)價值。
以金融場景為例,該領(lǐng)域每天需處理海量高頻低時延的任務(wù)——快速識別意圖、提取關(guān)鍵信息、檢索排序等等,這些任務(wù)具備高并發(fā)、快響應(yīng)、高精準(zhǔn)要求,傳統(tǒng)行業(yè)推理大模型能力強大,但在這些場景就像“殺雞用牛刀”,成本高昂,響應(yīng)偏慢,資源浪費。
“產(chǎn)業(yè)真正需要的是,在確保專業(yè)、嚴(yán)謹(jǐn)與合規(guī)的前提下,實現(xiàn)最優(yōu)性價比與響應(yīng)速度的AI解決方案?!闭蛮i表示。他認(rèn)為,大參數(shù)模型在復(fù)雜推理與深度分析方面表現(xiàn)效果更優(yōu),小參數(shù)模型則在高頻小任務(wù)場景的擁有更低延遲與更高性價比,產(chǎn)業(yè)需要大小模型相結(jié)合的方案,才能更高效低成本地解決真實場景問題。
在中關(guān)村論壇上,螞蟻數(shù)科發(fā)布了輕量級金融專用模型Ling-DT-Fin-Mini-2.5,這是Ling DT系列大模型的首款模型。據(jù)介紹,Ling DT Fin Mini 2.5是一款輕量級MoE模型,基于Ling 2.5最新的混合線性注意力架構(gòu),針對金融領(lǐng)域高并發(fā)、低時延的任務(wù)場景進行優(yōu)化,在保持專業(yè)深度的同時,可將推理成本壓縮至可規(guī)?;渴鸬乃弧K啾葮I(yè)界主流的同能力通用模型,推理速度快100%,處理相同任務(wù)量的硬件成本顯著降低,為金融機構(gòu)帶來切實的降本增效價值。
事實上,當(dāng)AI智能體加速滲透產(chǎn)業(yè)核心場景、執(zhí)行真實任務(wù)后,大小模型相結(jié)合已經(jīng)成為行業(yè)趨勢。近期,OpenAI便相繼推出兩款小模型GPT?5.4 mini與nano,主打低延遲與高性價比,作為執(zhí)行層子智能體主力。
章鵬表示,技術(shù)發(fā)展終將回歸產(chǎn)業(yè)對效率的理性要求,下一階段的競爭中,Token效能將成為衡量企業(yè)級AI價值的核心指標(biāo)。螞蟻數(shù)科將持續(xù)深耕企業(yè)級AGI,進一步推出百靈企業(yè)版Ling DT大模型及其行業(yè)版,加速智能體在企業(yè)級復(fù)雜場景的規(guī)?;涞?。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。