日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給業(yè)界評論
發(fā)送

0

Ling-2.6-flash 正式發(fā)布:104B 參數(shù),主打 Token 效率,更快、更省、更落地

本文作者: 業(yè)界評論   2026-04-22 18:14
導(dǎo)語:4 月 22 日,螞蟻百靈正式推出 Ling-2.6-flash —— 一款總參數(shù)量 104B、激活參數(shù) 7.4B 的 Instruct 模型。該模型主打“To

4 月 22 日,螞蟻百靈正式推出 Ling-2.6-flash —— 一款總參數(shù)量 104B、激活參數(shù) 7.4B 的 Instruct 模型。該模型主打“Token 效率(Token Efficiency)”,在保持競爭力智能水平的同時,更快、更省以及更適合大規(guī)模真實應(yīng)用。

據(jù)權(quán)威三方評測Artificial Analysis 數(shù)據(jù),Ling-2.6-flash 展現(xiàn)了突出的 Token Efficiency 優(yōu)勢,以 15M output tokens 實現(xiàn)了 26 分 的 Intelligence Index,在保持較強(qiáng)智能水平的同時,將輸出消耗控制在相對更低的位置。相比部分依賴更長輸出換取更高分?jǐn)?shù)的模型,Ling-2.6-flash 在“智能表現(xiàn)”與“輸出成本”之間取得了更優(yōu)平衡。

對于開發(fā)者和企業(yè)場景而言,這種效率優(yōu)勢意味著更低的推理開銷、更快的首字響應(yīng)、更短的整體生成時延,以及更流暢的交互體驗,滿足在真實部署環(huán)境下對速度、成本與體驗的綜合要求。

 

Ling-2.6-flash 正式發(fā)布:104B 參數(shù),主打 Token 效率,更快、更省、更落地 

Ling-2.6-flash 沿用了 Ling 2.5 的混合線性架構(gòu)設(shè)計,這種高度稀疏化的 MoE 架構(gòu)在硬件表現(xiàn)上優(yōu)勢明顯。在 4 卡 H20 條件下推理速度最快可達(dá)到 340 tokens/s,Prefill 吞吐達(dá)到 Nemotron-3-Super 的 2.2 倍。在 Output Speed 測評中,Ling-2.6-flash以 215 tokens/s 的穩(wěn)定輸出速度位列同參數(shù)級別模型的第一梯隊。

從 Token 消耗來看,Ling-2.6-flash 的智效比顯著提升。在 Artificial Analysis 完整測評中,Ling-2.6-flash 總消耗為 15M tokens,而 Nemotron-3-Super 等模型達(dá)到或超過 110M tokens。這意味著,Ling-2.6-flash 僅用約 1/10 的 token 消耗完成了同類評測任務(wù)。

 

Ling-2.6-flash 正式發(fā)布:104B 參數(shù),主打 Token 效率,更快、更省、更落地 

 

Ling-2.6-flash 正式發(fā)布:104B 參數(shù),主打 Token 效率,更快、更省、更落地 

Ling-2.6-flash 面向 Agent 場景進(jìn)行了定向增強(qiáng),在控制 Token 消耗的前提下,依然保持了極強(qiáng)的任務(wù)執(zhí)行力,模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等Agent 相關(guān)基準(zhǔn)上達(dá)到同尺寸 SOTA 水平。與此同時,Ling-2.6-flash 在通用知識、數(shù)學(xué)推理、指令遵循及長文本解析等維度保持優(yōu)秀水準(zhǔn)。

Ling-2.6-flash 正式發(fā)布:104B 參數(shù),主打 Token 效率,更快、更省、更落地 

API 定價方面,Ling-2.6-flash 輸入每百萬tokens定價 0.1 美元,輸出 0.3 美元。目前,Ling-2.6-flash 的 API 已正式向用戶開放,并提供為期一周的限時免費(fèi)試用。用戶可以通過OpenRouter 、百靈大模型 tbox 獲取對應(yīng)服務(wù)。據(jù)了解,該模型后續(xù)將通過螞蟻數(shù)科發(fā)布商業(yè)版本LingDT,服務(wù)全球開發(fā)者及中小企業(yè)。

一周前,Ling-2.6-flash 的匿名測試版本“Elephant Alpha”上線OpenRouter,上線以來,其調(diào)用量持續(xù)增長,連續(xù)多日位列 Trending 榜首,日均 tokens 調(diào)用量達(dá) 100B 級別,周增長超5000%。

雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)

雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說