日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給nebula
發(fā)送

0

Code Arena放榜:阿里千問3.7編程能力超越GPT、Gemini,僅次于Claude系列

本文作者: nebula   2026-05-26 11:58
導(dǎo)語:編程權(quán)威榜單:千問3.7僅次于Claude,阿里全球第二。

5月26日凌晨,全球權(quán)威三方編程榜單Code Arena放榜,阿里最新旗艦?zāi)P蚎wen3.7-Max得分1541,超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一眾模型,僅次于Claude系列,在大模型廠商中排名全球第二,這也標(biāo)志著在代碼理解與生成領(lǐng)域,千問3.7成功躋身全球編程模型第一梯隊。

 Code Arena放榜:阿里千問3.7編程能力超越GPT、Gemini,僅次于Claude系列

圖說:Code Arena榜單顯示,憑借Qwen3.7-Max,阿里位列全球第二 

編程能力是當(dāng)下模型智能水平的核心指標(biāo),而Code Arena是由知名第三方大模型盲測平臺LMArena推出的最具影響力的榜單之一。與傳統(tǒng)的代碼基準(zhǔn)測試不同,Code Arena并不考核孤立的代碼片段生成或傳統(tǒng)算法題,而是由開發(fā)者出題,要求模型從零生成完整的、可交互的Web應(yīng)用程序,并交由用戶對匿名模型的生成效果進(jìn)行兩兩PK,由投票綜合生成榜單,因此Code Arena也被認(rèn)為是目前全球最具公信力的AI編程能力評測之一。經(jīng)全球開發(fā)者以真實(shí)使用體驗(yàn)盲測投票,千問3.7模型編程能力位居前4,打破由Claude-Opus-4.7和4.6統(tǒng)治已久的前四格局,Qwen3.7-Max也成為目前榜單中唯一突破1540分大關(guān)的國產(chǎn)大模型。

據(jù)了解,面向Agent打造的Qwen3.7-Max在編程、智能體、長程任務(wù)等核心能力上實(shí)現(xiàn)了大幅突破,不但能在數(shù)小時內(nèi)獨(dú)立完成專業(yè)團(tuán)隊耗時2周的復(fù)雜項(xiàng)目端到端交付,大幅提升辦公自動化和企業(yè)級生產(chǎn)力,甚至可以持續(xù)運(yùn)行35小時、累計超1000次工具調(diào)用的復(fù)雜長程任務(wù),自我編程優(yōu)化芯片內(nèi)核。

Qwen3.7-Max發(fā)布后迅速在全球引發(fā)強(qiáng)烈反響。大量獨(dú)立開發(fā)者、AI創(chuàng)作者、企業(yè)用戶第一時間在社交媒體上分享了測評結(jié)果:多位開發(fā)者評價其"長程自主執(zhí)行能力令人印象深刻""是真正能把事情做完的智能體基座模型";有AI機(jī)構(gòu)在相同提示詞下同步橫評了Qwen3.7-Max、Claude-4.7與GPT-5.5,發(fā)現(xiàn)千問3.7較上代的性能提升幅度最大、推理成本最低,在輸出速度和生成質(zhì)量兩個維度上相較其他模型均有明顯優(yōu)勢。

雷峰網(wǎng)(公眾號:雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說