日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給Nemo
發(fā)送

0

千問3登頂全球權(quán)威開源模型榜

本文作者: Nemo   2025-05-06 17:10
導(dǎo)語:在最新一期的LiveBench榜單上,千問3表現(xiàn)與o4-mini、Claude3.7等頂尖閉源模型相當(dāng),并超越DeepSeek-R1取得了全球開源模型冠軍。


5月6日消息,國際權(quán)威大模型測評(píng)榜LiveBench公布了最新一期排名,阿里巴巴開源的新一代通義千問模型Qwen3(簡稱千問3)斬獲全球開源模型冠軍,并在指令遵循(Instruction Following)這一關(guān)鍵能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等頂級(jí)閉源模型位列全球第一。

 

千問3登頂全球權(quán)威開源模型榜

圖示 5月6日LiveBench榜單官網(wǎng)截圖

 據(jù)了解,LiveBench榜單由圖靈獎(jiǎng)得主、Meta首席AI科學(xué)家楊立昆(Yann LeCun)聯(lián)合紐約大學(xué)等機(jī)構(gòu)推出,從數(shù)學(xué)、推理、編程、語言理解等多個(gè)復(fù)雜維度全面評(píng)估大模型,并因其采用動(dòng)態(tài)更新的題庫而被譽(yù)為“全球首個(gè)無法作弊的模型基準(zhǔn)測試”。在最新一期的LiveBench榜單上,千問3表現(xiàn)與o4-mini、Claude3.7等頂尖閉源模型相當(dāng),并超越DeepSeek-R1取得了全球開源模型冠軍。同時(shí),千問3還斬獲指令遵循這一細(xì)分領(lǐng)域的全球冠軍,這說明千問3具備全球頂級(jí)的語言理解和生成能力。

 

千問3于4月29日凌晨開源,是國內(nèi)首個(gè)“混合推理模型”,其參數(shù)量僅為DeepSeek-R1的1/3,性能全面提升的同時(shí)成本還大幅下降,引發(fā)大模型產(chǎn)業(yè)鏈連夜適配和接入浪潮:英偉達(dá)、英特爾、高通、聯(lián)發(fā)科、AMD、ARM、華為昇騰、壁仞科技等芯片平臺(tái)都已完成了千問3的適配,北上津杭等十余地算力平臺(tái)也已接入千問3。截至目前,阿里通義已開源200多個(gè)模型,全球下載量超過3億次,千問的衍生模型數(shù)量超10萬,遠(yuǎn)超美國Llama,成為全球第一開源模型。

 

*附LiveBench榜單官網(wǎng)鏈接:https://livebench.ai/#/


雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說