日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給成妍菁
發(fā)送

0

拆解有道“子曰4”全量開源:如何通過(guò)重構(gòu)思維鏈打下落地成本?

本文作者: 成妍菁   2026-05-20 18:04
導(dǎo)語(yǔ):“子曰”大模型迎來(lái) 4.0 版本的全方位升級(jí)

近日,網(wǎng)易有道宣布“子曰”大模型迎來(lái) 4.0 版本的全方位升級(jí)?!白釉?" 正式邁入全模態(tài)時(shí)代,不僅全面支持文本、圖片、音頻的融合交互,有道更宣布將核心的“多模態(tài)模型”與“語(yǔ)音合成(TTS)模型”正式開源。與此同時(shí),翻譯模型也迎來(lái)了深度的技術(shù)重構(gòu),翻譯質(zhì)量與效率實(shí)現(xiàn)雙重提升。多模態(tài)模型視覺(jué)與數(shù)理斬獲SOTA,純文本數(shù)理難題性能行業(yè)領(lǐng)先據(jù)介紹,開源的“子曰4”多模態(tài)模型在 27B 參數(shù)規(guī)模上,面向教育場(chǎng)景,將支持視覺(jué)輸入的數(shù)理能力拉到了行業(yè)頂尖水平(SOTA)。在同等參數(shù)規(guī)模的模型中,“子曰4”在處理帶圖表的數(shù)學(xué)題、物理題等高難度視覺(jué)數(shù)理問(wèn)題上表現(xiàn)驚艷。中文純文本數(shù)理難題的性能也獲得顯著提升,模型準(zhǔn)確率達(dá)81.4%,達(dá)到行業(yè)領(lǐng)先水平。

拆解有道“子曰4”全量開源:如何通過(guò)重構(gòu)思維鏈打下落地成本?

子曰4在多個(gè)視覺(jué)數(shù)理基準(zhǔn)上達(dá)到同規(guī)模模型中最佳水平  

圖片來(lái)源: https://huggingface.co/netease-youdao/Confucius4

更為關(guān)鍵的突破在于實(shí)際落地的“性價(jià)比”。相關(guān)負(fù)責(zé)人介紹,新模型采用了精細(xì)化思維鏈重構(gòu)方案,通過(guò)匯聚大規(guī)模優(yōu)質(zhì)精簡(jiǎn)的推理樣本進(jìn)行深度優(yōu)化,成功將推理思維鏈輸出長(zhǎng)度壓縮了43.2%。這意味著它可以用更少的 Token、更短的推理路徑更快地給出答案,為企業(yè)和開發(fā)者大幅降低了實(shí)際業(yè)務(wù)場(chǎng)景中的推理成本。

拆解有道“子曰4”全量開源:如何通過(guò)重構(gòu)思維鏈打下落地成本?

子曰4在多個(gè)視覺(jué)數(shù)理基準(zhǔn)上大幅降低了輸出token的數(shù)量  

圖片來(lái)源: https://huggingface.co/netease-youdao/Confucius4

此外,子曰研發(fā)團(tuán)隊(duì)針對(duì)國(guó)內(nèi)學(xué)生真實(shí)的作業(yè)p、考試和提問(wèn)場(chǎng)景進(jìn)行了深度優(yōu)化,讓它能夠真正解決中國(guó)學(xué)生在實(shí)際學(xué)習(xí)中遇到的真實(shí)問(wèn)題,成為更有溫度的數(shù)字化助手成為更有溫度的數(shù)字化助手。

開源TTS:支持14 種語(yǔ)言,3秒克隆原聲,跨語(yǔ)種不再有口音

此次與多模態(tài)模型一同開源的還有語(yǔ)音合成(TTS)引擎 ,該引擎基于前沿的“語(yǔ)音編碼器 + LLM”架構(gòu)打造,面向開發(fā)者及內(nèi)容創(chuàng)作者提供零樣本、低門檻的語(yǔ)音克隆與情感合成能力。

目前,它已全面支持中文、英語(yǔ)、日語(yǔ)、韓語(yǔ)、德語(yǔ)、法語(yǔ)、西班牙語(yǔ)、印尼語(yǔ)、意大利語(yǔ)、泰語(yǔ)、葡萄牙語(yǔ)、俄語(yǔ)、馬來(lái)語(yǔ)及越南語(yǔ)共 14 種語(yǔ)言。

系統(tǒng)可支持不同語(yǔ)言間同一說(shuō)話者音色的自然遷移,無(wú)需額外訓(xùn)練即可保持音色一致性,且合成結(jié)果具備母語(yǔ)級(jí)別的自然度與流暢度,跨語(yǔ)種克隆也沒(méi)有口音泄露問(wèn)題。

在聲音克隆方面,子曰4實(shí)現(xiàn)了“上傳即可克隆”的全量支持能力,用戶僅需提供任意音頻素材,系統(tǒng)即可在三秒內(nèi)完成原聲復(fù)制。

據(jù)介紹,該引擎在克隆任務(wù)中的準(zhǔn)確度超過(guò) 97%,克隆音色與原聲的相似度達(dá) 85% 以上。在保留說(shuō)話人獨(dú)特音色的同時(shí),還可精準(zhǔn)還原其情感色彩,綜合能力達(dá)到該領(lǐng)域第一梯隊(duì)。此外,該開源模型在真實(shí)多語(yǔ)言場(chǎng)景中展現(xiàn)出較好的穩(wěn)健性,可應(yīng)對(duì)日常對(duì)話、新聞播報(bào)、企業(yè)宣傳等不同語(yǔ)境及復(fù)雜情感表達(dá)等多種合成需求。

翻譯模型質(zhì)量全面升級(jí),推理速度提升80%

作為有道最為深厚的技術(shù)資產(chǎn),翻譯模型在本次升級(jí)中也迎來(lái)了重要的技術(shù)升級(jí),使其在翻譯任務(wù)中表現(xiàn)進(jìn)一步提升。

在數(shù)據(jù)層面,子曰團(tuán)隊(duì)收集并清洗了上億級(jí)別的多語(yǔ)言數(shù)據(jù),并聘請(qǐng)具有專八認(rèn)證的專業(yè)人員進(jìn)行多維度人工評(píng)估,從源頭保證語(yǔ)料的高品質(zhì)。

在算法層面,模型采用了創(chuàng)新的“多專家 OPD ”模式,用一種更聰明的“軟方式”博采眾長(zhǎng),同時(shí)通過(guò)強(qiáng)化學(xué)習(xí)引入格式獎(jiǎng)勵(lì)和語(yǔ)言檢測(cè)機(jī)制,有效解決了機(jī)翻常見(jiàn)的脫靶和語(yǔ)種混出問(wèn)題。

為了應(yīng)對(duì)高頻、高并發(fā)的產(chǎn)業(yè)級(jí)應(yīng)用,升級(jí)后的翻譯模型配備了高效的加速機(jī)制,使得整體推理速度直接飆升80%。配合大模型自動(dòng)評(píng)測(cè)與人工隨機(jī)抽檢相結(jié)合的定制化方案,新一代翻譯模型在文本、圖片和文檔翻譯等多場(chǎng)景下,都展現(xiàn)出了兼具速度與質(zhì)量的極高水準(zhǔn)。

回望有道在AI領(lǐng)域的探索歷程,從最初子曰以首個(gè)教育垂直大模型姿態(tài)亮相、推出顛覆傳統(tǒng)口語(yǔ)練習(xí)模式的“虛擬人口語(yǔ)教練Hi Echo”,到“子曰”2.0、3.0版本在軟硬件生態(tài)中的全面扎根,有道始終走在 AI 賦能場(chǎng)景的最前沿。2026年,有道更是按下了應(yīng)用落地的加

速鍵,陸續(xù)發(fā)布了LobsterAI、有道寶庫(kù)、有道同傳Agent、Thinkflow等一系列AI Agent產(chǎn)品,實(shí)現(xiàn)了全場(chǎng)景 AI Agent 矩陣的前瞻性布局。“子曰4” 的升級(jí)與核心模型全量開源,不僅大幅降低了開發(fā)者在多模態(tài)與語(yǔ)音合成領(lǐng)域的應(yīng)用門檻,也向行業(yè)展示了以底層核心技術(shù)滋養(yǎng)上層 Agent 矩陣的生態(tài)閉環(huán)。有道希望,隨著全球開發(fā)者與開源社區(qū)的共同注入,這一套全模態(tài)大模型生態(tài)將在更廣泛的產(chǎn)業(yè)中激發(fā)出真正的生產(chǎn)力變革。(雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))雷峰網(wǎng)雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)