日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給小七
發(fā)送

0

OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀,與面壁智能「撞車」了

本文作者: 小七   2026-05-12 21:06
導(dǎo)語(yǔ):面壁智能的 MiniCPM-o 4.5 在 2026 年 2 月就已正式開(kāi)源,比翁荔 TML 團(tuán)隊(duì)領(lǐng)先了 3 個(gè)月。

 今天,大模型圈再次被點(diǎn)燃,這一次的火花來(lái)自前 OpenAI 應(yīng)用研究負(fù)責(zé)人翁荔(Lilian Weng)。她創(chuàng)立的Thinking Machines Lab(TML)首次公布的技術(shù)愿景,直指人機(jī)交互的終極形態(tài)——一個(gè)能與人類進(jìn)行「全雙工」(Full-Duplex)實(shí)時(shí)對(duì)話的 AI 模型。 

然而,當(dāng) TML 那支展示著無(wú)縫、主動(dòng)交互能力的 Demo 視頻在網(wǎng)絡(luò)上流傳時(shí),許多 AI 領(lǐng)域的從業(yè)者卻產(chǎn)生了一種強(qiáng)烈的「既視感」——因?yàn)?TML 描繪的那個(gè)未來(lái),早在三個(gè)月前,就已被中國(guó)公司「面壁智能」的 MiniCPM-o 4.5 以開(kāi)源的形式,帶到了現(xiàn)實(shí)。

先看「邊看邊聽(tīng)邊說(shuō)」的全模態(tài)實(shí)時(shí)交互效果——

這是 MiniCPM-o 4.5 的效果,模型可以實(shí)時(shí)觀察周圍并對(duì)環(huán)境進(jìn)行描述輸出,主動(dòng)反應(yīng)表現(xiàn)一流:

這是 TML 時(shí)隔 3 個(gè)月后發(fā)布的模型效果:

這不僅是一次簡(jiǎn)單的「撞車」,更像是一場(chǎng)跨越太平洋的技術(shù)共識(shí)。它不僅驗(yàn)證了下一代 AI 交互的技術(shù)路徑,也讓我們重新審視中國(guó) AI 力量在全球創(chuàng)新版圖中的位置。

 

一場(chǎng)不約而同的交互革命:打破「對(duì)講機(jī)」模式

要理解這場(chǎng)技術(shù)共識(shí)的深刻性,首先要明白 TML 和面壁智能共同挑戰(zhàn)的敵人是什么——延續(xù)至今的「回合制」(turn-based)交互范式。

從 Siri 到各類語(yǔ)音助手,再到 GPT-4o 的語(yǔ)音模式,我們與 AI 的交流更像是使用一部「對(duì)講機(jī)」:你說(shuō)完,等待「滴」的一聲,然后它回應(yīng)。

這背后是一套名為「語(yǔ)音活動(dòng)檢測(cè)」(VAD)的機(jī)制在主導(dǎo),它像一個(gè)裁判,嚴(yán)格劃分著你和 AI 的發(fā)言輪次。這種模式,與人類自然對(duì)話中那種你來(lái)我往、信息流交織的狀態(tài),相去甚遠(yuǎn)。

而面壁智能與 TML 的共同洞察是:真正的自然交互,必須打破這種輪次限制,進(jìn)入一個(gè)「全雙工」的流式處理時(shí)代。

面壁智能的先行:這正是面壁智能在 2 月發(fā)布并開(kāi)源 MiniCPM-o 4.5 時(shí)提出的核心理念。在其技術(shù)報(bào)告中,面壁智能將目標(biāo)定義為構(gòu)建一個(gè)能夠處理和生成「交錯(cuò)多模態(tài)信息」的系統(tǒng),其核心動(dòng)機(jī)就是擺脫「對(duì)講機(jī)」的束縛。

TML 的愿景:在其博客中,翁荔團(tuán)隊(duì)明確指出,要從「回合制」轉(zhuǎn)變?yōu)樘幚砥叫械妮斎?、輸出信息流。AI 應(yīng)該能一邊聽(tīng)你說(shuō)話,一邊看著周圍的環(huán)境,同時(shí)思考并生成回應(yīng),甚至在你話音未落時(shí)就能捕捉到意圖,進(jìn)行打斷或補(bǔ)充。


這是面壁智能的 MiniCPM-o 4.5,打破了傳統(tǒng)交互中「對(duì)講機(jī)」的模式:


這是 TML 的模型效果:

雙方幾乎用不同的語(yǔ)言,描述了同一個(gè)未來(lái)。這標(biāo)志著,AI 交互的下一次范式革命,已經(jīng)有了清晰的靶心。

 

高度重合的技術(shù)框架

如果說(shuō)目標(biāo)一致是「英雄所見(jiàn)略同」,那么實(shí)現(xiàn)路徑的高度重合,則讓這場(chǎng)技術(shù)共識(shí)變得無(wú)可辯駁。TML 與 面壁智能,仿佛拿著同一張地圖,走向了同一個(gè)目的地。

這張「地圖」的核心,是一種基于時(shí)間對(duì)齊的流式處理框架

面壁智能稱之為「Omni-Flow」框架。其原理是將連續(xù)的音視頻流,像切香腸一樣,切成以毫秒(如200ms)為單位的細(xì)小片段。然后,將同一時(shí)間片段內(nèi)的視覺(jué)、聽(tīng)覺(jué)和已生成的文本令牌(token)「打包」在一起,形成一個(gè)按時(shí)間排序的統(tǒng)一序列,喂給大模型。

OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀,與面壁智能「撞車」了

面壁智能 Omni-Flow 框架示意圖

 

而 TML 在其博客中提出的,是「基于時(shí)間對(duì)齊的微輪次」(Time-aligned micro-turn based)概念。其圖示與Omni-Flow 的原理如出一轍:同樣是將多模態(tài)信息流切碎成帶有時(shí)間戳的微小單元,然后在一條共享的時(shí)間軸上對(duì)齊融合。

OpenAI 前 CTO 的創(chuàng)業(yè)模型首秀,與面壁智能「撞車」了

TML 框架示意圖

這種設(shè)計(jì)的精妙之處在于,它將世界從 AI 視角下離散的、模態(tài)各異的數(shù)據(jù),還原成了其本來(lái)的面目——一個(gè)連續(xù)不斷、多感官信息交織的整體。

正是基于這一共同的底層架構(gòu),兩者都實(shí)現(xiàn)了兩個(gè)顛覆性的能力:

從革命的目標(biāo),到核心的實(shí)現(xiàn)框架,再到最終呈現(xiàn)的能力,TML 的首秀與面壁智能三個(gè)月前的工作,形成了完美的閉環(huán)印證。


愿景與現(xiàn)實(shí):誰(shuí)先撞線?

既然技術(shù)路線高度一致,那么評(píng)判的標(biāo)尺自然就落在了「執(zhí)行力」上——誰(shuí)先將藍(lán)圖變成了現(xiàn)實(shí)?

答案是清晰的。

MiniCPM-o 4.5 技術(shù)報(bào)告地址:https://github.com/OpenBMB/MiniCPM-V/blob/main/docs/MiniCPM_o_45_technical_report.pdf

 

如果說(shuō)翁荔團(tuán)隊(duì)是向世界宣告「我們發(fā)現(xiàn)了新大陸」,那么面壁智能則是早在三個(gè)月前就已經(jīng)登陸,并繪制好了海圖,甚至向所有后來(lái)者開(kāi)放了港口。

MiniCPM-o 4.5 視覺(jué)主動(dòng)提醒

這種「交付」形態(tài)的差異至關(guān)重要。在大模型技術(shù)一日千里的今天,三個(gè)月的時(shí)間差,以及「概念展示」與「開(kāi)源實(shí)物」之間的鴻溝,足以定義誰(shuí)是先行者,誰(shuí)是驗(yàn)證者。

 

一場(chǎng)中國(guó) AI 的「自我證明」

TML 與面壁智能的這次「技術(shù)撞車」,與其說(shuō)是一場(chǎng)競(jìng)賽,不如說(shuō)是一次相互成就。

翁荔以其在全球 AI 領(lǐng)域的巨大影響力,為這一技術(shù)方向帶來(lái)了聚光燈,讓「全雙工」AI 的概念迅速成為行業(yè)焦點(diǎn)。

而面壁智能則以其更早的布局、扎實(shí)的工程實(shí)現(xiàn)和徹底的開(kāi)源精神,證明了中國(guó) AI 團(tuán)隊(duì)不僅能跟上世界潮流,更有能力在關(guān)鍵領(lǐng)域領(lǐng)先潮流。

直接的數(shù)據(jù)佐證就是:面壁智能的 MiniCPM-o 4.5 在 2026 年 2 月就已正式開(kāi)源,比翁荔 TML 團(tuán)隊(duì)領(lǐng)先了 3 個(gè)月。

未來(lái)已來(lái),只是分布尚不均勻。這一次,中國(guó) AI 團(tuán)隊(duì),有幸站在了更早的時(shí)區(qū)。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)