0
| 本文作者: 陳淑瑜 | 2026-05-26 14:00 | 專題:CVPR 計算機視覺與模式識別會議 |
來源:公眾號“深圳大學(xué)計算機與軟件學(xué)院”
作者:房云鵬
原文鏈接:https://mp.weixin.qq.com/s/uWReTqghPxC-DJzRwvMV5g
自動、精確的超聲心動圖視頻分割對于高效、可重復(fù)地測量關(guān)鍵臨床心功能指標(如射血分數(shù)等)以及心血管疾病的診斷至關(guān)重要。然而,由于超聲影像固有的散斑噪聲、心臟結(jié)構(gòu)的復(fù)雜動態(tài)運動,以及標注數(shù)據(jù)的嚴重稀缺,這在臨床和計算領(lǐng)域仍然是一個極具挑戰(zhàn)性的任務(wù)。
深圳大學(xué)計算機與軟件學(xué)院吳惠思教授團隊及香港理工大學(xué)秦璟教授等人在該方向上完成了一項創(chuàng)新工作,提出了一種全新的半監(jiān)督模型EchoForge。該工作成功入選CVPR 2026,為解決標注受限條件下的心臟超聲精準影像分析帶來了新的進展。下面讓我們深入了解下它。

Yunpeng Fang1, Yimu Sun1, Jingxing Guo1, Huisi Wu1*, Jing Qin2
1Shenzhen University
2The Hong Kong Polytechnic University
項目主頁:https://github.com/YunPeng-Fang/EchoForge
超聲心動圖是臨床心臟評估的一線工具,但自動分割面臨著三大障礙:
圖像質(zhì)量差:超聲圖像本質(zhì)上受到散斑噪聲和偽影的干擾,導(dǎo)致目標解剖邊界極其模糊。
動態(tài)變化大:在心臟收縮和舒張期間,心臟結(jié)構(gòu)的形狀和尺度會發(fā)生顯著的時空動態(tài)變化。
標注成本高:人工逐幀勾畫極其費時費力,導(dǎo)致訓(xùn)練數(shù)據(jù)通常極其稀疏(一般僅包含舒張末期和收縮末期的關(guān)鍵幀標注)。
現(xiàn)有的基于深度學(xué)習(xí)的解決方案往往存在局限性:傳統(tǒng)2D卷積網(wǎng)絡(luò)忽略了時序一致性,極易受噪聲干擾;引入光流的方法對散斑噪聲過于敏感;而現(xiàn)有的半監(jiān)督方法在早期生成的偽標簽質(zhì)量較差,初始錯誤會在訓(xùn)練中不斷累積,從而嚴重削弱了模型對未標注幀的學(xué)習(xí)能力。
該工作提出了一種名為EchoForge的全新半監(jiān)督超聲心動圖視頻分割框架。該方法的核心思想是通過“錨點語義感知”來克服噪聲與形態(tài)突變,并通過“連續(xù)偽標簽重鑄”機制充分挖掘未標注的視頻幀數(shù)據(jù)。該方法主要包括兩大創(chuàng)新部分:
錨點語義感知(ASA)
利用一組可學(xué)習(xí)的“錨點”靈活調(diào)整模型在不確定區(qū)域的特征,有效抑制散斑噪聲干擾;同時提取語義原型注入當前幀,增強邊界的時空一致性。
連續(xù)偽標簽重鑄(CPR)
在ASA的基礎(chǔ)上,通過輕量級的通道級注意力機制逐步整合高質(zhì)量偽標簽,并對其進行持續(xù)重鑄,為未標注的中間視頻幀提供強大的監(jiān)督信號。
提出了一種高效的半監(jiān)督框架EchoForge
包含錨點語義感知(ASA)和連續(xù)偽標簽重鑄(CPR)兩個創(chuàng)新模塊,專為解決超聲心動圖視頻分割中的噪聲和標注稀缺問題量身定制。
設(shè)計了基于錨點的特征校準與語義傳播機制
ASA模塊能夠靈活調(diào)整模型不確定區(qū)域的特征并傳播關(guān)鍵語義原型,從而在有效抑制散斑噪聲的同時,顯著增強心臟邊界的時空一致性。
構(gòu)建了穩(wěn)定可靠的偽標簽重鑄策略
建立在ASA之上的CPR模塊,通過漸進式地整合并重鑄高質(zhì)量偽標簽,實現(xiàn)了對未標注數(shù)據(jù)的穩(wěn)健監(jiān)督,該方法在兩大基準測試中均達到SOTA性能,并保持了超高的實時推理速度。
該方法的具體流程如圖1所示。其輸入為稀疏標注(僅標注舒張/收縮末期)的超聲心動圖視頻序列。

圖1. 方法流程
首先,針對超聲圖像特有的強散斑噪聲,該方法在ASA模塊中引入了錨點重新校準(ARC)策略,如圖2所示。不同于常規(guī)目標檢測中的候選框,這里的“錨點”是一組攜帶前景和背景先驗信息的可學(xué)習(xí)特征向量。它們像磁鐵一樣在復(fù)雜的超聲背景中吸引最相似的局部特征塊,對于高置信度區(qū)域保留原始特征,而對置信度模糊的區(qū)域則通過線性插值動態(tài)調(diào)整權(quán)重,從而有效剔除噪聲干擾。
為了處理心臟跨幀的巨大形變,ASA模塊中進一步設(shè)計了時序語義融合(TSF)機制。它通過掩碼池化從具有標注特征的參考幀中提取出關(guān)鍵的語義標簽(解剖學(xué)原型),并利用上下文融合模塊與交叉注意力機制,將這些純凈的結(jié)構(gòu)先驗深度注入到目標幀中,引導(dǎo)模型在不同姿態(tài)下生成更精準的邊界并保持時序連貫性。

圖2. 錨點更新過程
在半監(jiān)督學(xué)習(xí)方面,為了防止錯誤偽標簽累積,該方法提出了連續(xù)偽標簽重鑄(CPR)模塊。CPR將模型生成的已標記幀特征作為Query,未標記幀特征作為Key和Value,通過計算通道級交叉注意力來重建無標簽幀的特征,并生成高質(zhì)量的新偽標簽。配合創(chuàng)新的FlameRise訓(xùn)練策略(隨訓(xùn)練 Epoch逐漸增加偽標簽監(jiān)督的權(quán)重及置信度閾值),巧妙地防止了模型對早期低質(zhì)量預(yù)測的過擬合。
如下圖所示,該方法在CAMUS和EchoNet-Dynamic兩個基準的超聲數(shù)據(jù)集上進行了全面驗證。

圖3.可視化結(jié)果對比
即使在散斑噪聲嚴重、邊界極其模糊的挑戰(zhàn)性案例中,得益于ASA模塊的時空特征增強和CPR模塊的高質(zhì)量偽標簽再生,EchoForge依然展現(xiàn)出了更精確、更連貫的輪廓劃分能力。
自動超聲心動圖視頻分割在心血管疾病診斷中具有極高的科研與臨床工程價值。針對超聲圖像噪聲大、心臟運動復(fù)雜以及標注數(shù)據(jù)極度稀缺的三大核心痛點,本文提出了一個極為新穎的半監(jiān)督框架EchoForge。通過創(chuàng)新的錨點語義感知(ASA)降低噪聲不確定性,并結(jié)合連續(xù)偽標簽重鑄(CPR)機制充分挖掘未標記序列的潛力,大幅提升了分割算法的魯棒性和時序連貫性。該工作不僅為超聲心動圖計算提供了強大的實時解決方案,其核心機制也為更廣泛的半監(jiān)督醫(yī)學(xué)視頻分割任務(wù)開辟了全新的思路。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章