日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學(xué)術(shù) 正文
發(fā)私信給蔣寶尚
發(fā)送

0

羅杰波、馬毅、華剛等談視覺研究那些事:是時候重新定義視覺了

本文作者: 蔣寶尚 2020-05-14 20:21
導(dǎo)語:作者 | 蔣寶尚編輯 | 叢 末視覺研究日益火爆,頂會論文是指明燈。那么作為頂會主席的研究員如何看待此領(lǐng)域的發(fā)展?5月14日上午,微軟亞洲研究院創(chuàng)研論壇 CVP

羅杰波、馬毅、華剛等談視覺研究那些事:是時候重新定義視覺了

作者 | 蔣寶尚

編輯 | 叢 末

視覺研究日益火爆,頂會論文是指明燈。那么作為頂會主席的研究員如何看待此領(lǐng)域的發(fā)展?5月14日上午,微軟亞洲研究院創(chuàng)研論壇 CVPR 2020 論文分享會中的圓桌討論環(huán)節(jié)邀請了五位擔(dān)任過視覺領(lǐng)域頂會主席的嘉賓。

羅杰波、馬毅、華剛等談視覺研究那些事:是時候重新定義視覺了

五位嘉賓

他們就論文如何選題、如何看待arXiv、線上會議能否取代線下參會發(fā)表了看法。其中加州大學(xué)伯克利分校教授馬毅談到:目前頂會領(lǐng)域規(guī)模太過龐大,視覺研究是時候重新定義自己了,定義方向重新回到初衷,做高質(zhì)量,有突破的研究。除此之外,美國羅徹斯特大學(xué)教授羅杰波、Wormpex Al Research副總裁兼首席科學(xué)家華剛、加州大學(xué)圣地亞哥分校教授屠卓文、加州大學(xué)美熹德分校教授楊明玄也發(fā)表了看法。 1

論文選題不要湊熱鬧

羅杰波、馬毅、華剛等談視覺研究那些事:是時候重新定義視覺了

大佬們談笑風(fēng)生       


 深度學(xué)習(xí)是計算機(jī)視覺的研究技術(shù)之一,深度學(xué)習(xí)在各領(lǐng)域大火的時候,也影響到了計算機(jī)視覺,做學(xué)者的要有自己的原則,羅杰波表示:不刷榜單,不湊熱鬧,明白學(xué)者在算力方面是比不過企業(yè)的,在選題的時候要找自己感興趣的話題,找自己認(rèn)為獨特的點去做,不是說別人做什么你就做什么,寫作時要明白寫的東西是給別人看的,不是給你的導(dǎo)師,不是給學(xué)術(shù)帶頭人看的,要讓評審看得出妙處。

楊明玄說道:同意做有感興趣的事情,但是要量力而為,世界那么大,事情那么多,不要非做極度有挑戰(zhàn)的事情。另外,越刁鉆的老板(導(dǎo)師)越能提高你論文通過率,畢竟他們看的論文多、經(jīng)驗多。寫作技能要慢慢提高,多看paper,將它們的框架寫下來,可以把自己代入評審角色,看看自己的論文和別人有什么不一樣,你自己會不會選你。經(jīng)驗都是積攢出來的,就像一眼就能夠看出問題的老醫(yī)師。

馬毅補充到:寫文章,做研究有兩個階段,先學(xué)習(xí)做學(xué)問的技巧,把一個事情講清楚,把控住語言,最早的幾篇文章是在訓(xùn)練自己的技巧,而不是做的研究有多么了不起。過了這個坎之后,可以隨心所欲做自己想要做的研究,重點在于做研究而不是寫文章。另外,不要把評審看的太重,一些重量級學(xué)者,例如Yann LeCun的論文也有被“砍掉”的經(jīng)歷,所以更重要的是你的問題有沒有價值,第二你有沒有把問題寫清楚。

寫作技巧有兩個建議:第一找你欣賞人的文章去follow,學(xué)習(xí)怎么開頭、怎么結(jié)尾、這么承前啟后。第二點,把自己帶入評審的角色,做自己最嚴(yán)厲的評審,把自己訓(xùn)練成最難說服自己的人,不要自我滿足,不停的反駁自己一下。

華剛總結(jié)到:1、論文選題,切莫跟風(fēng),要做有興趣,這樣才能放入精力;2、訓(xùn)練自己的技巧,讀一些paper,知道好paper長什么樣子,語言不一定華麗,讓一般的人讀懂;3、明確和導(dǎo)師的關(guān)系:判斷你的論文是否能接受,能增加你論文接受的幾率。屠卓文最后補充到:寫文章的原則是:幫人幫己,幫助自己考慮問題,但更重要的是別人怎么看你的文章,能不能幫助別人理解你的工作。并不是每一項工作都能達(dá)到很高的境界,在這過程更重要的是對得起自己的努力。 


如何看待arXiv的文章?

arXiv 是一個收集物理學(xué)、數(shù)學(xué)、計算機(jī)科學(xué)與生物學(xué)論文預(yù)印本的網(wǎng)站,上面的文章未經(jīng)同行評審,作者對文章多半保持嚴(yán)謹(jǐn)態(tài)度。但是也可以防止自己的想法在論文被收錄前被別人剽竊(將預(yù)稿上傳到arXiv 作為預(yù)收錄)因此這就是個可以證明論文原創(chuàng)性(上傳時間戳)的文檔收錄網(wǎng)站。那么,頂會應(yīng)該如何看待arXiv ?

華剛表示:arXiv 總體上有著非常積極的一面,因為它能夠讓工作更快分享。但是問題在于:上面有大量的文章,實際上并沒有經(jīng)過同行審議,所以魚龍混雜。所以在看文章的時候需要自己有判決力,對個人來說一些論文只會看看標(biāo)題,看看摘要再決定是否讀下去。

頂會如何看待arXiv這個問題,CVPR和ICCV都有自己的政策,投稿之前弄清楚規(guī)則就好。馬毅表示:arXiv這個領(lǐng)域本身是物理和數(shù)學(xué),它所對應(yīng)的評審模式不是雙盲。既然允許論文post在arXiv上面,那么頂會評審就不應(yīng)該是雙盲,因為這會造成許多混亂。

另外,它確實對領(lǐng)頂會審核帶來很多工作,因為作為領(lǐng)域主席和程序主席往往會在“這篇文章是誰的idea”糾結(jié)。所以現(xiàn)在頂會的投稿政策還并不適應(yīng)現(xiàn)在這種情況。頂會應(yīng)該及時改變,不能裝作看不到,可以向期刊一樣的單盲評審。

楊明玄表示:arXiv的問題已經(jīng)講過很多次,但沒有人能夠去解決,目前是無解的狀態(tài),除非有頂級大佬站出來說‘我們現(xiàn)在改變主意了,我們以前講錯了,我們堅持的不是這樣,大家重新來過呀’。單盲評審確實有點不公平,2002年NIPS 從單盲變成雙盲的時候,有些學(xué)校的論文錄取瞬間下降。

所以要求雙盲卻arXiv是偽君子的做法。

深度學(xué)習(xí)是否結(jié)合傳統(tǒng)基于符號的方法?

在討論完論文如何寫、如何選題、如何看待arXiv之后,圓桌論壇也向如何克服深度學(xué)習(xí)依賴數(shù)據(jù)的問題發(fā)起了討論。能否將傳統(tǒng)基于符號的方法與深度學(xué)習(xí)結(jié)合起來從而增強(qiáng)魯棒性?能否將這種融合的發(fā)展路線帶入計算機(jī)視覺領(lǐng)域?楊明玄提到,現(xiàn)在的深度學(xué)習(xí)方法或許沒有很強(qiáng)的魯棒性,實驗也不好做,但是總要有人做。

屠卓文表示:現(xiàn)在計算機(jī)視覺更多的是考慮CNN算法,當(dāng)然RNN、Attention這些都在進(jìn)來,但是這一套系列中視覺和語言還是不太一樣。計算機(jī)視覺改變一兩個pixel,不會改變太大的結(jié)果,但是在語言里改變一個字,那就是天壤之別。

所以,計算機(jī)視覺和語言在同屬AI框架下,需要從各自的角度去考慮問題。最終的融合還是需要的,但是要明確視覺和語言確實有很多不一樣的地方,如何考慮角度非常重要,現(xiàn)在這條路還在探索階段。

羅杰波表示:視覺分為:識別、描述、推理?,F(xiàn)在CNN解決了很多大部分識別問題,計算機(jī)視覺進(jìn)化到了描述問題,下一步會進(jìn)化到推理問題。現(xiàn)在已經(jīng)有人將知識圖譜和常識這些東西加入模型,從而嘗試解決視覺系統(tǒng)或者AI系統(tǒng)到底是什么樣子。

也即從知識層面入手解決問題。從計算機(jī)視覺的定義:從視覺信號里提取描述沒提到只是做識別。計算機(jī)視覺的初心是進(jìn)化到語義,這就需要將語言和視覺知識融合起來,這是不可避免的,也是計算機(jī)視覺必須進(jìn)化的方向。

馬毅表示,魯棒性問題和現(xiàn)在深度模型擬合數(shù)據(jù),做黑盒系統(tǒng)以及依賴數(shù)據(jù)標(biāo)簽有關(guān)。深度學(xué)習(xí)系統(tǒng)并不關(guān)心數(shù)據(jù)內(nèi)在的描述表達(dá),其模式只是input-output。數(shù)據(jù)導(dǎo)向的方法可能會解決一些問題,但仍然有缺陷。例如,深度學(xué)習(xí)雖然在識別領(lǐng)域有些進(jìn)展,但是現(xiàn)在3D領(lǐng)域是最大的軟肋,因為它對魯棒、精度要求非常高。但是為什么需要真正的魯棒性?馬毅提到因為一些場景必須要求魯棒,例如軍事、醫(yī)療、無人機(jī)都是關(guān)乎人命的。 


計算機(jī)視覺頂會規(guī)模發(fā)展有何看法?

計算機(jī)視覺領(lǐng)域?qū)砣绾伟l(fā)展,對計算機(jī)視覺會議規(guī)模的發(fā)展有何看法?

線上、線下參會有何優(yōu)缺點?羅杰波表示,線上會議好處非常多,但是有個致命的缺點是:沒有圍觀效應(yīng)。Zoom此類的會議都是講座性質(zhì)的,在交流方面還差一些,缺少那種大家對‘海報’評論的氛圍。所以他認(rèn)為線上會議在短時間還不會取代線下會議。

華剛博士對羅教授的觀點表示同意,他也對頂會會議規(guī)模發(fā)表了看法:其實每個研究都有一個核心,大家都圍繞這個核心開展自己的工作,當(dāng)大量的研究者擠進(jìn)來的時候,必將會擴(kuò)展新的方向。楊明玄教授也表示規(guī)模大、人數(shù)多非常好,但是conference和workshop方式還是不同,資深的人士都會去workshop,而會議吸引的更多是學(xué)生。

馬毅教授表示他非常懷念他當(dāng)學(xué)生的那段日子,那時候的視覺會議有兩個特點,一個是小,即只有兩三百人,另一個特點是主題非常新,能帶給人非常多的啟發(fā),給年輕人非常多挑戰(zhàn)。

馬毅教授還談到,對比現(xiàn)在視覺會議的情況,計算機(jī)視覺可能要重新定義自己了,領(lǐng)域發(fā)展壯大是好事情,但是從研究主題和研究社區(qū)可能要重新思考了,看看能否找到更激動人心的事情。

人數(shù)一多,從眾心理就非常嚴(yán)重。現(xiàn)在一些研究者的角色更像網(wǎng)紅,并不是在尋找真正的追求,但是尋找真正的突破才是做研究的初衷。

所以,不忘初心,正當(dāng)時。

(雷鋒網(wǎng)、雷鋒網(wǎng)、雷鋒網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

羅杰波、馬毅、華剛等談視覺研究那些事:是時候重新定義視覺了

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說