日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給老王
發(fā)送

0

曠視科技首席科學(xué)家孫劍:登上“人工智能之月”,我們爬樹還是造火箭?

本文作者: 老王 2016-11-17 21:45
導(dǎo)語:孫劍博士通過講述大腦皮層的運(yùn)作方式,指出如何從感知智能邁向認(rèn)知智能。

曠視科技首席科學(xué)家孫劍:登上“人工智能之月”,我們爬樹還是造火箭?雷鋒網(wǎng)按:本文根據(jù)孫劍博士在微軟亞洲研究院召開的“讓世界充滿 AI-人工智能研討會(huì)”上所做的報(bào)告《通向視覺智能之路》 編輯整理而來,在未改變?cè)獾幕A(chǔ)上略有刪減。

孫劍博士2003年畢業(yè)于西安交通大學(xué),后一直在微軟亞洲研究院工作,擔(dān)任首席研究員。其主要研究方向是計(jì)算攝影學(xué), 人臉識(shí)別和基于深度學(xué)習(xí)的圖像理解。自2002年以來在CVPR, ICCV, SIGGRAPH, PAMI等頂級(jí)學(xué)術(shù)會(huì)議和期刊上發(fā)表學(xué)術(shù)論文90余篇,兩次獲得CVPR最佳論文獎(jiǎng)(2009, 2016)。孫劍博士于2010被美國權(quán)威技術(shù)期刊MIT Technology Review評(píng)選為“全球35歲以下杰出青年創(chuàng)新者”。孫劍博士帶領(lǐng)的團(tuán)隊(duì)于2015年獲得圖像識(shí)別國際大賽五項(xiàng)冠軍(ImageNet分類,檢測(cè)和定位,MS COCO檢測(cè)和分割)。孫劍博士擁有四十余項(xiàng)國際或美國專利,他和他的團(tuán)隊(duì)的研究成果被廣泛應(yīng)用在微軟Windows, Office, Azure, Bing, Xbox等產(chǎn)品中。孫劍博士于2016年7月正式加入曠視科技擔(dān)任首席科學(xué)家。

曠視科技首席科學(xué)家孫劍:登上“人工智能之月”,我們爬樹還是造火箭?

大家好,我是Face++的孫劍。

前面大家提到人工智能的前景,共識(shí)是目前感知智能已經(jīng)做的很不錯(cuò)了,但仍舊沒有明確的思路去做認(rèn)知智能。

Face++曠視科技的研究團(tuán)隊(duì)現(xiàn)在集中精力在做感知智能。我們的基本思路很簡(jiǎn)單:做技術(shù),做產(chǎn)品,做數(shù)據(jù),希望讓三者形成正循環(huán)來推動(dòng)人工智能的發(fā)展。

我在 Face++ 和微軟做的事

我在 Face++ 做的核心技術(shù)研究與我在微軟時(shí)做的方向一致:圖像分類、物體檢測(cè)、語義分割、和序列學(xué)習(xí)。

曠視科技首席科學(xué)家孫劍:登上“人工智能之月”,我們爬樹還是造火箭?

關(guān)于第一個(gè)核心技術(shù)(圖像分類)在 ImageNet 上的進(jìn)展:去年我和微軟團(tuán)隊(duì)做的ResNet 一舉把網(wǎng)絡(luò)的深度從十層或二十層推到 152 層,效果非常好,而且這個(gè)模型我們已開源,并且在業(yè)界得到了廣泛應(yīng)用。在 Face++ 我會(huì)繼續(xù)進(jìn)行這個(gè)方向的研究,我們系統(tǒng)是ResNet的一個(gè)改進(jìn)版,它和微軟時(shí)的系統(tǒng)有何不同呢?新版本融入了新的網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)思想,現(xiàn)在一個(gè)新的改進(jìn)版 ResNet 在 ImageNet 上可以媲美以往組合六個(gè)ResNet。

圖像分類中一個(gè)很重要的問題叫做人臉識(shí)別,2013 年我跟微軟的同事做出High-dimensional Feature,這是是沒有深度學(xué)習(xí)時(shí)最好的方法。隨后 Facebook 用了 DeepFace,也是第一次用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)方法,使得人臉識(shí)別率與人類眼眼的識(shí)別率非常接近,隨后很多家公司包括 Face++ 均采用了深度學(xué)習(xí)的方法在數(shù)據(jù)集上超過人眼識(shí)別率。

曠視科技首席科學(xué)家孫劍:登上“人工智能之月”,我們爬樹還是造火箭?

那么計(jì)算機(jī)真在人臉識(shí)別率上超過了人了嗎?我的回答是:很多情況下,是的。例如在身份認(rèn)證和智能安防方向的應(yīng)用,F(xiàn)ace++的人臉識(shí)別產(chǎn)品已經(jīng)超過了人。人臉識(shí)別研究已有三十年,今天我們是第一次在上億的規(guī)模上應(yīng)用人臉識(shí)別。

我們關(guān)心的第二個(gè)核心技術(shù)是物體檢測(cè),即,將各種物體在圖像中識(shí)別并定位出來,換句話說就是不但要識(shí)別圖像包含什么物體,還要知道物體在哪里。目面Face++擁有一個(gè)在著名的VOC2012物體檢測(cè)的評(píng)測(cè)中性能最好的單模型物體檢測(cè)器。為什么強(qiáng)調(diào)單模型呢? 因?yàn)榭紤]到端上計(jì)算力的限制,我們?cè)趯?shí)際產(chǎn)品廣泛使用單模型。

我們關(guān)心的第三個(gè)核心技術(shù)是語義分割,就是對(duì)每個(gè)像素分類。這是一個(gè)更為精細(xì)的分類工作。我們Face++的一名實(shí)習(xí)生的工作目前在VOC2012語義分割評(píng)測(cè)中名列第一,他現(xiàn)在正在準(zhǔn)備CVPR的投稿。我們歡迎廣大的在校學(xué)生來我們公司做最頂尖的研究,做更有趣的應(yīng)用。語義分割還能應(yīng)用在智能安防場(chǎng)景中,這個(gè)視頻展示了我們不僅可以把人分割出來,還能把人的不同部位分割出來。由于時(shí)間原因,關(guān)于序列學(xué)習(xí)我就不展開了。

做這些技術(shù)需要一個(gè)做訓(xùn)練引擎和平臺(tái),目前行業(yè)里較為流行的有微軟的CNTK,谷歌的 TensorFlow,和開源的Caffe 。而Face++ 則有著自己的平臺(tái)叫Brain++,它的設(shè)計(jì)與 TensorFlow 相似。TensorFlow 發(fā)布至今有一年的時(shí)間,而我們的 Brain++ 已經(jīng)在公司運(yùn)行將近兩年了。做自研的平臺(tái)非常關(guān)鍵,公司敢做并能做,是因?yàn)槲覀儞碛凶铐敿獾娜斯ぶ悄芗夹g(shù)人才,我們的研究團(tuán)隊(duì)?wèi)?yīng)該是中國ACM金牌選手密度最高的地方。目前在人工智能創(chuàng)業(yè)公司中使用自己的深度學(xué)習(xí)訓(xùn)練引擎的,可能只有Face++。

有了這樣的平臺(tái)和技術(shù),我們打造了兩方面的產(chǎn)品:Smart ID,用來提供身份認(rèn)證服務(wù);Smart Camera,用來將智能前端化。目前我們產(chǎn)品覆蓋包括銀行、金融、、互聯(lián)網(wǎng)、零售、地產(chǎn)、公共安全和機(jī)器人等行業(yè)。我們希望通過“人工智能+ ”把人工智能滲透到每個(gè)行業(yè)當(dāng)中。

曠視科技首席科學(xué)家孫劍:登上“人工智能之月”,我們爬樹還是造火箭?

這里有幾個(gè)數(shù)字,F(xiàn)ace++ 人工智能云開放平臺(tái)的API已經(jīng)服務(wù)了近七萬開發(fā)者,已被調(diào)用 62 億次;我們的身份認(rèn)證平臺(tái)目前已為一億人,注意不是一億次,提供了身份認(rèn)證的刷臉服務(wù),覆蓋了85%的金融市場(chǎng)智能化應(yīng)用。

從感知智能走向認(rèn)知智能

一般情況下我的報(bào)告到這里就結(jié)束了,但今天是回家匯報(bào),那我就再繼續(xù)分享一些對(duì)人工智能更個(gè)人的看法。我也一直在問自己一個(gè)問題,我們當(dāng)下研究 AI 方法,是在爬樹還是在造火箭。

曠視科技首席科學(xué)家孫劍:登上“人工智能之月”,我們爬樹還是造火箭?

這里有一幅畫的內(nèi)容是這樣:你要想上月球,選擇爬樹能接近月球,每年還能有不錯(cuò)的進(jìn)展,有些樹高得可能一輩子都爬不完,但到不了月球那里。如果我們不知道怎么造火箭,只用爬樹的方法,是永遠(yuǎn)上不了月球的。

那么問題來了,我們現(xiàn)在研究 AI 的方法到底是在爬樹還是在造火箭?按我們目前的辦法到底能不能上“月球”?

再回到開場(chǎng)時(shí)的提及的感知智能認(rèn)知智能這一話題。大多數(shù)感知智能能做下去,是因?yàn)槲覀兡軌蚝苊鞔_的定義他的輸入和輸出是什么,然后我們用非常深的神經(jīng)網(wǎng)絡(luò)去擬合一個(gè)函數(shù) f(x) 就可以。

但在認(rèn)知智能方面,我們不知道如何去定義它,不知道如何去準(zhǔn)備訓(xùn)練數(shù)據(jù)或環(huán)境,換個(gè)說法或許是這個(gè)系統(tǒng)太復(fù)雜,以至于我們無從入手。所以我把大多數(shù)人做的、特別是工業(yè)界研究人工智能的方法概括為方法一。

什么是方法一?方法一就是:從實(shí)踐到理論。

靠不斷地實(shí)踐來得到理論,不過嚴(yán)格意義上講,其實(shí)是沒理論。由于人工智能這個(gè)大問題過于復(fù)雜,我們也比較現(xiàn)實(shí)地把它拆分為很多很多子問題:如語音、視覺、自然語言等等。這就是我們目前研究人工智能的方法。

于是我們問自己有沒有方法二,能不能從理論到實(shí)踐,能不能先有一個(gè)理論,然后應(yīng)用到所有問題當(dāng)中去。

那現(xiàn)在到底有沒有這樣的指導(dǎo)性理論呢?我自己是一直不大相信有的,借用我的博士導(dǎo)師沈向洋的一句話:哪兒有那么多隨便就能指導(dǎo)實(shí)踐的理論。

大腦皮層給人工智能的啟示

直到我最近重新讀了一遍 Jeff Hawkins 寫的《人工智能的未來 On Intelligence》,我有些相信了。這本書出版于2004年,此前我在 2009 年讀過一次。Jeff Hawkins 是 Palm 的創(chuàng)始人,在創(chuàng)立 Palm 前他已經(jīng)學(xué)習(xí)了很多人腦科學(xué)方面的知識(shí)。他在做 Palm 賺夠錢后建立了Numenta研究所,專門研究機(jī)器智能。他寫這本書的一個(gè)很大動(dòng)機(jī)是對(duì)外闡述他對(duì)機(jī)器智能的理解。

書中寫到大腦分為兩部分:大腦皮層和舊腦(古腦)。

大腦皮層大概有六層,每層兩毫米厚,鋪開的面積可能比桌子還要大,每個(gè)神經(jīng)元和周圍的成千上百的神經(jīng)元相連接。大腦皮層并不是突然出現(xiàn),最開始爬行動(dòng)物是沒有大腦皮層的,而在幾千萬年前哺乳動(dòng)物開始有了大腦皮層,幾百萬年前人類的大腦皮層突然增大,使得人和動(dòng)物劃開了界限。

書中最讓作者包括我信服的觀點(diǎn)是:人比動(dòng)物聰明,是因?yàn)槿祟惔竽X皮層簡(jiǎn)單迅速地復(fù)制了自己,而不是生成其他特殊的結(jié)構(gòu);幾百萬年的時(shí)間不足以生成一個(gè)特殊的結(jié)構(gòu) 。

上世紀(jì)70年代曾有人提出這樣一個(gè)觀點(diǎn):大腦皮層是同質(zhì)的,每個(gè)地方都一樣,這下面可能存在一個(gè)主管我們?nèi)祟愔悄艿耐ㄓ玫乃惴?;人類有不同的各種感知只是因?yàn)椴煌妮斎肫鞴倥c大腦皮層相連接。

而且大腦皮層可以重塑,如果某個(gè)人天生失明,那他原來主管視覺部分的皮層可以演化為聽覺部分,大腦皮層的各部分功能不是固定下來一定要做什么的。

大腦皮層的這個(gè)通用算法其實(shí)是在實(shí)時(shí)處理時(shí)-空的神經(jīng)元突觸的電位變化,這里面有個(gè)計(jì)算方法,該計(jì)算方法和計(jì)算機(jī)的計(jì)算方法不同,它不是靠算的。有神經(jīng)學(xué)的分析,人類的大腦的運(yùn)算速度并不快,大腦不是在計(jì)算,而是在記憶中直接提取相似的東西,從而直接回答答案。簡(jiǎn)單來說,人是利用記憶系統(tǒng)來完成計(jì)算的。

我這里列出了書中對(duì)人類記憶的屬性的描述,時(shí)間關(guān)系就不詳述了。

Jeff Hawkins 在最后展示他的智能理論新構(gòu)架時(shí)問:什么是理解?

他舉個(gè)例子,如果我們回到家看到家中的環(huán)境,我們可能不會(huì)特別注意到什么;但家里假如出現(xiàn)一個(gè)新物體,我們的注意力馬上就會(huì)被吸引過去。Jeff Hawkins 做出以下理論解釋:大腦時(shí)時(shí)刻刻都在做著各種預(yù)測(cè),如果哪個(gè)地方預(yù)測(cè)失敗了,那個(gè)地方可能就是出現(xiàn)了新情況或新物體。此外,大腦皮層還在做各種各樣的從初級(jí)到高級(jí)的預(yù)測(cè)。

從理論到實(shí)踐

這里有個(gè)非常有意思的故事,當(dāng)年我們寫過一篇關(guān)于圖像修補(bǔ)(Image Completion)的論文,論文的研究?jī)?nèi)容是猜測(cè)被遮擋住物體的后面是什么樣子的。其實(shí)人也在有意識(shí)無意識(shí)的預(yù)測(cè)這種事。當(dāng)年我們?cè)诤蜕蛳蜓罄蠋熞黄饘懻撐臅r(shí)就是在預(yù)測(cè)某個(gè)物體的后面是什么,然后把它畫出來。

《人工智能的未來》一書的理論簡(jiǎn)單來說,就是該理論認(rèn)為智能是一個(gè)記憶-預(yù)測(cè)(Memory-Prediction)的框架,智能是你能夠利用對(duì)這個(gè)世界模式的記憶和預(yù)測(cè)的能力來衡量的。圖靈定義圖靈智能,是利用行為來衡量。而 Jeff Hawkins 并不同意。

我第一次讀過這本書后受到很大的啟發(fā),于是在2011年寫過一篇CVPR論文。論文內(nèi)容是為解決大姿態(tài)下人臉識(shí)別的問題:我們構(gòu)建一個(gè)人臉數(shù)據(jù)庫,構(gòu)建一個(gè)記憶,希望把正面臉和側(cè)面臉通過記憶連接起來,這是當(dāng)時(shí)人臉識(shí)別最好的方法。有趣的這篇論文的第一作者是 Face++的 CEO & 創(chuàng)始人印奇。

目前在神經(jīng)網(wǎng)絡(luò)的研究中,我們認(rèn)識(shí)到記憶的重要性,如果沒有記憶,那么訓(xùn)練出來的系統(tǒng)僅能完成一個(gè)簡(jiǎn)單的 f(x),所以目前業(yè)界最近有很多的人工智能最前沿工作均集中在如何實(shí)現(xiàn)有效的記憶機(jī)制,如何存儲(chǔ)不變表示等方面。

最后回到報(bào)告的題目,當(dāng)下我們都茍且在方法一上,我以前不是那么相信從理論到實(shí)踐;但現(xiàn)在我相信從理論到實(shí)踐的方法二是存在的,而且就像大腦皮層簡(jiǎn)單復(fù)制自己一樣可能沒有那么復(fù)雜。方法二的到來比我們想象的更快。

謝謝大家!

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

曠視科技首席科學(xué)家孫劍:登上“人工智能之月”,我們爬樹還是造火箭?

分享:
相關(guān)文章

編輯

微信 wangyafeng123456
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說