0
| 本文作者: 宗仁 | 2016-10-11 21:08 | 專題:IROS 2016 | 見證機(jī)器人領(lǐng)域最頂級(jí)的國際會(huì)議 |
宗仁,教頭聯(lián)合編輯。
很多人一直對百度相關(guān)研究院具體在開展什么業(yè)務(wù)很好奇,今天下午在IROS 2016的Grand Ballroom,百度IDL負(fù)責(zé)人林元慶從業(yè)務(wù)視角為我們詳細(xì)剖析了AI在百度業(yè)務(wù)中的運(yùn)用。
首先,林元慶為我們介紹了以吳恩達(dá)為首的百度相關(guān)研究院的內(nèi)部分工情況,其中,Adam Coates負(fù)責(zé)硅谷的AI實(shí)驗(yàn)室,林元慶本人負(fù)責(zé)IDL實(shí)驗(yàn)室,Wei Fan則負(fù)責(zé)的大數(shù)據(jù)實(shí)驗(yàn)室。

下面先講一下百度大腦里的AI技術(shù),除了我們熟知的語音識(shí)別,計(jì)算機(jī)視覺,NLP之外,還有更進(jìn)一層的基于AI技術(shù)的推薦,預(yù)測;控制,運(yùn)動(dòng)以及決策,規(guī)劃,一共6個(gè)大的研究方向。

自從GPU以“洪荒之力” 登上舞臺(tái),基于它計(jì)算力的平臺(tái)架構(gòu)也越來越豐富。。

百度AI層就是從底層平臺(tái)開始,一層一層往上疊加。主要包括3層。
最底層的機(jī)器學(xué)習(xí)平臺(tái)-PaddlePaddle深度學(xué)習(xí)平臺(tái)
AI基礎(chǔ)技術(shù)的應(yīng)用-語音識(shí)別,計(jì)算機(jī)視覺,NLP,決策/規(guī)劃,運(yùn)動(dòng)/控制,推薦/預(yù)測
AI終端層應(yīng)用-通過語音搜索,視頻分析,生物工程, 貼片廣告,人機(jī)交互,機(jī)器翻譯,自動(dòng)駕駛。

據(jù)林元慶介紹,百度IDL在做大約十個(gè)方向的研究,包括PaddlePaddle深度學(xué)習(xí)開源框架、圖片搜索、底層圖像識(shí)別技術(shù)、人臉識(shí)別、OCR(光學(xué)字符識(shí)別)、視頻分析、learning robot、有細(xì)密紋理的圖片識(shí)別、AR以及醫(yī)療影像識(shí)別。

如今百度的IDL重點(diǎn)研究和應(yīng)用領(lǐng)域還是在圖形圖像方向,但視頻識(shí)別和醫(yī)療影響識(shí)別是最近開始涉足的新領(lǐng)域,借助視頻識(shí)別技術(shù)的發(fā)展,汽車在路上行駛時(shí)對周遭環(huán)境會(huì)更加靈敏。另外,根據(jù)林元慶現(xiàn)場透露,到今年底百度IDL的人員會(huì)增加一倍(北京,深圳,硅谷三地都設(shè)有辦公室)。林元慶去年年底上任百度IDL負(fù)責(zé)人,這些變動(dòng)都是他上任之后產(chǎn)生的。
林元慶在擔(dān)任百度IDL實(shí)驗(yàn)室負(fù)責(zé)人之前,是NEC Labs America媒體分析部門負(fù)責(zé)人,其主攻的兩個(gè)研究方向分別是大規(guī)模細(xì)粒度圖像識(shí)別和自動(dòng)駕駛視覺感知。從他現(xiàn)在IDL做的十余個(gè)方向中,我們到處可以看到其擅長的大規(guī)模細(xì)粒度圖像識(shí)別在各個(gè)場景中的應(yīng)用,現(xiàn)在我們已經(jīng)看到了IDL跟之前的細(xì)微變化,期待后面有更多不一樣的東西。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章