0
| 本文作者: 奕欣 | 2018-02-11 11:07 | 專題:AAAI 2018 |
雷鋒網(wǎng) AI 科技評論按:AAAI(Association for the Advancement of Artificial Intelligence,國際人工智能協(xié)會)是人工智能領(lǐng)域最為權(quán)威與重要的協(xié)會之一,而 AAAI Conference on Artificial Intelligence(AAAI)則被中國計算機學會(CCF)推薦為人工智能的 A 類會議。2018 年 2 月 2 日-7 日,第 32 屆 AAAI 會議(AAAI-18)在美國新奧爾良舉行。本次大會的官方資料顯示,AAAI 今年主會共收到投稿 3808 篇,錄用論文 938 篇。
值得一提的是,來自中國的投稿數(shù)從去年的 785 篇躥升了 58%,達到 1242 篇,并有 260 余篇論文被錄用。而在 AAAI 2018 上,阿里巴巴共有 11 篇錄用論文,6 位作者受邀赴主會作報告。論文內(nèi)容涉及對抗學習、神經(jīng)網(wǎng)絡(luò)、提高輕量網(wǎng)絡(luò)性能的訓練框架、機器翻譯、聊天機器人、無監(jiān)督學習框架、極限低比特神經(jīng)網(wǎng)絡(luò)等技術(shù)方向。
作為開年首個頂級人工智能學術(shù)會議,阿里巴巴不僅收到眾多論文被收錄的喜訊,在會議舉辦期間,阿里巴巴也于當?shù)貢r間 2 月 5 日晚間舉辦了新一期的 workshop-阿里之夜,以開啟新一年的征程。雷鋒網(wǎng) AI 科技評論也作為獨家媒體受邀做現(xiàn)場報道。
2 月 5 日當晚,阿里之夜在 AAAI 2018 會場順利進行。上百名 AAAI 組委成員、論文合作者、研究院所專家、高校學者通過定向邀約制齊聚一堂,不僅有 AAAI 協(xié)會主席 Prof. Subbarao Kambhampati 及 18 位 AAAI 2018 組委成員列席參與,還有來自全球 60 位 top 學者專家(包括 US Army research office 的 Dr Liye Dai, Director of MIT Initiative on the Digital Economy,Dr. Erik Brynjolfsson),以及全球著名高校的 60 多位 PhD 同學也參與了這一活動。
阿里巴巴人工智能實驗室北京研發(fā)中心負責人聶再清博士作為代表作歡迎致辭,并以視頻、圖片等豐富形式分享了阿里的人工智能最新研究進展和未來布局。

與此同時,作為受邀嘉賓出席「阿里之夜」的 AAAI 協(xié)會主席、美國亞利桑那大學教授 Subbarao Kambhampati 先生也做了致辭。Kambhampati 教授表示,「我在近幾年造訪中國,發(fā)現(xiàn)人工智能已經(jīng)在中國蓬勃興起,而且中國工業(yè)界擁有眾多首創(chuàng)模式和技術(shù),在人工智能領(lǐng)先表現(xiàn)讓我感到非常振奮。此外,投資界及政府對人工智能也給予了眾多關(guān)注和支持,于我看來也是 AI 在中國進步的重要體現(xiàn)?!筀ambhampati 教授用自己在中國的親身經(jīng)歷告訴大家,阿里的產(chǎn)品給人類生活帶來的便捷和高效,高度評價了阿里巴巴將人工智能技術(shù)轉(zhuǎn)化為產(chǎn)品和服務的能力。
阿里巴巴達摩院機器智能技術(shù)實驗室 NLP 資深專家陳博興和技術(shù)戰(zhàn)略部同學分別在會上分享了「AI 在阿里巴巴」及阿里巴巴學術(shù)合作項目。以阿里巴巴達摩院機器智能技術(shù)實驗室為代表,阿里巴巴展示了自己在智能語音、機器視覺(如圖像/視頻內(nèi)容分析)、NLP(自然語言處理)及機器學習&優(yōu)化四大領(lǐng)域為基礎(chǔ)的研究業(yè)務。
此外,阿里技術(shù)戰(zhàn)略部同學展示了全球?qū)W術(shù)合作的相關(guān)進展。以「AIR 計劃」為代表,在過去一年收到了 234 個來自全球 13 個國家、99 所高校的項目,并最終有 40 個優(yōu)秀項目入選 2017 AIR 計劃全球評選結(jié)果。
在活動的最后,阿里巴巴還預告了將要開啟的一項重要賽事——2018FashionAI 全球挑戰(zhàn)賽。這一賽事由阿里巴巴「圖像和美」團隊聯(lián)合香港理工大學紡織與制衣系共同發(fā)起,并通過發(fā)布業(yè)界首個滿足服飾專業(yè)性和深度學習要求的大規(guī)模高質(zhì)量數(shù)據(jù)集,號召業(yè)界一起聚焦機器認知時尚的兩個基礎(chǔ)問題:服飾關(guān)鍵點定位和服飾屬性標簽識別,共同推動 AI 技術(shù)在時尚產(chǎn)業(yè)的落地。
一名海外學生表示,他通過「阿里技術(shù)」公眾號了解到,阿里之夜將同期在 AAAI 2018 會議期間舉行,抱著對阿里巴巴學術(shù)合作項目的好奇,他第一時間報名參加了這次活動?!福ㄟ@次活動)讓我更加深入地了解了阿里巴巴在學術(shù)領(lǐng)域的投入,感覺它是一家真正重視研究的企業(yè)?!?/p>
「阿里之夜」是阿里巴巴在學術(shù)會議上舉辦的 workshop 品牌,旨在搭建全球?qū)W術(shù)合作橋梁,構(gòu)建全球產(chǎn)學研合作共同體。在去年的 IJCAI 2017 上,阿里巴巴也進行了「阿里之夜」的相關(guān)活動,同樣吸引了眾多學者的深度參與。
而這也正是阿里巴巴深度參與學術(shù)會議的一個重要目的。阿里巴巴 AAAI 2018 現(xiàn)場負責人石洪竺告訴雷鋒網(wǎng) AI 科技評論,在一個聚焦的學術(shù)會議上舉辦阿里之夜,面向?qū)獙I(yè)的學生去介紹阿里的技術(shù)品牌,「用這一方式產(chǎn)生更多的影響力,去影響我們最想影響的那些人,我認為這是阿里巴巴參與學術(shù)會議永恒的主題?!?/p>
聶再清博士也強調(diào),「阿里之夜的宗旨是打造阿里巴巴的技術(shù)品牌與技術(shù)影響力,帶動產(chǎn)學研的交融?!箵?jù)介紹,阿里巴巴在 2018 年將計劃在不同領(lǐng)域的學術(shù)頂會上持續(xù)帶來「阿里之夜」的品牌活動。
如果說,阿里巴巴舉辦阿里之夜是希望從宏觀角度展示自己在學術(shù)領(lǐng)域取得的成果,那么在學術(shù)會議所取得的成果則更能從微觀凸顯阿里巴巴在人工智能領(lǐng)域的優(yōu)秀表現(xiàn)。
在過去一年,阿里巴巴共有 5 篇 KDD 論文、4 篇 CVPR 論文、3 篇 ACM MM 論文、11 篇 IJCAI 論文先后被錄用,橫跨數(shù)據(jù)挖掘、計算機視覺、多媒體、人工智能等多個領(lǐng)域。此外,在機器視覺算法測評平臺 KITTI、國際肺結(jié)節(jié)檢測大賽 LUNA16、知識庫構(gòu)建測評 KBP2017 等多項國際權(quán)威賽事上,阿里巴巴也多次刷新世界紀錄并取得測評賽事的冠軍。
除此之外,阿里巴巴也爭取到了機器視覺頂級會議 ACM MM 2020 的主辦權(quán),成為首個獲得主辦權(quán)的中國企業(yè)。
步入 2018,在今年 1 月,阿里巴巴機器智能技術(shù)實驗室 NLP 團隊提交的 SLQA 算法模型,在 SQuAD 挑戰(zhàn)賽中也取得了精確匹配、模糊匹配第一名的成績。與此同時,這也是 AI 歷史上機器閱讀理解首次在精確匹配上超越人類閱讀理解。
在首個頂級人工智能學術(shù)會議 AAAI 2018 上,阿里巴巴共有 11 篇論文入選并均被主會收錄,涉及對抗學習、神經(jīng)網(wǎng)絡(luò)、提高輕量網(wǎng)絡(luò)性能的訓練框架、機器翻譯、聊天機器人、無監(jiān)督學習框架、極限低比特神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。
在阿里之夜的現(xiàn)場,聶再清博士告訴雷鋒網(wǎng) AI 科技評論,阿里巴巴希望從戰(zhàn)略高度,由電商企業(yè)向一家技術(shù)驅(qū)動的公司轉(zhuǎn)型,而要做到這一轉(zhuǎn)型,需要有大量的新技術(shù)做為支撐,「從公司的戰(zhàn)略角度出發(fā),我們在技術(shù)研究上投入了大量的資金和人力,特別是我們最近在達摩院上的部署,包括像 AAAI 2018 阿里之夜這樣的學術(shù)活動,都是阿里巴巴高度關(guān)注技術(shù)的一種表現(xiàn)?!?/p>
而從選題角度來看,聶再清博士表示,學術(shù)論文所解決的問題,很重要一部分都來源于企業(yè)在實際中碰到的需求,阿里巴巴會嘗試讓技術(shù)水平達到理想狀態(tài),讓用戶滿意,隨后才是論文的總結(jié)與發(fā)表。

以阿里巴巴今年的 AAAI 2018 錄用論文《Extremely Low Bit Neural Network: Squeeze the Last Bit Out with ADMM》(極限低比特神經(jīng)網(wǎng)絡(luò):通過 ADMM 算法壓縮掉最后一個比特)為例,從移動端部署的實際需求出發(fā),團隊試圖通過低比特技術(shù)來壓縮和加速深度神經(jīng)網(wǎng)絡(luò)。論文第一作者冷聰介紹道,團隊將這個問題建模成一個離散約束優(yōu)化模型,并引入了 ADMM 算法,將原始問題分解成幾個子問題,針對每個子問題分別給出高效的求解方法。實驗發(fā)現(xiàn),所提出的訓練算法具有很快的收斂速度。同時,在精度和模型前向速度方面,團隊的低比特算法超過了現(xiàn)有主流的壓縮算法。
而在實際應用上,冷聰告訴雷鋒網(wǎng) AI 科技評論,端上存儲仍然需要考慮業(yè)務的實際需求。對于精度不敏感的應用,可以使用非常低的比特來量化模型,「在精度低一個點甚至零點幾個點的前提下,如果能帶來幾十倍的壓縮,那么是完全可以接受的」,而對檢測等對精度比較敏感的應用而言,采用高比特技術(shù)的壓縮可能更符合實際需求。
在與雷鋒網(wǎng) AI 科技評論交流的時候,冷聰表示,雖然在研究選題上還是要以公司的業(yè)務和價值取向出發(fā),但一篇論文從構(gòu)思到撰寫完稿需要至少一至兩個星期的「脫產(chǎn)」才能完成,即在這段期間,員工會將優(yōu)先級完全放在論文的寫作上。在冷聰博士看來,阿里巴巴愿意讓員工潛心完成論文的寫作,本身就是一種對學術(shù)交流和討論的重視和投入。而選擇一些優(yōu)秀的技術(shù)以論文的形式投遞各大學術(shù)會議,也是阿里巴巴對外進行學術(shù)交流的一種形式。
而在機器翻譯上,阿里巴巴也憑借《Improved English to Russian Translation by Neural Suffix Prediction》(一種基于詞尾預測的提高英俄翻譯質(zhì)量的方法)受邀在 AAAI 2018 上做口頭報告。團隊提出了一種創(chuàng)新方法,不僅能夠通過控制翻譯粒度來減少數(shù)據(jù)稀疏,還可以通過一個有效的詞尾預測機制,大大降低目標端俄語譯文的形態(tài)錯誤,提高英俄翻譯質(zhì)量。通過和多個比較有影響力的已有工作對比,在 5000 萬量級的超大規(guī)模的數(shù)據(jù)集上,這一方法可以成功的在基于 RNN 和 Transformer 兩種主流的神經(jīng)網(wǎng)絡(luò)翻譯模型上得到穩(wěn)定的提升。
而在落地層面,阿里巴巴又是如何將學術(shù)研究成果與實際產(chǎn)品應用聯(lián)系起來的?
實際上,阿里巴巴對學術(shù)與產(chǎn)業(yè)的鴻溝并沒有那么難以跨越,兩者與其說是「先有雞后有蛋」的關(guān)系,倒不如稱之為互為因果、相互促進的螺旋式上升關(guān)系。
先從被廣泛認為最具落地想象空間與可行性的計算機視覺來看,阿里巴巴從電商起家,以「拍立淘」等以圖搜圖的相關(guān)應用入手,逐步豐富在 CV 領(lǐng)域的技術(shù)積累。
達摩院機器智能技術(shù)實驗室副主任華先勝此前在接受雷鋒網(wǎng) AI 科技評論采訪時曾表示,電商搜索與城市大腦,本質(zhì)上都是視覺系統(tǒng)問題。「阿里城市大腦中很關(guān)鍵的一個任務就是要解決視覺信號的問題,這實際上是對城市的智能感知。」因此,阿里巴巴在計算機視覺領(lǐng)域所做的研發(fā)和投入,正是希望讓城市大腦做到「全面知、全局知、全時知」。
在過去一年間,阿里巴巴所取得的領(lǐng)先成果便已經(jīng)令人們感到驚訝與嘆服。從應用場景來看,去年成功當選「國家隊」成員的阿里云城市大腦讓我們看到了國家對阿里巴巴 AI 力量的認可。實際上,早在 2017 年 11 月成為國家新一代人工智能開放創(chuàng)新平臺的人工智能技術(shù)服務之前,杭州城市大腦 1.0 便已順利發(fā)布,接管杭州 128 個信號燈路口,試點區(qū)域通行時間減少 15.3%,高架道路出行時間節(jié)省 4.6 分鐘。在杭州主城區(qū),城市大腦日均事件報警 500 次以上,準確率達 92%;在蕭山,120 救護車到達現(xiàn)場時間縮短一半。
更如果把時間線往前繼續(xù)推移,阿里云在 6 月 10 日的云棲大會?上海峰會上宣布推出應對全球環(huán)境惡化的技術(shù)方案:ET 環(huán)境大腦。這一方案已在江蘇實現(xiàn)了對水、氣、土、污染源的智能感知。據(jù)了解,在沿海多個省份的固廢全程監(jiān)管模擬推演中,政府使用 ET 環(huán)境大腦共預警 131 次,其中有效預警 122 次,有效率達 93%,管理企業(yè)達 2.5 萬家。
而從語音識別領(lǐng)域,我們更看到了阿里巴巴在這一領(lǐng)域的全力投入。不論是首款智能音箱天貓精靈 X1 的順利發(fā)布及成功熱賣;或是 AliGenie 語音開放平臺,都是最為鮮活的例證。
阿里巴巴采用先進的六麥克風聲學融合的方案,進行聲音的定向采集和降噪,實現(xiàn)了 5 米的遠場語音識別;而利用聲紋識別技術(shù),阿里巴巴基于語音通路,為用戶提供更具個性化的定制化服務。
此外,利用海量的語音訓練數(shù)據(jù)和語言數(shù)據(jù)訓練出來的語音識別模型,基于深度語義編碼的意圖識別和槽填充技術(shù),讓設(shè)備更懂人,準確解決指代理解問題與用戶意圖跳轉(zhuǎn)問題,以覆蓋生活中的大部分對話場景。
而阿里巴巴創(chuàng)建的「多模態(tài)智能語音交互解決方案」,可謂是在全球范圍內(nèi)首次解決了公共環(huán)境中強噪聲、強干擾下的智能語音人機交互問題。目前,該技術(shù)方案已與上海地鐵合作,可實現(xiàn)遠距離語音購票。這些成果標志著阿里的技術(shù)投入已經(jīng)成功轉(zhuǎn)化為商業(yè)化產(chǎn)品,并進一步使你我的生活更加便捷。
陳博興也向雷鋒網(wǎng) AI 科技評論介紹了阿里在機器翻譯領(lǐng)域所取得的成就。阿里起步于電商業(yè)務,得益于國際化的飛躍步伐,為配合跨境電商在海外貿(mào)易中的溝通需求,阿里巴巴從 2012 年投入做機器翻譯業(yè)務,目前已經(jīng)能提供包括商品信息翻譯、商品搜索翻譯和通用領(lǐng)域翻譯在內(nèi)的三種服務能力,累計為集團 19 個部門共計 23 個應用場景提供語言服務。
豐富的合作資源背后,隱含的是阿里巴巴世界級業(yè)務應用場景及世界級海量數(shù)據(jù)的強大支持。從電子商務起步,如今的阿里巴巴已經(jīng)擁有金融支付、物流、新制造、新零售等國內(nèi)甚至世界領(lǐng)先的業(yè)務場景,這些場景所產(chǎn)生的 EB 級數(shù)據(jù),不論是從數(shù)量上或是維度上,都是世界級的。以去年雙 11 為例,當天交易創(chuàng)建峰值 32.5 萬筆/秒,支付峰值 25.6 萬筆/秒,菜鳥網(wǎng)絡(luò)物流訂單量超過 8 億;而回顧 2017 財年,阿里巴巴平臺每天產(chǎn)生數(shù)億消費者瀏覽和交易信息、包含超過千萬級別的商品更迭、5.07 億的月活躍用戶等等。不難看出,阿里巴巴不僅具有豐富的應用場景,在數(shù)據(jù)的積累與處理上也具有得天獨厚的優(yōu)勢。
而從基礎(chǔ)設(shè)施入手,包括超大規(guī)模計算、數(shù)據(jù)處理及算法平臺的構(gòu)建,都成為了阿里巴巴集團各大業(yè)務的關(guān)鍵支持。也正因為如此,人才作為一切技術(shù)研發(fā)的核心,如何將全球的頂尖學術(shù)人才匯聚一堂,并推動阿里巴巴在產(chǎn)學研領(lǐng)域的縱向深入和橫向延展,同樣也成了阿里巴巴在戰(zhàn)略布局上的關(guān)鍵一環(huán)。
2017 年 10 月的云棲大會上,CTO 行癲宣布了阿里巴巴達摩院的誕生。阿里巴巴達摩院是阿里巴巴集團在全球多點設(shè)立的科研機構(gòu),通過立足基礎(chǔ)研究、顛覆性技術(shù)和應用技術(shù)的研究,阿里巴巴著眼于匯聚全球頂尖科學力量,旨在成為「世界頂級科研機構(gòu)」,并開始在全球各地組建前沿科技研究中心,致力于研究機器智能、智聯(lián)網(wǎng)、金融科技等多個產(chǎn)業(yè)的相關(guān)領(lǐng)域內(nèi)容。阿里巴巴達摩院的涉足領(lǐng)域主要包括三個方向:
首先是自主研究中心。通過亞洲達摩院、美洲達摩院及歐洲達摩院三大全球分部,在北京、杭州、新加坡、以色列、圣馬特奧、貝爾維尤、莫斯科等地建設(shè)立足不同方向的研究實驗室,在初期計劃將 100 名頂尖科學家與研究人員納入麾下。
陳博興也在會后交流時和雷鋒網(wǎng) AI 科技評論表示,這次參與 AAAI 2018 的一個重要體會在于海外留學生對于阿里巴巴特別是達摩院表現(xiàn)出了高度的興趣?!赣泻芏嗔魧W國外的同學在交流時表示,他們希望能更多地了解阿里,也有不少流露出計劃到阿里工作、實習的想法。在以前,很少有這么大群體數(shù)量的學生對國內(nèi)的公司表示出這么大的興趣,在國外的博士生,他們畢業(yè)后一般都會希望在谷歌、Facebook、微軟這樣的企業(yè)工作一段時間,再考慮回國工作;而全球達摩院的建立對海外留學生的吸引力大大地增加了。這也得益于人工智能在中國的快速發(fā)展,至少在應用上,中美兩國在步伐上還是相近的,因此學生們也會更有興趣選擇國內(nèi)的企業(yè)?!?/p>
其次是聯(lián)合實驗室。阿里巴巴已與浙江大學、中科院、清華大學、加州大學伯克利分校先后達成合作關(guān)系,目前已建立了以浙江大學-阿里巴巴前沿技術(shù)聯(lián)合研究中心、RISELab(加州大學伯克利分校)、中國科學院-阿里巴巴量子計算實驗室、清華大學-螞蟻金服數(shù)字金融科技聯(lián)合實驗室在內(nèi)的多家高校聯(lián)合研究所,以高校的研究實力及阿里巴巴的商業(yè)場景資源強強聯(lián)手,推動產(chǎn)業(yè)界、學術(shù)界及研究領(lǐng)域的深度合作。
第三個方面則是阿里巴巴創(chuàng)新研究計劃——「AIR 計劃」(Alibaba Innovative Research)。作為阿里巴巴達摩院的三大組成主體之一,「AIR 計劃」是阿里巴巴集團設(shè)立的首個全球性科研項目。這一項目主要致力于推進計算機科學領(lǐng)域基礎(chǔ)性、前瞻性、突破性難題的研究,以工業(yè)界和學術(shù)界深度融合的方式引領(lǐng)重大科技創(chuàng)新的實踐應用,構(gòu)建產(chǎn)學研協(xié)作共同體。
在 2017 年,「AIR 計劃」發(fā)布了 14 個領(lǐng)域、30 個來自業(yè)務一線的技術(shù)問題,涵蓋人工智能、機器學習、數(shù)據(jù)中心、圖計算等研究內(nèi)容,并收到了來自全球 13 個國家、99 個大學和科研機構(gòu)提交的 234 份研究提案,最終有 40 個優(yōu)秀項目入選為 2017 AIR 計劃全球評選結(jié)果。而除了這一全球性科研項目外,阿里巴巴也通過推進訪問學者計劃等多種豐富形式,向?qū)W者們提供在阿里巴巴的訪問研究機會。
不論是阿里巴巴橫跨全球的各項學術(shù)戰(zhàn)略部署合作,匯集世界級的頂尖人才;又或是在各大頂級學術(shù)頂級會議上發(fā)表論文,積極投身學術(shù)研究;抑或是從 IJCAI 2017 開始啟動的「阿里之夜」活動,促進與學者的深入交流,本質(zhì)上都是阿里巴巴關(guān)注學術(shù)界、立足基礎(chǔ)研究的重要表現(xiàn)。借助面向全球的人才部署,相信阿里巴巴將會在更多的學術(shù)會議嶄露頭角,帶來更多的研究成果;而依靠強大的應用場景與數(shù)據(jù)支持,學術(shù)研究成果同樣能夠在阿里收獲應用落地的果實,助推阿里技術(shù)的商業(yè)化步伐。我們也相信,阿里巴巴在 AAAI 2018 的學術(shù)征程只是今年的第一步,未來我們還能在更多的學術(shù)會議上見到阿里巴巴的身影,在我們的生活中用到阿里自主研發(fā)的 AI 技術(shù)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。