0
| 本文作者: 王德清 | 2020-09-15 14:38 |

作者 | 王德清
出品 | 雷鋒網(wǎng)產(chǎn)業(yè)組
德國(guó)人文地理學(xué)家F.拉采爾曾指出“交通是城市形成的力”。而擁堵的交通環(huán)境,則能讓一個(gè)城市“乏力”,處于亞健康的狀態(tài)。
在人口密度大、城市集聚效應(yīng)明顯的亞洲和拉美地區(qū),交通擁堵更是阻礙城市發(fā)展的“老大難”問題。
“交通是一個(gè)城市的尊嚴(yán),數(shù)據(jù)挖出看不見的路”。2018年的云棲大會(huì)上,中國(guó)工程院院士王堅(jiān)這樣表示。
很多城市面臨著亟待解決的交通問題,而數(shù)據(jù)是實(shí)現(xiàn)交通立體化管理的基礎(chǔ)元素,然而目前城市交通數(shù)據(jù)普遍面臨數(shù)據(jù)少、質(zhì)量差、呈孤島分布等問題,導(dǎo)致模型構(gòu)建困難,阻礙了智慧城市的發(fā)展,這該如何“破題”?
“任何人工智能應(yīng)用都需要大量真實(shí)數(shù)據(jù)進(jìn)行訓(xùn)練,才能投入實(shí)際應(yīng)用,像計(jì)算機(jī)視覺技術(shù)可以發(fā)展到今天這個(gè)地步,和有海量高質(zhì)量真實(shí)數(shù)據(jù)的知名數(shù)據(jù)集ImageNet是有很大的關(guān)系的?!毕愀劭萍即髮W(xué)教授陳凱對(duì)雷鋒網(wǎng)表示道。

陳凱教授
“但在智慧城市領(lǐng)域,目前還沒有一個(gè)像ImageNet這樣高質(zhì)量的數(shù)據(jù)集,所以在我們項(xiàng)目計(jì)劃中,我們要打造一個(gè)智慧城市領(lǐng)域的數(shù)據(jù)集,我給它起名叫‘CityNet’”
“具體來說,我們計(jì)劃建設(shè)一個(gè)高性能的分布式AI云平臺(tái),叫圖靈平臺(tái),首先我們會(huì)將香港的交通數(shù)據(jù)(交通署、運(yùn)輸署、天文臺(tái)等機(jī)構(gòu)的多模態(tài)數(shù)據(jù)),以隱私保護(hù)和數(shù)據(jù)脫敏的方式實(shí)時(shí)匯入圖靈平臺(tái)上的CityNet,然后利用圖靈平臺(tái)的算力,應(yīng)用圖神經(jīng)網(wǎng)絡(luò)、遷移學(xué)習(xí)、聯(lián)邦學(xué)習(xí)等最新的人工智能技術(shù),對(duì)城市交通流量、人流量實(shí)現(xiàn)精準(zhǔn)的預(yù)測(cè),從而提供精細(xì)的、動(dòng)態(tài)化的城市交通管理?!?/p>
在提出建設(shè)CityNet這一數(shù)據(jù)集的背后,是陳凱教授對(duì)于智慧交通建設(shè)現(xiàn)狀的清楚認(rèn)識(shí),他認(rèn)為,目前智慧交通的建設(shè)存在兩個(gè)問題:
一是不同的數(shù)據(jù)源只能分開分析:現(xiàn)有研究工作多數(shù)只能同時(shí)對(duì)一種數(shù)據(jù)源進(jìn)行分析,但不同類型的數(shù)據(jù)源之間存在關(guān)聯(lián),同時(shí)對(duì)多種數(shù)據(jù)進(jìn)行分析可以提高預(yù)測(cè)系統(tǒng)的準(zhǔn)確性和穩(wěn)定性;
二是不同城市的經(jīng)驗(yàn)知識(shí)無法相互借鑒:每個(gè)城市使用自身數(shù)據(jù)構(gòu)建系統(tǒng)模型,不能有效利用先進(jìn)城市的知識(shí)幫助其他城市構(gòu)建模型,在新城市部署交通流量預(yù)測(cè)系統(tǒng)要重新訓(xùn)練模型,成本較高。
陳凱說道:“大家都在追求新技術(shù)這個(gè)是好事,但就智慧交通來說,目前并沒有一個(gè)頂層的架構(gòu)設(shè)計(jì),也會(huì)出現(xiàn)同類技術(shù)重復(fù)開發(fā)的現(xiàn)象,我們希望用技術(shù)手段推動(dòng)數(shù)據(jù)和算法層面合作,避免機(jī)器學(xué)習(xí)模型的重復(fù)訓(xùn)練,這是我們要建設(shè)圖靈平臺(tái)和CityNet的初衷?!?/p>
“力”的作用是相互的。城市在為CityNet提供數(shù)據(jù)的同時(shí),也可以應(yīng)用CityNet中已有的模型,來建設(shè)智慧城市。
透過陳凱教授的介紹,我們不難發(fā)現(xiàn),CityNet數(shù)據(jù)庫的建設(shè),會(huì)為城市智慧化建設(shè)帶來強(qiáng)有力的幫助。但CityNet數(shù)據(jù)庫要匯聚諸多城市的數(shù)據(jù),數(shù)據(jù)安全則是首要考慮的問題。
當(dāng)前,歐洲、美國(guó)相繼頒布了數(shù)據(jù)隱私保護(hù)法,很多科技巨頭甚至因?yàn)閿?shù)據(jù)安全問題被巨額罰款。
基于此,雷鋒網(wǎng)深入解了陳凱教授團(tuán)隊(duì)是如何應(yīng)對(duì)智慧交通建設(shè)中的隱私安全問題。
在陳凱教授看來,隱私問題不僅僅是一個(gè)監(jiān)管的問題,也是一個(gè)技術(shù)問題?!拔覀?cè)诎袰ityNet 數(shù)據(jù)庫建設(shè)成最大的智慧城市數(shù)據(jù)庫的規(guī)劃中,數(shù)據(jù)隱私安全是很關(guān)鍵的一個(gè)研究課題。”
陳凱繼續(xù)說道:“圖靈平臺(tái)會(huì)對(duì)CityNet 數(shù)據(jù)進(jìn)行統(tǒng)一管理,應(yīng)用聯(lián)邦學(xué)習(xí)和加密計(jì)算等技術(shù),以隱私保護(hù)的方式把 CityNet 數(shù)據(jù)提供給智慧城市的研究者使用,研究者在訓(xùn)練機(jī)器學(xué)習(xí)算法的時(shí)候,無需知道原始數(shù)據(jù)里的私有和敏感信息?!?/p>
聯(lián)邦學(xué)習(xí)則可以讓數(shù)據(jù)不動(dòng),模型動(dòng),通過聯(lián)邦學(xué)習(xí)技術(shù),可以讓使用者不需要知道CityNet的原始數(shù)據(jù)是什么,但仍然能夠?qū)W到知識(shí)。
除了針對(duì)數(shù)據(jù)隱私安全的理論研究之外,經(jīng)過加密后的龐大數(shù)據(jù)對(duì)計(jì)算機(jī)算力的要求提高了十倍甚至更高,那么,這個(gè)時(shí)候,算力也成為了一個(gè)挑戰(zhàn),而這也是陳凱教授擅長(zhǎng)的研究領(lǐng)域之一。

陳凱教授詳細(xì)講解《圖的數(shù)據(jù)流深度學(xué)習(xí)范式》
據(jù)雷鋒網(wǎng)了解,陳凱教授從事大規(guī)模數(shù)據(jù)中心的研究有十多年,在相關(guān)高水平國(guó)際會(huì)議和期刊發(fā)表學(xué)術(shù)論文的數(shù)量居亞洲第一,是系統(tǒng)和網(wǎng)絡(luò)性能優(yōu)化這一領(lǐng)域的帶頭人。
“我們的圖靈平臺(tái)是一個(gè)高性能分布式AI集群計(jì)算架構(gòu),通過高速通信技術(shù)RDMA,提高大型 GPU 集群吞吐量,降低通信延時(shí),提升集群的整體計(jì)算效率,支撐大規(guī)模圖式流數(shù)據(jù)上的深度學(xué)習(xí)和遷移學(xué)習(xí)?!标悇P教授解釋道。
除此之外,陳凱教授還組織了一支集土木工程、信息科學(xué)、計(jì)算機(jī)科學(xué)等多個(gè)領(lǐng)域的專家團(tuán)隊(duì)來共同推進(jìn)項(xiàng)目的研究。
“為了這個(gè)項(xiàng)目我們組成了一支比較綜合的核心團(tuán)隊(duì),由香港科技大學(xué)、香港理工大學(xué)、香港中文大學(xué)的8位教授組成,我們還將組織一支50人左右的團(tuán)隊(duì),讓我們的研究成果可以從科研到展示到實(shí)現(xiàn)項(xiàng)目的真正落地”

陳凱教授和實(shí)驗(yàn)室團(tuán)隊(duì)
談起研究中更長(zhǎng)遠(yuǎn)的目標(biāo),陳凱教授對(duì)雷鋒網(wǎng)說道:“香港的交通比較復(fù)雜,如果我們可以將香港交通做好,其實(shí)對(duì)于其他城市的借鑒意義非常大。如果有成功的經(jīng)驗(yàn)的話,我們會(huì)逐步延伸到粵港澳大灣區(qū)中另外一些交通網(wǎng)比較復(fù)雜的城市。”
2017年,香港特區(qū)政府?dāng)M斥資7億港元發(fā)展智慧城市建設(shè),并公布了未來5年的香港智慧城市發(fā)展藍(lán)圖,其中涵蓋6個(gè)方面,包括智慧出行、智慧生活、智慧環(huán)境、智慧市民、智慧政府以及智慧經(jīng)濟(jì)。

在此次采訪的一個(gè)月前,陳凱教授提出的應(yīng)用在智慧城市中的“高性能分布式基于圖的流數(shù)據(jù)機(jī)器學(xué)習(xí)框架”,獲得了2020/21年度香港政府高達(dá)3300萬「主題研究計(jì)劃」資助。
值得一提的是,「主題研究計(jì)劃」自2011年設(shè)立至今,共計(jì)52位項(xiàng)目統(tǒng)籌負(fù)責(zé)人在列,80%以上為資深講席教授,包括多位國(guó)內(nèi)外科學(xué)院/工程院院士。而陳凱教授是香港「主題研究計(jì)劃」有史以來最年輕的項(xiàng)目統(tǒng)籌負(fù)責(zé)人,
“我們的項(xiàng)目面向智慧城市藍(lán)圖中的三個(gè)場(chǎng)景:交通、健康和經(jīng)濟(jì)。首先落地在智慧交通場(chǎng)景上?!保悇P對(duì)雷鋒網(wǎng)解釋道,“據(jù)相關(guān)數(shù)據(jù)顯示,香港每一公里交通路段上面,有350輛車左右;香港每天乘坐公共交通可達(dá)1200萬人次。我們希望通過人工智能算法提高公共交通的運(yùn)輸線路的效率,縮短人們上下班出行高峰的等待時(shí)間。”
此外,在陳凱教授團(tuán)隊(duì)的規(guī)劃中,下一步還將整合城市交通、公共醫(yī)療、金融方面的真實(shí)的實(shí)時(shí)數(shù)據(jù)。基于這些數(shù)據(jù),就會(huì)為商業(yè)選址、基礎(chǔ)設(shè)施建設(shè)、商業(yè)廣告投放等多個(gè)產(chǎn)業(yè)提供智能化的幫助。
經(jīng)過陳凱教授的介紹,整個(gè)項(xiàng)目框架也逐漸清晰,雷鋒網(wǎng)將其總結(jié)為:
建設(shè)高質(zhì)量的智慧城市數(shù)據(jù)集:通過隱私計(jì)算,數(shù)據(jù)脫敏的方式將香港以及國(guó)內(nèi)外諸多城市的交通數(shù)據(jù)匯入到CityNet數(shù)據(jù)集中;
搭建圖靈平臺(tái):對(duì)CityNet中的數(shù)據(jù)進(jìn)行處理、分析來搭建深度圖神經(jīng)網(wǎng)絡(luò)模型;
通過深度圖神經(jīng)網(wǎng)絡(luò)模型、大數(shù)據(jù)分析與可視化工具,對(duì)城市運(yùn)輸提供精細(xì)的、動(dòng)態(tài)化、自動(dòng)化的城市交通管理,例如: 1)對(duì)城市交通流量、人流量實(shí)現(xiàn)精準(zhǔn)的預(yù)測(cè),輔助實(shí)現(xiàn)精準(zhǔn)交通調(diào)控;2)實(shí)現(xiàn)智能預(yù)警系統(tǒng),對(duì)預(yù)測(cè)車流量超出容量的區(qū)域作為潛在擁堵區(qū)域進(jìn)行報(bào)警;3)分析預(yù)測(cè)城市出行需求與各路線與交通工具的預(yù)計(jì)到達(dá)時(shí)間(ETA),實(shí)現(xiàn)個(gè)性化的最佳出行建議與路線規(guī)劃。
基于在AI算力和數(shù)據(jù)安全領(lǐng)域的不斷探索,2018年,陳凱教授創(chuàng)辦了星云Clustar,持續(xù)在加速AI算力、提高集群計(jì)算效率、保護(hù)隱私安全等方面進(jìn)行研究,致力于將聯(lián)邦學(xué)習(xí),同態(tài)加密,高性能AI集群技術(shù)等最新研究成果應(yīng)用到金融業(yè)、制造業(yè)等其他領(lǐng)域。
相信在不久的將來,我們就會(huì)迎來陳凱教授團(tuán)隊(duì)的捷報(bào)。
在最后,我們也轉(zhuǎn)達(dá)一下陳凱教授對(duì)其智慧城市研究項(xiàng)目的期望:這是一個(gè)非盈利的科研項(xiàng)目,我們希望可以有更多的人能了解圖靈平臺(tái)和CityNet,來做一些貢獻(xiàn),同時(shí)也會(huì)享受到CityNet帶來的回報(bào)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。