日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給楊鯉萍
發(fā)送

0

競技世界首席數(shù)據(jù)科學家巴川:數(shù)據(jù)科學,未來或?qū)⒊蔀槊褡搴诵母偁幜?

本文作者: 楊鯉萍 2019-09-26 18:22
導語:怎樣才能在大數(shù)據(jù)時代浪潮,翻出最美浪花

雷鋒網(wǎng) AI 開發(fā)者按:09 月 21 日,CCF TF 第 22 期「數(shù)據(jù)驅(qū)動」主題會議順利舉辦。本次會議主席由競技世界首席數(shù)據(jù)科學家巴川擔任,會議特別邀請了來自學界與業(yè)界的多位大咖共同探討數(shù)據(jù)驅(qū)動技術(shù)在生活與生產(chǎn)中的應用與價值。特邀嘉賓包括:清華大學計算機系教授兼軟件所所長李國良、河北省大數(shù)據(jù)計算重點實驗室副主任劉晶、京東數(shù)科智能城市事業(yè)部數(shù)據(jù)管理平臺部負責人鮑捷、滴滴出行高級數(shù)據(jù)科學家繆瑩瑩以及餓了么研究員傅周宇。

大數(shù)據(jù)時代已經(jīng)到來,針對當下 AI 與數(shù)據(jù)驅(qū)動的痛難點和未來發(fā)展趨勢,會議細節(jié)設置部署,以及對數(shù)據(jù)驅(qū)動相關(guān) AI 學術(shù)青年的發(fā)展方向,雷鋒網(wǎng) AI 開發(fā)者獨家訪問了巴川主席,并在不改變原意的情況下,將采訪內(nèi)容整理如下。

競技世界首席數(shù)據(jù)科學家巴川:數(shù)據(jù)科學,未來或?qū)⒊蔀槊褡搴诵母偁幜?  src=

巴川,資深數(shù)據(jù)科學家

曾就職于中國搜索、搜狐暢游等,主要從事互聯(lián)網(wǎng)數(shù)據(jù)挖掘,現(xiàn)任競技世界(北京)網(wǎng)絡技術(shù)有限公司首席數(shù)據(jù)科學家

主要研究領(lǐng)域包括互聯(lián)網(wǎng)用戶行為挖掘、產(chǎn)品運營分析、社交網(wǎng)絡挖掘、反作弊、風控體系、推薦系統(tǒng)、數(shù)據(jù)可視化等

數(shù)據(jù)、技術(shù),誰主浮沉

AI 開發(fā)者:作為一名資深數(shù)據(jù)科學家,你認為數(shù)據(jù)的核心價值在哪里?

巴川:現(xiàn)在的數(shù)據(jù)技術(shù)發(fā)展于社會的意義遠遠大于其商業(yè)價值。數(shù)據(jù)工作本身是在大數(shù)據(jù)中尋找數(shù)據(jù)背后的數(shù)學規(guī)律,而對數(shù)學規(guī)律的掌握將是社會變革的重要動力,它可能促進整個社會的發(fā)展;尤其在當下世界格局競爭激烈的時候,大數(shù)據(jù)的挖掘與研究將很有可能成為民族的核心競爭力。

AI 開發(fā)者:對數(shù)據(jù)挖掘與處理的難點又主要體現(xiàn)在哪些方面?

巴川:數(shù)據(jù)挖掘與處理難點主要在數(shù)據(jù)獲取階段。

一方面在于數(shù)據(jù)本身,如果你獲得的數(shù)據(jù)質(zhì)量較差,得到的結(jié)果也不會太好。因此數(shù)據(jù)獲取的全面性和質(zhì)量將對于研究結(jié)果有很大的影響。而關(guān)于用戶隱私問題,則是數(shù)據(jù)獲取難的另一原因。因為數(shù)據(jù)獲取可能會侵犯到他人的隱私,所以在數(shù)據(jù)的使用過程中,我們需要小心謹慎的對待數(shù)據(jù),通常我們也會進行一定的脫敏操作,盡可能在保護用戶隱私和給用戶提供便利之間找一個平衡點。

因此總體來講,怎樣能夠既便捷又規(guī)范的獲取質(zhì)量較高的數(shù)據(jù),這個是我們在數(shù)據(jù)獲取中需要重點解決的難題。

AI 開發(fā)者:目前,深度學習的結(jié)果很依賴于數(shù)據(jù),你認為可以從哪些方面實現(xiàn)改進與突破呢?

巴川:通常來講,研究人員利用數(shù)據(jù)進行深度學習的過程中主要用到了神經(jīng)網(wǎng)絡技術(shù),而神經(jīng)網(wǎng)絡具有可驗證不可解釋的特點。因此,從技術(shù)角度來看,研究神經(jīng)網(wǎng)絡等相關(guān)技術(shù)的可解釋性,可能會是一個很好的突破點。一旦算法可解釋性變強,它對數(shù)據(jù)的依賴就會大大降低。

不過,如果想得到更好的結(jié)果,仍然需要數(shù)據(jù)的「質(zhì)」和「量」進行輔助。只有數(shù)據(jù)與算法兩者綜合發(fā)展,才能得到更準確更完美的結(jié)果。

AI 開發(fā)者:那在你看來,技術(shù)與數(shù)據(jù)之間是一種什么樣的關(guān)系?

巴川:兩者的關(guān)系總體上可以概括為「技術(shù)的發(fā)展有賴于好的數(shù)據(jù),數(shù)據(jù)本身的獲取和價值挖掘也有賴于技術(shù)的發(fā)展,兩者就好比廚師與食材的關(guān)系」。當然,兩者的發(fā)展都有一個共同的目的,即幫助我們改善生活和生產(chǎn)。

AI 開發(fā)者:數(shù)據(jù)驅(qū)動目前主要都應用在哪些方面?這些領(lǐng)域的發(fā)展是怎樣的呢?

巴川:數(shù)據(jù)技術(shù)與 AI 的發(fā)展,在行業(yè)里的表現(xiàn)基本是一個輪動的狀態(tài)。例如:互聯(lián)網(wǎng)領(lǐng)域現(xiàn)在的發(fā)展雖然可達八九十分,但它依舊在爆發(fā)式增長,其中很大原因是由于互聯(lián)網(wǎng)產(chǎn)品傳播效果好,所以有些應用能直擊用戶癢點時就會產(chǎn)生病毒式傳播。而金融、電信、政務等行業(yè)的數(shù)據(jù)技術(shù)應用,在國家的大力推動下,發(fā)展比較穩(wěn)健,僅次于互聯(lián)網(wǎng)。至于另外一些傳統(tǒng)行業(yè),它們的數(shù)據(jù)盡管還沒能得到很好的開發(fā),相對于前幾個行業(yè)可能有所滯后,但這也將會是未來發(fā)展的目標之一。

競技世界首席數(shù)據(jù)科學家巴川:數(shù)據(jù)科學,未來或?qū)⒊蔀槊褡搴诵母偁幜?  src=

圖 1 競技世界首席數(shù)據(jù)科學家巴川老師 CCF TF 大會演講現(xiàn)場

AI 開發(fā)者:在你所說的輪動領(lǐng)域里面,你比較看好哪個領(lǐng)域?

巴川:目前以及未來三年內(nèi),我覺得最熱的可能還是能直接刺激人們生活的領(lǐng)域,即與互聯(lián)網(wǎng)相關(guān)的行業(yè)。然后可能是金融,金融科技領(lǐng)域這幾年已經(jīng)蠢蠢欲動,也許它將成為數(shù)據(jù)驅(qū)動未來的黑馬之一。而對于傳統(tǒng)行業(yè)的升級改造,有很多的前期準備工作要做,可能需要一定的時間,才能使得數(shù)據(jù)驅(qū)動技術(shù)在這些行業(yè)得到較快的發(fā)展。

AI 開發(fā)者:我們知道競技世界在做游戲方面也非常厲害,你認為數(shù)據(jù)驅(qū)動和游戲之間的關(guān)系是怎樣的呢?

巴川:競技世界主要是一個互聯(lián)網(wǎng)平臺,已擁有超過 5 個億的足夠大的用戶量,使得跟數(shù)據(jù)相關(guān)的技術(shù)更易于推進。通過對大量數(shù)據(jù)的分析,我們可以非常直觀的去解決很多問題,包括:在游戲發(fā)行階段怎么樣去獲客,在運營階段怎么樣去促活以及怎么樣最大化創(chuàng)收等。因此,數(shù)據(jù)驅(qū)動和游戲之間有著越來越緊密的聯(lián)系。

洞見 AI 之未來

AI 開發(fā)者:大數(shù)據(jù)、機器學習、AI 相關(guān)的概念,近年來越來越火熱,你如何看待近幾年 AI 領(lǐng)域的快速增長?

巴川:總體上,我把大數(shù)據(jù)、機器學習、AI 都理解為關(guān)于數(shù)據(jù)的技術(shù)。這些技術(shù)通過利用數(shù)據(jù)來模仿人類的一些行為,從而改善我們的生活和生產(chǎn)。

因此,所謂的爆發(fā)式增長,更多的是應用領(lǐng)域,這屬于順應時代發(fā)展與需求的一種現(xiàn)象。而究其根本,這一現(xiàn)象主要是得益于算力的增長,即計算機硬件的發(fā)展在 AI 技術(shù)的爆發(fā)式增長方面起著極其重要的作用。

AI 開發(fā)者:那么,你認為目前技術(shù)突破的主要難點在哪呢?

巴川:技術(shù)的發(fā)展與算法革新有很大的關(guān)系,而技術(shù)突破的難點也主要在于算法方面。

通常,底層的算法更偏數(shù)學化,需要更嚴謹更強大的理論支撐進行驗證說明,相對于應用方面,理論發(fā)展則非常緩慢,往往一個革命性算法的誕生,可能需要十幾年,甚至幾十年。

AI 開發(fā)者:面對當下大力發(fā)展應用而較少人專心投入技術(shù)研究的現(xiàn)狀,你是怎么看待其中利弊的呢?

巴川:總體來看,現(xiàn)在是一個良性的階段。

應用的大力發(fā)展本身會帶來一定的利益驅(qū)動,以及整體社會的關(guān)注度。在這樣的大環(huán)境下,技術(shù)的發(fā)展自然能夠得到很大推動力量,進而促使理論研究的人力投入增加,最終帶動技術(shù)的發(fā)展。所以,我們也無須過分關(guān)注當下,時間或許能證明一切。

AI 開發(fā)者:目前,哪些行業(yè)在 AI 的應用中受益比較大呢?

巴川:從企業(yè)的角度來看,勞動密集型、重復性勞動較多的企業(yè)受益會比較大,因為用機器替代人可以節(jié)省很大的勞力成本,比如:客服機器人、工業(yè)機器人等。

而從人的角度來看,受益較大的是原來從事跟數(shù)據(jù)技術(shù)相關(guān)的崗位,比如:做 AI、做大數(shù)據(jù)、做深度學習方面的人才。

AI 開發(fā)者:時下深度學習也是非?;馃岬念I(lǐng)域之一,那你認為 AI 的下一波爆發(fā)高潮會是什么時候,或者在怎樣的契機下產(chǎn)生呢?

巴川:無論是機器學習,還是深度學習、遷移學習、強化學習等,這些名詞都不是最重要的,它們只是隨著各種新技術(shù)而產(chǎn)生的代號。因此,如果從宏觀層面來談爆發(fā)高潮的話,這些數(shù)據(jù)技術(shù)一直都處于爆發(fā)式增長的高潮之中,并且這樣的狀態(tài)還將持續(xù)至少 3-5 年。

AI 開發(fā)者:那你認為 AI 應用開發(fā)的未來發(fā)展趨勢是怎樣的呢?

巴川:現(xiàn)在 AI 的應用主要集中在互聯(lián)網(wǎng)行業(yè),但很多傳統(tǒng)行業(yè),比如:礦產(chǎn)、化工等行業(yè),AI 技術(shù)應用得很少。

總體來看,如果 AI 應用在互聯(lián)網(wǎng)方面的開發(fā)能夠達到八九十分,可能金融、政務能達到六十多分,而一些傳統(tǒng)行業(yè)可能還處于三四十分甚至更低的不及格階段。但往往新的領(lǐng)域,會有更強的爆發(fā)力,所以我認為 AI 未來的發(fā)展總體上會是一個版塊輪動的狀態(tài)。

數(shù)據(jù)科學家的神秘面紗

AI 開發(fā)者:作為本次 CCF TF 會議的召集人,整個議程的設置,包括選題、嘉賓的邀請你是出于怎樣的考量呢?

巴川:這次請的嘉賓既有學術(shù)界的大牛,也有企業(yè)界的大咖,這正和 CCF TF 的宗旨與口號——「只為技術(shù)專家」相契合。

特邀嘉賓包括學術(shù)界的清華李國良教授、河北工業(yè)大學劉靜教授,企業(yè)界的滴滴、餓了么、京東知名互聯(lián)網(wǎng)企業(yè)里的數(shù)據(jù)專家。因此,本次大會我們主要希望能夠進一步促進產(chǎn)學融合,增加產(chǎn)學互動交流。

而在議題方面,我們既有「數(shù)據(jù)驅(qū)動生活」又有「數(shù)據(jù)驅(qū)動生產(chǎn)」主題。其中李國良教授講的題為「AI 原生數(shù)據(jù)庫」,看似跟數(shù)據(jù)驅(qū)動關(guān)系不大,但對于數(shù)據(jù)庫的管理員來說,對數(shù)據(jù)庫的優(yōu)化也屬于數(shù)據(jù)驅(qū)動的重點內(nèi)容。而劉晶教授的議題是數(shù)據(jù)驅(qū)動傳統(tǒng)行業(yè)的升級改造。滴滴、餓了么、京東的議題則是用數(shù)據(jù)驅(qū)動改善我們的生活。

總體來講,本次會議中我們既有數(shù)據(jù)驅(qū)動生活,又有數(shù)據(jù)驅(qū)動生產(chǎn),還包含了數(shù)據(jù)庫系統(tǒng)優(yōu)化,這是一場討論較為全面的數(shù)據(jù)驅(qū)動主題大會。

競技世界首席數(shù)據(jù)科學家巴川:數(shù)據(jù)科學,未來或?qū)⒊蔀槊褡搴诵母偁幜?  src=

圖 2 CCF TF 「數(shù)據(jù)驅(qū)動」圓桌會議現(xiàn)場

AI 開發(fā)者:具備哪些能力的人,更有可能成為一名優(yōu)秀的數(shù)據(jù)科學家?

巴川:我一直都帶著既嚴謹負責的態(tài)度對待數(shù)據(jù)又樂觀活潑的心態(tài)去使用數(shù)據(jù)。這不僅能夠保證結(jié)果的合理性和嚴肅性,還能幫助你獲得一些非常有價值的出乎意料的結(jié)果。

同時,數(shù)學和編程都是數(shù)據(jù)科學中很重要的內(nèi)容。數(shù)學基礎常常能夠決定你將來走多高、多遠;而編程能力則能夠更直接的實現(xiàn)創(chuàng)意。在很多數(shù)據(jù)技術(shù)全面開發(fā)時,通過動手能力和編程能力去實踐自己的想法,尤其是快速實現(xiàn)自己的想法,可能會讓你很大程度上受益。

AI 開發(fā)者:我們都知道,除了數(shù)據(jù)科學家的身份之外,你還是眾多名校的老師,你是怎么處理這兩個身份之間的關(guān)系呢?

巴川:用四個字概括,即教學相長。

一方面,我在企業(yè)做數(shù)據(jù)科學時會積累很多項目經(jīng)驗,將這些經(jīng)驗傳授給學生的過程本身就是很快樂的。而另一方面,于我而言,學生給我的啟發(fā)以及眼界上的拓寬也讓我受益頗豐。這既是一個教學的過程又是一個同行交流的過程,所以我可能在一個學期內(nèi),教給他們十幾種算法和案例,他們則每個組反饋給我一個案例,進而增加我的案例庫,在這一過程中,我也得到了很快的成長。

AI 開發(fā)者:對于 AI 開發(fā)者或者 AI 專業(yè)的學生,你有什么想要傳達給他們嗎?

巴川:成功其實是必然和偶然的結(jié)合。少一點功利心,多一點童心,報著好奇的探索欲去看待這個世界,再將自己的技術(shù)運用到該用之處,你就很有可能在大數(shù)據(jù)浪潮中,翻出屬于自己的浪花。有時候,盡管新潮是很大的誘惑,但是只有既保持對這個行業(yè)的嚴肅性,同時又保持自己的初心,才能愈發(fā)長遠地發(fā)展下去。

雷鋒網(wǎng) AI 開發(fā)者 雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

競技世界首席數(shù)據(jù)科學家巴川:數(shù)據(jù)科學,未來或?qū)⒊蔀槊褡搴诵母偁幜? src=

分享:
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說