日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
專欄 正文
發(fā)私信給新智元
發(fā)送

5

谷歌在人工智能上下了一盤很大的棋

本文作者: 新智元 2016-04-30 15:26
導語:本文詳盡梳理了谷歌所有的——沒錯,是所有的——人工智能項目及其開發(fā)內(nèi)幕,供你縱覽這家公司打造人工智能帝國的布局。

【雷鋒網(wǎng)導讀】昨日(4月29日)谷歌CEO在年度公開信中寫道,我們將進入人工智能為先的世界,但并沒有透露多少細節(jié)。本文詳盡梳理了谷歌所有的——沒錯,是所有的——人工智能項目及其開發(fā)內(nèi)幕,供你縱覽這家公司打造人工智能帝國的布局。

谷歌在人工智能上下了一盤很大的棋

谷歌如何打造人工智能帝國?

這個搜索巨頭正在將它的人工智能服務(wù)開源,讓每個人都可以使用。2007 年11月,谷歌通過發(fā)布安卓手機開源操作系統(tǒng),為自己在移動市場的支配地位奠定了基礎(chǔ)。八年之后,安卓獲得了80%的市場份額,如今谷歌又故技重施——這次開源的是人工智能。

不久前,谷歌公布了分布式TensorFlow,它的機器學習開源平臺。任何人只要擁有電腦和網(wǎng)絡(luò)連接(并且懂一點點深度學習算法)就能使用有史以來最強大的機器學習平臺。超過50個谷歌產(chǎn)品已采用了TensorFlow ,以便把深度學習(使用深度神經(jīng)網(wǎng)絡(luò)的機器學習)當作工具來操控。這些產(chǎn)品有的能從照片應用程序中認出你和你的朋友,有的能改善谷歌的核心搜索引擎。谷歌已經(jīng)成為了一家機器學習公司。現(xiàn)在谷歌把那些能讓其產(chǎn)品獨一無二的秘方拿了出來,要讓全世界都來使用。

TensorFlow, 人工智能領(lǐng)域的安卓

TensorFlow是一個文件庫,它使得研究者和計算機科學家能夠建造出系統(tǒng),對諸如照片或音頻等數(shù)據(jù)進行分解,并由計算機基于這些信息做出關(guān)于未來的決策。這便是機器學習的基礎(chǔ):計算機去理解數(shù)據(jù),并使用這些數(shù)據(jù)來做出決策。在極端復雜的情形中,機器學習是一種讓計算機變得更聰明的有力武器,而這已屬于更廣泛的、也更難以定義的人工智能領(lǐng)域了。TensorFlow極其復雜,因為它在吸取和輸出數(shù)據(jù)時具有極高的精度和速度。它毫無疑問已經(jīng)屬于人工智能工具的范疇。

這里有個實質(zhì)性的細節(jié):TensorFlow系統(tǒng)使用數(shù)據(jù)流圖。在該系統(tǒng)中,具有多重維度(值)的數(shù)據(jù)從一種數(shù)學計算傳遞到下一種數(shù)學計算。這些復雜的數(shù)據(jù)塊被稱為張量(Tensors),那些數(shù)學計算過程被稱為節(jié)點(nodes)。數(shù)據(jù)從一個節(jié)點到下一個節(jié)點的變化能顯示出數(shù)據(jù)的全面系統(tǒng)關(guān)系。這些張量在節(jié)點圖中流動,而這正是 TensorFlow(“張量流”)這一名稱的由來。

當然,開源的TensorFlow使得研究人員甚至研究生們都有機會用這一專業(yè)級軟件來工作。但這樣做的真實后果是,谷歌將有潛力將其影響力滲透到市場上的每家機器學習公司的研究之中。現(xiàn)在,企業(yè)無論大小——不管是微小的初創(chuàng)公司還是與谷歌并肩的巨頭——都可以啟用TensorFlow系統(tǒng),按自己的需要來調(diào)整它,并使用它來與谷歌進行競爭。最最要緊的是,TensorFlow的發(fā)布使得谷歌這家全球最大的互聯(lián)網(wǎng)公司具有了人工智能領(lǐng)域的權(quán)威地位。

斯坦福的計算機科學教授Christopher Manning三個月前就可以使用TensorFlow,所以他的學生那時起就有機會去擺弄這個系統(tǒng)。經(jīng)過幾周的使用之后,Manning決定他將在自己的課程中使用TensorFlow。除了把TensorFlow 比喻成人工智能界的安卓之外,他還把TensorFlow平臺比作Gmail這個谷歌最普及的郵件服務(wù)。郵件服務(wù)領(lǐng)域仍存在著大量競爭者,但Gmail更干凈,并且在大多數(shù)應用中更可行。

“并不是說,在TensorFlow出現(xiàn)之前不存在任何高水平的深度學習庫?!盡ining 說,“不過大體上,其他庫都是一些三個學者加一個研究生就能搞出來的東西?!?/p>

谷歌在人工智能上下了一盤很大的棋

圖片團隊的研究員 Tom Duerig 說,即使谷歌的雇員能看到用戶的照片,這對公司的研究也沒什么用。

“我們希望能從根本上加速機器學習研究和部署?!?/strong>

盡管像Torch和Theano等其他應用程序也有小的更新,但這次谷歌出動全部研發(fā)力量來發(fā)展其機器學習方面的基礎(chǔ)設(shè)施,這是前所未有的。Manning說,一方面,TensorFlow是谷歌送給機器學習社區(qū)的一份大禮(這份禮物能讓用于優(yōu)化神經(jīng)網(wǎng)絡(luò)的時間減少一百倍),另一方面,谷歌也能通過將該工具開源而間接地獲利。

“少數(shù)幾家公司一直在試圖把人工智能領(lǐng)域中的一大部分有才華者都雇傭到自己手下,特別是在深度學習領(lǐng)域。” Manning說。“谷歌不是慈善機構(gòu)。我可以肯定,當谷歌開放這個平臺后,我們會有許多博士生在大學的時候就已經(jīng)喜歡上谷歌的深度學習工具了?!?/p>

谷歌的頂級工程師,Tensorflow的兩位作者之一(另一位是 Rajat Monga)Jeff Dean在預估機器學習社區(qū)對TensorFlow的采用情況時態(tài)度很謹慎。他說,盡管谷歌在工作中發(fā)現(xiàn)TensorFlow極其有用,但它能否被廣泛采用取決于整個社區(qū)是否覺得TensorFlow很有用。重要的是,為整個社區(qū)提供一個工具,通過使用它人們不僅能更快地構(gòu)建想法,而且能更快地將東西付諸實現(xiàn)。

“基本上,我們希望能加速機器學習研究和部署?!盌ean說。這對社區(qū)來說是一份大禮,同時最理想的情況是,社區(qū)的人們也會進行回饋,將他們與其他研究者(以及谷歌)一起研發(fā)出的東西分享出來?!皺C器學習社區(qū)真的非常擅長改進想法,那真的非常好。不過,要對那些與研究性想法相關(guān)聯(lián)的正在運行的代碼進行改進,那就不太一樣了?!?Dean說。

他也提到TensorFlow將會幫到那些從從谷歌回到校園的實習生,因為現(xiàn)在他們可以進入這個曾經(jīng)為谷歌所專有的系統(tǒng)并繼續(xù)完成他們在谷歌期間尚未完成的工作了。

TensorFlow系統(tǒng)對個體研究者來說是一個十分完整的工具包。該系統(tǒng)是一個完整的獨立運行庫,擁有各種工具和Apache 2.0許可證,因此它也可以在商業(yè)環(huán)境下使用。人們既可以在臺式電腦或筆記本上編輯它,也可以在移動端應用它(首先會發(fā)布安卓版,之后還會推出iOS版)。TensorFlow還會提供學習指南和文檔,以供人們了解如何調(diào)整和玩轉(zhuǎn)這個平臺。

Manning建議,在移動設(shè)備上運行深度學習算法的能力將成為TensorFlow的一個重要特征,將它與其他開源系統(tǒng)區(qū)分開來。

對那些想要直接使用現(xiàn)有系統(tǒng)的人,谷歌提供了一個預編寫二進制版本以便研究者可以直接使用它。它還擁有一個應用程序接口(API),以供軟件開發(fā)者訓練和控制他們的TensorFlow模型。它可不是什么冒牌貨—— 谷歌App以及其他50多個產(chǎn)品都在使用它的系統(tǒng)。

谷歌在人工智能上下了一盤很大的棋

圖片作者 John Chae

谷歌想讓它的AI遍布四方。谷歌的機器學習和人工智能(谷歌更喜歡稱之為機器智能)影響了它的許多著名產(chǎn)品。

谷歌AI實驗室揭秘

谷歌正在向全世界開放這個平臺,這讓我們有機會能瞥見這家公司在發(fā)展機器學習系統(tǒng)方面是怎么想的。

在內(nèi)部,谷歌過去三年都在建造一個大規(guī)模的人工智能平臺,而現(xiàn)在谷歌把它向全世界開放。不過,谷歌自己更愿意稱之為機器智能。他們感到,人工智能這個詞帶有太多的引申含義,而基本上他們想要做的只是在機器中實現(xiàn)真正的智能。

這是他們在公司中已經(jīng)使用過許多年的模型:任何想要玩人工神經(jīng)網(wǎng)絡(luò)的工程師都可以創(chuàng)建自己的系統(tǒng)分支然后去擺弄它。這種開放結(jié)構(gòu)允許公司內(nèi)的100個團隊創(chuàng)建強大的機器學習技術(shù)。

“機器學習是一種核心的、革新性的方式。我們靠它來重新思考我們做事情的方式。” 谷歌CEO Sundar Pichai 在公司2015年十月的電話會議上說?!拔覀冋谟幸獾匕阉鼞糜谖覀兯械漠a(chǎn)品,無論是搜索、廣告、YouTube還是Google Play。我們還處于早期階段,但你將會看到我們在所有這些領(lǐng)域以系統(tǒng)性的方式運用機器學習?!?/span>

歡迎來到谷歌,這里一切皆 AI,AI 乃一切

很難為谷歌的機器智能研究畫出一張詳細的圖,因為它總在改變,而且滲透到了公司中的幾乎每個團隊中。

谷歌的工程副總裁John Giannandrea把這稱為一種“嵌入式模型”。我是在位于加州陽光明媚的山景城的谷歌總部的一座造型優(yōu)美的現(xiàn)代建筑里見到他的。我當時身處一個嚴格來說不對公眾開放的樓層里。在我獨處的間歇里,一位工程師走過來發(fā)現(xiàn)我沒有佩戴員工證。他問我是誰,我說我是一名撰稿人,但這并沒有平息他的疑慮。谷歌以將其研究向公眾開放為榮,但實驗室中的工作仍是嚴格保密的。

對我來說,谷歌的嵌入式模型意味著我需要大量的步行來采訪。谷歌總部包括三百五十萬平方英尺的辦公空間,橫跨七英畝的土地。谷歌員工在辦公樓之間騎車來往,還有許多員工在打理得很好的花園里抱著筆記本電腦,有的在解決復雜的計算機科學難題,有的在趁午后小憩的時間玩Minecraft游戲。不同的團隊在不同的建筑中工作,而嵌入式機器智能的研究者們在團隊間轉(zhuǎn)換的時候,也需要在從一棟樓搬到另一棟樓。

在辦公樓內(nèi)部,我看到的東西和普通辦公樓的樣子差不多。里面有小隔間、電腦、顯示器等等,人們正在以平靜的語調(diào)討論問題并緊張地朝我這個記者投來一撇。墻上有一些凹進去的空間,可以供人打盹——總之,就是這些辦公室里常見的東西。

谷歌在人工智能上下了一盤很大的棋

圖片作者:Dave Gershgorn/Popular Science

谷歌圖片研究人員正在谷歌位于山景城的總部里研究機器智能問題,在一間看起來很平凡的辦公室里。

在組織結(jié)構(gòu)上,這里有一群研究者始終在研究一般性的機器智能問題,并將其工作反饋給谷歌的圖片應用、語音搜索和網(wǎng)絡(luò)搜索等核心產(chǎn)品。還有一些項目,谷歌啟動它們是為了能推動相關(guān)問題的進步。Giannandra舉了手寫文字這個例子。

“我們,作為一個公司,希望能理解人們是怎么寫字的。因此我們會長久地向它投入,即便我們并沒有形成產(chǎn)品?!彼f。

不過,由于谷歌有如此眾多的產(chǎn)品,通常無論研究出了什么東西,總會有一款工具能把它用上。(谷歌的手寫文字技術(shù)最終被用于谷歌的筆記軟件 Google Keep。)

“谷歌總是在尋求更好的語音識別、語言翻譯和語音理解?!?/strong>

當確定了研究出的東西能用在哪里之后,研究人員就會到產(chǎn)品團隊去協(xié)助產(chǎn)品的實現(xiàn)。產(chǎn)品團隊研發(fā)各種我們都在使用的具體應用,例如圖片 App 或谷歌翻譯。

而負責一般性研究的團隊們則按照研究興趣來劃分。有一個團隊聚焦于教計算機學會“看”,另一個團隊致力于理解語言,還有一個團隊尋求更好的語音識別,等等。

“谷歌總是在尋求更好的語音識別、語言翻譯和語音理解——所以,這些計算機科學的前沿研究領(lǐng)域是我們始終都會投入的。”

有超過1000個研究人員在谷歌為這些機器智能應用而工作,并在應用性研究和理論性研究之間不斷切換。有些研究人員在處理一些更簡單的問題,這些問題不需要考慮嚴格意義上的人工智能,而主要是依靠統(tǒng)計性預測方法。

根據(jù)谷歌發(fā)言人Jason Freidenfelds的說法,谷歌那剛剛誕生的母公司Alphabet并不會對谷歌的機器智能研究的進展方式產(chǎn)生太大的影響。這些研究人員仍將在作為子公司的Google中工作,但當他們需要與Life Sciences或 Google X等其他子公司在機器學習應用方面合作時,也不會有任何障礙。

未來之聲

谷歌的眾多工具中的一顆冉冉升起的明星是語音搜索。哪怕你還不知道它到底是什么,你也很可能已經(jīng)使用過它了:它是谷歌搜索條中的那個小小的麥克風圖標,當你按動它后,你就可以通過說話而非打字來進行搜索。這個小麥克風圖標也出現(xiàn)在iPhone和安卓的谷歌搜索App中。在許多智能手機的安卓搜索條中也能發(fā)現(xiàn)它。

盡管從表面上看它只是Siri的一個競爭產(chǎn)品,谷歌語音搜索實際上已成為通向谷歌那巨大的知識庫的第二扇大門。令語言識別團隊感到高興的是,它正在變得越來越受歡迎。

盡管谷歌并未公布語音搜索相比于文字搜索的份額,它仍然提供了一些統(tǒng)計證據(jù):移動搜索如今比桌面搜索更受歡迎,移動語音搜索去年增長了一倍,大約50%的美國手機和平板用戶知道他們可以用語音向谷歌提問,其中三分之一的人曾用語音向谷歌提問過。

盡管谷歌不會公布語音搜索到底有多大的使用量,它的新聞發(fā)言團隊仍然通過上面這一串數(shù)據(jù)讓我確信,語音搜索的使用量極大。

除了每年進行數(shù)百次迭代之外,谷歌搜索這些年大致上仍以原先的方式運行著。不過,要讓人們足夠有信心來對著手機講話,這需要艱苦的拼搏。高級研究員Francoise Beaufays研發(fā)谷歌語音搜索背后的語音識別引擎。他說,用戶之所以越來越多,是因為語音搜索服務(wù)的質(zhì)量提高了。

“當我們剛開始做語音識別時,用戶并不是完全有信心。他們也會用它,但你會發(fā)現(xiàn)有一個延遲,那時候技術(shù)還不像現(xiàn)在這么好。“Beaufays說?!艾F(xiàn)在速度變快了,人們可以方便地在辦公室用語音來做任何事情了?!盉eaufays帶著法語口音,說話很快,而當她談到神經(jīng)網(wǎng)絡(luò)構(gòu)架的市場,語速就更流暢了。她領(lǐng)導語音團隊拋棄了陳舊的、曾用來識別聲音的引擎,并用一種新的、更高級的使用遞歸神經(jīng)網(wǎng)絡(luò)的系統(tǒng)來取代它。

為了讓機器理解語音,它需要首先學會詞和詞組的發(fā)音是怎樣。這意味著,需要大量的音頻文件。這些文件通過算法來處理,該算法會產(chǎn)生一個巨大的圖,圖中包含每個聲音與其他聲音、詞和詞組之間的對應關(guān)系。當一段音頻被呈現(xiàn)給電腦時,它會這樣進行分析:把這段音頻的波形放入圖中移動,試圖從圖中找到一條能最好地解釋這段音頻的路徑。

“在這條路徑的終點將會產(chǎn)生這樣的結(jié)果:‘ 我們檢查了這個聲音序列,這個聲音序列對應于這個詞的序列,而這個詞的序列則構(gòu)成了這個句子?!盉eaufays說。

你每次進行語音搜索時,音頻都會被上傳到谷歌服務(wù)器

這一切都要靠那些最初的音頻文件,這些文件被稱為訓練數(shù)據(jù)。這些訓練數(shù)據(jù)實際上是從真實谷歌用戶的數(shù)百萬條語音搜索中得來。每當你進行語音搜索時,音頻都會被上傳到谷歌服務(wù)器,如果如果你選擇允許谷歌使用這音頻,它就會被谷歌整合到用來訓練機器的音頻庫中去。

不過,數(shù)據(jù)在使用之前還有經(jīng)歷若干步驟。首先(而且對用戶來說最重要的是),所有的用戶信息都被擦除。這意味著,時間戳、位置數(shù)據(jù)和用戶資料等東西都會被擦除。接著這些原始波形被發(fā)送給一位人類速記員,因為算法需要每一段音頻都附有可靠的文字轉(zhuǎn)寫。所有的音頻都需要這種元數(shù)據(jù),而一段“壞”的音頻實際上就是一段未能恰當轉(zhuǎn)寫的音頻。有時候,研究者甚至會為音頻添加人工噪音,以便讓機器能理解不同的詞在不同環(huán)境中聽起來是什么樣。

Beaufays強調(diào),用戶可以選擇是否參與該項目。這很重要,因為隨著谷歌持續(xù)地積累越來越多的關(guān)于世界和關(guān)于我們生活的信息,對隱私的合理關(guān)切正在日益增長。不過如果你不想讓谷歌使用你的語音,你可以拒絕它使用。而且,在使用語音搜索之后,也可以通過若干方式來刪除搜索記錄。

這些技術(shù)使得語音搜索變得更高效。根據(jù)谷歌的說法,兩年前語音搜索錯誤率是25%,這意味著每四個搜索中就有一個返回了錯誤結(jié)果。現(xiàn)在,錯誤率只有8%。

然而,如果谷歌不能利用用戶的數(shù)據(jù)來訓練它的話,會是什么樣?

聰明的Inbox

上周,谷歌宣布它將在電郵服務(wù)中使用人工智能(如果你使用Inbox App這個獨立于Gmail的郵箱服務(wù)的話)。據(jù)Gmail的產(chǎn)品總監(jiān)Alex Gawley說,這也是基于TensorFlow而建立的。

“我們開始看到了我們研究團隊建立的神經(jīng)網(wǎng)絡(luò)的強大力量?!?Gawley說?!坝锌赡?,我們除了理解和組織之外還能協(xié)助做更多的事,也有可能,我們能在寫作郵件之類的事情上幫上忙?!?/p>

Inbox的這一功能被稱為“智能回復”,它本質(zhì)上是一個遞歸神經(jīng)網(wǎng)絡(luò),能夠閱讀你的郵件并將它傳遞給另一個網(wǎng)絡(luò),后者能產(chǎn)生出三個可能的回復。你從中選擇一個,然后發(fā)送郵件。不過,在隱私方面郵件至少像圖片一樣敏感,如果不是比圖片更敏感的話。

要記住,谷歌沒有任何人人會讀到你的郵件。不過,關(guān)于“你做了什么選擇”的數(shù)據(jù)將被傳送回去,用于訓練整個模型。智能回復系統(tǒng)正是靠這來學習的。利用這些數(shù)據(jù),研究者可以讓機器回答某些問題,并發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)中有哪些需要修改的地方。每個人都可以使用這個軟件,這樣,這個智能回復服務(wù)便讓我們能夠窺見谷歌的機器學習產(chǎn)品是如何建造的。Inbox團隊內(nèi)部都在利用這個功能特征來測試機器、告訴機器何為正確何為錯誤,這個過程被稱為“喂狗糧”(dogfooding,這個詞組的原義是,吃自家狗的狗糧。從這個詞組能看出,這些技術(shù)咖有多怪異。)

整個團隊都在使用它,記錄錯誤,并用越來越多的數(shù)據(jù)來喂養(yǎng)它。當這個App在受控環(huán)境中能正確地運轉(zhuǎn),并能被規(guī)?;瘯r,團隊就會發(fā)布這個產(chǎn)品。

一個擁有機器智能的智能手機的終極目標是:它將成為一個真正的數(shù)字個人助理,能進行準確的預測,知識淵博——它將成為你的大腦的一部分,盡管不是天生的部分。

內(nèi)部測試使得研究者們有機會來預測當神經(jīng)網(wǎng)絡(luò)面臨大規(guī)模數(shù)據(jù)時可能出現(xiàn)的錯誤。例如,剛開始時,智能回復服務(wù)傾向于對每個人說“我愛你”。而這是因為,在私人郵件里,“我愛你”是一個非常常見的詞組,所以機器會認為它很重要。

所有這些都是為了讓你的工作更容易些——那也正是該公司大部分產(chǎn)品的目標。 Google Now這個谷歌世界里的個人助理服務(wù),尤其如此。該團隊的口號是“讓對的信息在對的時間出現(xiàn)”,Google Now的負責人, AparnaChennapragada說,當把機器智能建造到這個平臺中去時,需要進行縝密的考量,以便為人的大腦提供協(xié)助。

“你需要挑選出那些對人類很難,但對機器很容易的問題,而不是反著來?!?/strong>Chennapragada說?!拔覀円尲夹g(shù)來為你搬舉重物,這樣你就不需要自己來搬舉重物了?!?/p>

此刻,這個產(chǎn)品正在探索如何用這些方法來讓你的生活變得更輕松容易。 Chennapragada把這和五年前的語音識別研究相類比——Google Now已經(jīng)做都不錯了,但還不能每次都做對。

他們正在探索,如何運用三種不同類型的數(shù)據(jù)形成有趣的信息來為你服務(wù)。他們認為,智能電話是一種“局部注意裝置”,而一個理想的裝置不應該讓你信息過載。

“ 如果你看看我們每個人是如何使用手機的,你會發(fā)現(xiàn)我們是在生活中各種事情的間歇里使用它。使用它時,你在尋找的是一些點點滴滴的信息。”Chennapragada說?!拔覀冊谒伎嫉囊患率?,我們怎樣才能以一種積極的方式代表你行動,隨時隨地的?!?/p>

這便是一個擁有機器智能的智能手機的終極目標:它將成為一個真正的數(shù)字個人助理,能進行準確的預測,知識淵博——它將成為你的大腦的一部分,盡管不是天生的部分。

為了實現(xiàn)這一點,你的手機需要關(guān)于你的數(shù)據(jù):你的時間表,你在搜尋什么,你聽什么音樂,以及你要去哪里。這些是最容易獲取的信息,因為它們已經(jīng)存在于你的手機上了。

“我們在思考的一件事是,我們怎樣才能以一種積極的方式代表你行動,隨時隨地的?!?/strong>

當你把個人信息、通過谷歌知識圖譜(這個隨后再講)得到的關(guān)于世界的信息和來自其他用戶的信息聯(lián)合起來時,世界將來到你的指尖?;蛟S你不知道如何開車去機場,但你的手機知道。

關(guān)于谷歌利用眾人信息的方式的另一個例子是測量道路交通情況。通過從高速公路上的手機中提取匿名位置數(shù)據(jù),谷歌可以辨認出汽車們比平時開得慢。同理,也能辨認一家飯館或是咖啡館擁擠不擁擠。

Google Now 代表了谷歌使用人工智能的方式。他們意識到,那種能轉(zhuǎn)化圖片并告訴你圖片里有什么的一般性智能模型離我們還有好些年的距離。所以現(xiàn)在,他們在創(chuàng)造由一個個工具組成的聯(lián)合體,這些工具能協(xié)調(diào)一致地為用戶提供最好的體驗。

組織全世界的信息

好了,上文我提到Google Now借助知識圖譜來工作。什么是知識圖譜呢?

前谷歌研究院負責人John Giannandrea是2010年加入谷歌的。他曾建立了一家 名叫Metaweb的公司,該公司能把互聯(lián)網(wǎng)上的文本和對象聯(lián)接起來。它是一種與搜索服務(wù)相平行的邏輯服務(wù)——通過它不僅能搜索到想找的東西,而且能搜索到與之類似的東西和信息。很久之前,當他還是網(wǎng)景公司的首席技術(shù)官的時候,他就在做這件事了。(你還記得網(wǎng)景公司嗎?)

這一切都體現(xiàn)在知識圖譜中。知識圖譜于2012年首次亮相。當你搜索某個事實時,它就會以相關(guān)信息和文字的方式彈出來。如果你搜索《大眾科學》雜志何時建立,谷歌就會告訴你答案(“1872”)。

這就是谷歌的做法:不僅要為互聯(lián)網(wǎng)編制目錄索引,而且要讓互聯(lián)網(wǎng)變得對用戶來說更好用、更有用。這也是人工智能第一次闖入谷歌的主要業(yè)務(wù)——搜索。從那時起,谷歌把它15%的日常搜索業(yè)務(wù)都交給了一個名叫 RankBrain的人工智能模型。這個系統(tǒng)實現(xiàn)的是常識意義上的搜索——它要處理那些傳統(tǒng)算法無法搞定的查詢。

除了把它整合進谷歌的核心搜索算法并把它擴展到產(chǎn)品中之外,谷歌還打算做一些登月級的神奇工作。在這方面,他們的靠山是Geoff Hinton。

Hinton是人工智能界最杰出的思想家之一——人們經(jīng)常把他的名字與Facebook的YannLeCun,谷歌的Andrew Ng(注:已轉(zhuǎn)到百度)以及YoshuaBengio等人相提并論。(實際上,LeCun,Hinton和Bengio 還在五月份的《自然》雜志上寫了一篇深度學習綜述,這篇綜述讀起來像一篇人工智能的教材。)

“在魔術(shù)和神秘之間有一條很細的線,我們希望讓自己處于正確的一邊。”

與Hinton對話,就像在于一個生活在未來五年之后的人對話。我們的對話圍繞著怎樣將文檔變成思維向量,以便機器能理解和記住冗長的數(shù)據(jù),并能通過逆向工程獲得我們大腦用于學習的算法。

例如,現(xiàn)在的許多計算機程序在分析文本的意義時,是通過查詢文檔中的單詞的詞典定義和語法這樣的蠻力。然而,要想像人一樣去理解文檔,理想情況下計算機就需要能夠?qū)⑽臋n分解為一系列不同的思想?!?/span>

谷歌將會樂于能夠記錄,并找到其中的原理是什么,文檔里說了什么,一種想法是怎么從前面的想法中流過來的”,Hinton說,“如果我們可以開始做到這些,那么機器能給你更好的答案,因為他真正地讀了文件并理解了?!?/span>

當問及為什么這一點還沒有實現(xiàn)時,Hinton說,如果我們想要讓機器與大腦的理解力相匹配,問題在規(guī)模方面。研究者現(xiàn)在使用的人工神經(jīng)網(wǎng)絡(luò)不具有我們大腦的復雜性,哪怕把規(guī)模擴大到目前的極限也達不到。最好的系統(tǒng)或許擁有數(shù)億個需要操作的權(quán)重(在講述如何操作權(quán)重時,LeCun把它們類比為一個外表面上有一百萬個旋鈕的黑盒子。)然而,我們的大腦有上百萬億個需要操作的權(quán)重——這意味著大腦要處理的信息要高上十萬倍。

盡管被規(guī)模問題所阻撓,Hinton仍然很樂觀,認為人工智能研究的這一特征并不會像過去一樣使它夭折。(人工智能曾經(jīng)歷過“凜冬”,那時進展總是無法滿足預期,投資也退縮了。)這種樂觀的一個主要原因是,前面提到的思維向量的觀念正在變得日益流行。不過,在Hinton看來,最讓他感到安慰的是過去五年來的進展,特別是在對象識別和語音領(lǐng)域。過去這些問題常常被認為是太復雜了,而現(xiàn)在,它們在標準化測試中的錯誤率已戲劇性地下降。

“它們的表現(xiàn)正在接近人類水平。”

“它們的表現(xiàn)正在接近人類。不是在所有方面,而是在像對象識別這樣的方面。幾年前,做計算機視覺的人還會告訴你,‘不,很多年之內(nèi)計算機都達不到那樣的水平?!?所以,我們有理由保持樂觀?!盚inton說。

不過,無論機器能多么好地補充或模擬人腦,如果普通人不明白該怎么使用它,它就毫無意義。所以谷歌才會打算以這種方式來統(tǒng)領(lǐng)人工智能——讓它在使用者面前盡可能地簡單。幕布背后的計算過程是復雜而動態(tài)的,而它所輸出的結(jié)果卻是人人都能用的工具以及可供改善這些工具的手段。如果你想的話,可以用這些手段來改善這些工具。

“在魔術(shù)和神秘之間有一條很細的線,我們希望讓自己處于正確的一邊?!盙oogle Now的Chennapragada說。

【編者注】本文原刊于2015年年底。2016年,谷歌在人工智能領(lǐng)域大步進展,回溯去年谷歌在該領(lǐng)域的大動作,可以窺見一個人工智能帝國正在慢慢成型。


雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

谷歌在人工智能上下了一盤很大的棋

分享:
相關(guān)文章

產(chǎn)業(yè)鏈媒體

「新智元」深度鎖定人工智能及機器人產(chǎn)業(yè)鏈,關(guān)注產(chǎn)業(yè)前沿資訊,聚集學術(shù)和產(chǎn)業(yè)領(lǐng)袖,共同建構(gòu)智能 + 產(chǎn)業(yè)的新紀元。
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄