微軟開(kāi)源 repo 1.0 ，旨在創(chuàng)造深度學(xué)習(xí)框架通用語(yǔ)言

本文作者：汪思穎

2018-03-25 20:55

導(dǎo)語(yǔ)：號(hào)稱深度學(xué)習(xí)框架的「Rosetta Stone（羅塞塔石碑）」

雷鋒網(wǎng) AI 研習(xí)社按，日前，微軟提出深度學(xué)習(xí)框架的通用語(yǔ)言——repo1.0，號(hào)稱希望通過(guò)構(gòu)建這一深度學(xué)習(xí)框架「Rosetta Stone（羅塞塔石碑）」，讓研究者們能夠在不同框架之間輕松運(yùn)用專業(yè)知識(shí)。他們?cè)诓┛椭兄v解了基準(zhǔn)深度學(xué)習(xí)框架的訓(xùn)練結(jié)果和相應(yīng)的經(jīng)驗(yàn)教訓(xùn)，雷鋒網(wǎng) AI 研習(xí)社編譯整理如下。

大家好，很高興發(fā)布 repo 1.0 版本，目前我們已經(jīng)將其在 GitHub 開(kāi)源，地址如下：

https://github.com/ilkarman/DeepLearningFrameworks

我們相信深度學(xué)習(xí)框架就像語(yǔ)言一樣，就像很多人說(shuō)英語(yǔ)，但每種語(yǔ)言都有各自的使用人群，都有其特定的用法。

我們已經(jīng)為幾個(gè)不同的網(wǎng)絡(luò)結(jié)構(gòu)創(chuàng)建了通用代碼，并將代碼在許多不同的框架中執(zhí)行。

我們的想法是創(chuàng)建一個(gè)深度學(xué)習(xí)框架的「Rosetta Stone（羅塞塔石碑）」——只需要了解一個(gè)框架就能延伸到任何框架，并幫助其他人。之后，可能出現(xiàn)這種情況：一篇論文中的代碼是用其他框架，或者整個(gè)流程都能使用另一種語(yǔ)言。與其利用你最喜歡的框架中從頭開(kāi)始編寫模型，還不如直接使用「其他」語(yǔ)言。

再次感謝 CNTK、Pytorch、Chainer、Caffe2 和 Knet 團(tuán)隊(duì)，以及過(guò)去幾個(gè)月在開(kāi)源社區(qū)中為 repo 做出貢獻(xiàn)的人員。

這次我們發(fā)布的目標(biāo)是如下幾點(diǎn)：

一個(gè)深度學(xué)習(xí)框架的羅塞塔石牌，能讓數(shù)據(jù)科學(xué)家輕松在不同框架間利用其專業(yè)知識(shí)

使用最新最高級(jí)別 API 的最優(yōu) GPU 代碼
比較不同 GPU 的常見(jiàn)設(shè)置（可能是 CUDA 版本和精度）
比較不同語(yǔ)言的常見(jiàn)設(shè)置（Python、Julia、R）
驗(yàn)證安裝之后的性能
不同開(kāi)源社群之間的協(xié)作

基準(zhǔn)深度學(xué)習(xí)框架的訓(xùn)練結(jié)果

下面，我們將帶來(lái)一類 CNN 模型（從預(yù)訓(xùn)練過(guò)的 ResNet50 中提取特征）和一類 RNN 模型的訓(xùn)練時(shí)間。

訓(xùn)練時(shí)間（s）：CNN（VGG-style，32bit）在 CIFAR-10 上進(jìn)行圖像識(shí)別

該模型的輸入是標(biāo)準(zhǔn) CIFAR-10 數(shù)據(jù)集，數(shù)據(jù)集中包含 5 萬(wàn)張訓(xùn)練圖像和 1 萬(wàn)張測(cè)試圖像，均勻地分為 10 類。每張 32×32 的圖像看成 (3, 32, 32) 的張量，像素值從 0-255 調(diào)整至 0-1。

微軟開(kāi)源 repo 1.0 ，旨在創(chuàng)造深度學(xué)習(xí)框架通用語(yǔ)言

處理 1000 張圖片的平均時(shí)間（ResNet-50——特征提?。?/strong>

加載預(yù)訓(xùn)練的 ResNet50 模型，在最后（7、7）的 avg_pooling 截?cái)?，輸?2048D 向量?？梢詫⑵洳迦?softmax 層或其他分類器如增強(qiáng)樹(shù)來(lái)執(zhí)行遷移學(xué)習(xí)?？紤]到 warm start，這種僅前向傳播到 avg_pool 層是定時(shí)的。（注意：批次大小是常量，增加 GPU 內(nèi)存可帶來(lái)性能提升（GPU 內(nèi)存越大性能越好）。

訓(xùn)練時(shí)間（s）：在 IMDB 上，用 RNN (GRU) 執(zhí)行情感分析

該模型的輸入為標(biāo)準(zhǔn) IMDB 電影評(píng)論數(shù)據(jù)集，包含二萬(wàn)五千個(gè)訓(xùn)練評(píng)論和兩萬(wàn)五千個(gè)測(cè)試評(píng)論，數(shù)據(jù)被均勻分成兩類 (正/負(fù))。我們遵循 Keras（https://github.com/fchollet/keras/blob/master/keras/datasets/imdb.py）上的方法，將 start-character 設(shè)置為 1, out-of-vocab (使用三萬(wàn)大小的 vocab) 表示為 2，單詞索引從 3 開(kāi)始。

希望大家都能來(lái)嘗試，增加更多更豐富的數(shù)據(jù)。

以下是一些經(jīng)驗(yàn)教訓(xùn)

使用自動(dòng)調(diào)參：
大多數(shù)框架使用 cuDNN 中的 cudnnFindConvolutionForwardAlgorithm() 進(jìn)行窮舉搜索，優(yōu)化算在固定大小的圖像上的前向卷積算法。這通常是默認(rèn)的，但一些框架可能需要諸如「torch.backends.cudnn.benchmark = True」的標(biāo)記。
多用 cuDNN：
對(duì)于普通的 RNNs(如基本 GRUs/LSTMs)，通?？梢哉{(diào)用 cuDNN 封裝器來(lái)提速，例如用 cudnn_rnn.CudnnGRU() 取代 rnn.GRUCell()。這樣做的缺點(diǎn)是接下來(lái)在 CPU 上進(jìn)行推理可能會(huì)更具挑戰(zhàn)。
形狀匹配：
在 cuDNN 上運(yùn)行時(shí)，匹配 CNNs 中 NCHW 和 RNNs 中 TNC 的原始 channel-ordering，避免在重塑上浪費(fèi)時(shí)間，直接進(jìn)行矩陣乘法。
原始生成器：
使用框架的原始生成器，這樣可以通過(guò)多線程異步來(lái)進(jìn)行增強(qiáng)和預(yù)處理（例如 shuffling），從而加速。
針對(duì)推斷：
要確保指定 flag 來(lái)避免計(jì)算的不必要的梯度，確保 batch-norm 和 drop-out 等層得到合理使用。

當(dāng)我們最初創(chuàng)建 repo 時(shí)，需要使用許多小技巧來(lái)確保框架之間使用的是相同的模型，并且是以最佳的方式運(yùn)行。在過(guò)去的幾個(gè)月里，這些框架的改良速度快得令人難以置信。2017 年末的許多經(jīng)驗(yàn)教訓(xùn)在現(xiàn)在已經(jīng)過(guò)時(shí)了，因?yàn)檫@些框架已經(jīng)更新。

通過(guò)在不同的框架中完成端到端解決方案，可以以多種方式比較框架。由于每個(gè)框架中使用的都是相同的模型結(jié)構(gòu)和數(shù)據(jù)，所以框架間的準(zhǔn)確度非常相似。此外，我們開(kāi)發(fā)的目的是使框架之間的對(duì)比更簡(jiǎn)單，而不是為了加速。

當(dāng)然，我們是為了比較不同框架之間的速度和推理，而不是為了展示框架的整體性能，因?yàn)檫@里忽略了一些重要的對(duì)比，例如幫助和支持、可用的預(yù)訓(xùn)練模型、自定義層和架構(gòu)、數(shù)據(jù)加載器、調(diào)試、不同的平臺(tái)支持、分布式訓(xùn)練等等。我們開(kāi)源 repo 只是為了展示如何在不同的框架上創(chuàng)建相同的網(wǎng)絡(luò)，并評(píng)估在一些特定案例上的性能。

via：https://blogs.technet.microsoft.com

雷鋒網(wǎng) AI 研習(xí)社編譯整理

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

6人收藏

分享：

相關(guān)文章

微軟深度學(xué)習(xí)

遭到欺詐？馬斯克向微軟和OpenAI索賠超9000億元；網(wǎng) ...

直播中被拆掉的小米YU7能否再裝回去？雷軍回應(yīng)；特斯 ...

快手直播間出現(xiàn)大量涉黃內(nèi)容，快手回應(yīng)：遭到黑灰產(chǎn) ...

曝Meta去年靠海量詐騙廣告賺了約160億美元；不到5萬(wàn) ...

汪思穎

編輯

關(guān)注AI學(xué)術(shù)，例如論文

發(fā)私信

當(dāng)月熱門文章

最新文章

2025 年 ACM Fellow 名單公布：鄭宇、梅濤、金海、陳寶權(quán)等 19 名華人學(xué)者入榜

從「工具」到「搭檔」，AI4S 走過(guò)深水區(qū) | 2025年終回顧

Minimax M2.1 實(shí)測(cè)，Coding 多語(yǔ)言能力迎來(lái)重大突破

對(duì)話付昊桓：數(shù)值模擬不能被替代，AI 應(yīng)該放在哪里丨GAIR 2025

全球首個(gè) AI 欺騙系統(tǒng)性報(bào)告：當(dāng) AI 變得更聰明，欺騙便不再是意外

對(duì)話張進(jìn)：當(dāng) AI 不再只靠「看見(jiàn)」去理解世界丨GAIR 2025

熱門搜索

自動(dòng)駕駛深度學(xué)習(xí) 5G 英偉達(dá) 電動(dòng)車 AWS skype 理想汽車 yahoo 電子商務(wù) Echo

微軟開(kāi)源 repo 1.0 ，旨在創(chuàng)造深度學(xué)習(xí)框架通用語(yǔ)言

微軟開(kāi)源 repo 1.0 ，旨在創(chuàng)造深度學(xué)習(xí)框架通用語(yǔ)言