日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給楊文
發(fā)送

0

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

本文作者: 楊文 2018-04-12 23:50
導語:本文分享了無監(jiān)督學習和情景化學習的一些最新進展,其中包括一篇 ICLR Oral 論文的解讀

雷鋒網(wǎng)AI科技評論按:近幾年,由于深度神經(jīng)網(wǎng)絡的快速發(fā)展,自然語言處理借此取得了重大突破,但同時也達到了它的發(fā)展瓶頸期。因此,研究如何讓 AI 像人類一樣去學習自然語言成為了現(xiàn)在研究者們最關心的問題。

近期,在雷鋒網(wǎng) GAIR 大講堂上,來自卡內基 · 梅隆大學三年級博士生楊植麟同學分享了無監(jiān)督學習和情景化學習的一些最新進展,其中包括一篇 ICLR Oral 論文的解讀。視頻回放地址:http://www.mooc.ai/open/course/472

楊植麟,卡內基梅隆大學博士三年級,師從蘋果人工智能主任 Ruslan S.,主要研究無監(jiān)督深度學習及其在自然語言理解的應用;過去兩年在 ICLR/NIPS/ICML 等人工智能頂會發(fā)表 11 篇文章 (9 篇一作);曾在 Facebook 人工智能實驗室從事研究工作,本科以年級第一畢業(yè)于清華計算機系。

分享主題:讓人工智能像人類一樣學習自然語言:無監(jiān)督學習和情景化學習的最新進展

分享提綱

  • 無監(jiān)督學習:高秩自然語言模型 (ICLR 2018)

  • 基于生成式模型的半監(jiān)督學習:利用無標注文本提升問答 (ACL 2017, NIPS 2017)

  • 情景化學習:土耳其機械勇士下降法 (ICLR 2018) 

分享內容:

近幾年,深度神經(jīng)網(wǎng)絡在自然語言學習任務上取得眾多突破,但是仍然依賴于大規(guī)模靜態(tài)標注數(shù)據(jù)。與此相反,人類學習語言的時候并不需要大規(guī)模監(jiān)督信號,并且可通過與環(huán)境的交互理解語言。

先來回顧一下近些年 NLP 發(fā)展的狀況。NLP 發(fā)展的黃金時期出現(xiàn)在 2013 年末和 2014 年這段時間。這段時間出現(xiàn)三個非常重要的技術:Word embeddings;Seq2seq;Attention,這三項技術基本奠定了 2014 年之后的 NLP 發(fā)展基礎。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

從2015年到現(xiàn)在,大家做的主要事情就是把三個技術都用上,做各種各樣的變種,用在不同的任務上來檢驗模型效果。單從效果上來看,還是有到很多突破的。但有兩點需要注意,依賴監(jiān)督學習可能已經(jīng)做到了極限;監(jiān)督學習有兩個問題,一是依賴大規(guī)模標注數(shù)據(jù)集,二是依賴靜態(tài)數(shù)據(jù)集。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

反觀人類是如何學習語言的?人類只需要非常少的監(jiān)督信號,通過動態(tài)與環(huán)境交互,在環(huán)境中執(zhí)行一些行為,得到一些反饋,進行學習語言。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

如果讓機器像人類一樣學習,就需要突破監(jiān)督學習的瓶頸。接下來講的就是在這一方面的探索,怎樣讓機器像人類一樣學習自然語言。

先看一下這個,Mastering the Dungeon : Grounded Language Learning by Mechanical Turker Descent。其中的

Mastering the Dungeon 是我們創(chuàng)造的一個游戲環(huán)境,Mechanical Turker Descent 是我們發(fā)明的算法名字。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

圖中的兩個人(Turker1 和 Turker2)相當于平臺上的兩個用戶。他們每個人負責訓練一個 dragon,如果 dragon 贏了,對應的人會獲得獎勵。這樣 Turker 就會受到激勵,會給 dragon 更好的樣本學習,讓它在比賽中擊敗其他 dragon。

下圖反應了 dragon 在游戲環(huán)境中具體是如何交互學習的,以及具體的游戲環(huán)境是怎么樣的。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

這個交互學習算法的名字叫 Mechanical Turker Descent。第一步,每一個 Turker 會給 dragon 一些訓練數(shù)據(jù),第二步,用數(shù)據(jù)集訓練出一個模型。第三步,這些模型會放在其他數(shù)據(jù)集上交互驗證,每個模型會得到分數(shù),獲得高分的 Turker 會獲得獎勵。第四步,所有的數(shù)據(jù)將合并起來,進入下一輪,直到訓練出比較好的 agent。

這個算法其實既有比賽,又有合作。Turker 為了贏得獎勵,所以他們之間相互比賽,促使他們提供更好的數(shù)據(jù)給 dragon。同時他們又是合作的,在每一輪結束后都會把數(shù)據(jù)合并起來進入下一輪,這些數(shù)據(jù)在下一輪都會共享。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

這樣的算法有四個優(yōu)點:

  • 第一,避免數(shù)據(jù)樣本太簡單,因為每個 Turker 都是在對方的數(shù)據(jù)集上做驗證,如果太簡單,就會導致對方的分數(shù)比自己高。

  • 第二,避免數(shù)據(jù)樣本太難,如果樣本太難,就不可能訓練出模型,同樣不能贏得比賽。

  • 第三,難易度適中的數(shù)據(jù)可以動態(tài)適應模型學習的能力。

  • 第四,很難通過作弊獲得好成績。

游戲環(huán)境和任務設置

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

實驗結果

通過實驗得出幾點結論,實驗中的交互學習算法確實比傳統(tǒng)通過標記數(shù)據(jù)的靜態(tài)學習效果要好。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

limit 是指限制 Turker 每一輪給的訓練數(shù)據(jù)數(shù)量。在給同樣獎勵的情況下,發(fā)現(xiàn)如果不限制 Turker,他會多給 dragon 30% 的數(shù)據(jù),最終的模型表現(xiàn)效果也較好。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

在模型有反饋和沒有反饋的兩種不同情況下,其性能表現(xiàn)也有很大的差別。如果把模型反饋去掉,所有的指標都會下降,說明動態(tài)調整訓練數(shù)據(jù)的動態(tài)分布是非常重要的。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

接下來為大家介紹一篇 ICLR Oral 論文。論文題目為:Breaking the Softmax Bottleneck A High-Rank RNN Language Model。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

我們首先證明了softmax存在表達能力上的根本缺陷,繼而提出了混合softmax (mixture of softmaxes)的方法,先算K softmaxes,然后用weighted sum得到最后的概率。這個方法在大家常用的語言模型數(shù)據(jù)集中,取得了當前最好的結果。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

由于篇幅限制,這里就不做文字解讀了,大家如果感興趣可以直接去看這篇論文或者觀看視頻回放:http://www.mooc.ai/open/course/472

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

小結

未來最重要的兩個研究方向,一個是無監(jiān)督學習,另一個是 language grounding。

無監(jiān)督學習可以學習有價值的和可傳遞的特征表示,可以改善低資源和高資源任務; 可以用于監(jiān)督或無監(jiān)督任務的元學習。language grounding 可以提供足夠復雜的環(huán)境,是一種非常有效的學習算法。

以上就是本期嘉賓的全部分享內容。更多公開課視頻請到雷鋒網(wǎng) AI 慕課學院觀看。

關注微信公眾號:AI 科技評論,可獲取最新公開課直播時間預告。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

CMU博士生楊植麟:如何讓AI像人類一樣學習自然語言?| 分享總結

分享:
相關文章

編輯&記者

AI科技評論員,微信:yeohandwin
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說