日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
國際 正文
發(fā)私信給亞萌
發(fā)送

1

被諷刺了但卻沒意識到?這個神經網絡來幫你

本文作者: 亞萌 2016-08-05 19:22
導語:在網絡上,用文字交流,有一個危險之處,那就是當別人在嘲諷你的時候,你會意識不到

在網絡上,用文字交流,有一個危險之處,那就是當別人在嘲諷你的時候,你會意識不到,反之有時,你明明沒有嘲諷的意思卻被對方誤會。比如,有時當某人跟評論說“真棒”的時候,你不知道他真的覺得這個東西好呢,還是在反諷。

被諷刺了但卻沒意識到?這個神經網絡來幫你

最近,來自西班牙里斯本大學的研究人員引用了新型的深度神經網絡CUE-CNN,能自動識別社交媒體上具有嘲諷意義的言論。 這不僅會避免日常文字對話時的小尷尬, 而且對于人工智能領域的自然語言處理來說,知道某一句話是否是諷刺,這一點尤其顯得重要。

但是這不是一個簡單的問題。通常來說,計算機要理解一句話是否具有諷刺意思,需要結合上下文的語境,從文本本身尋找信息,但是會遇到語境不足的問題。畢竟,包括標點符號在內都一模一樣的的一句話,由不同的人嘴里說出來意思會完全不同。比如,同樣一句“使美國再度偉大”(Make America great again,這是川普的競選口號), 川普的支持者和反對者分別在Twitter上寫下這句話,含義會完全不一樣。

被諷刺了但卻沒意識到?這個神經網絡來幫你

里斯本大學的研究員Silvio Amir說道:“要理解諷刺意味,單靠文本信息是不夠的?!彼?,還有一個關鍵因素,就是理解發(fā)表這個言論的用戶本身。

該團隊的論文中描述了一個方法,就是讓神經網絡找到“用戶嵌入”(User Embeddings)。要理解這個詞,我們就要對比自然語言處理中比較常見的”單詞嵌入“(Word Embeddings )這個術語。

單詞之間會有或近或遠的聯(lián)系。例如,“男人”與”國王”這個兩個詞經常出現(xiàn)在一起,聯(lián)系比較緊密,“女人”與“王后”也有類似的關系。而這種單詞之間的關系就被稱為"單詞嵌入",而且研究人員往往用數學上的向量空間圖來表示這種關系,在向量空間中,具有相似意義的單詞會占據同一塊位置,比較直觀。

所以這里的“用戶嵌入”就是指用戶之間的關系。幾個用戶之間,可能愛好相似,教育經歷相似,那么這一波用戶之間的關系比較緊密,在空間向量里,就會聚集在同一塊位置。

比如,論文里用政治傾向來做例子。如下圖,每個圓點代表了Twitter上的用戶:藍色用戶關注了至少一下民主黨政客:奧巴馬、希拉里和伯尼· 桑德斯;紅色用戶關注了以下至少一位共和黨政客:馬可· 盧比奧、泰德·克魯茲、特朗普。同時關注兩黨的用戶被排除在外。從圖中發(fā)現(xiàn),擁有類似政治傾向的用戶會聚集在向量空間的同一位置。

被諷刺了但卻沒意識到?這個神經網絡來幫你

如果某一個藍色用戶發(fā)表了支持川普的言論,而這與同他處在同一位置的其他用戶不一樣,那么系統(tǒng)會判定,這個言論很可能具有諷刺意味。

使用類似的方法,在理想情況下,可以找到界限比較明確的一個一個團體。將這個神經網絡與上下文的語境的線索結合起來,得出來的實驗結果顯示,準確率有87%,對比其他系統(tǒng)的準確率是85%。雖然準確度并沒有大幅度提高,但是考慮到這個系統(tǒng)要求的人工配置和監(jiān)測比以往的要少很多,這會讓其在社交媒體網絡的上的應用變得更加容易。

Via TC

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知

分享:
相關文章

編輯

關注人工智能(AI)報道
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說