日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給汪思穎
發(fā)送

0

Google發(fā)布自然語言處理解析器SLING,免除模塊化分析級聯(lián)效應產(chǎn)生的缺陷

本文作者: 汪思穎 2017-11-16 12:47
導語:這一系統(tǒng)避免了級聯(lián)效應,另外還減少了不必要的計算開銷。

雷鋒網(wǎng) AI科技評論消息,日前,Google發(fā)布自然語言框架語義解析器SLING,它能以語義框架圖(semantic frame graph)的形式,將自然語言文本直接解析為文本語義表示。這一系統(tǒng)避免了級聯(lián)效應,另外還減少了不必要的計算開銷。

詳細消息雷鋒網(wǎng) AI科技評論編譯整理如下:

直到最近,大多數(shù)實際的自然語言理解(NLU)系統(tǒng)都采用的是從詞性標簽和依存句法分析(dependency parsing)到計算輸入文本的語義表示的分析。雖然這使得不同分析階段易于模塊化,但前期的錯誤會在后期和最終表示上產(chǎn)生層疊效應,中間階段的輸出也可能會與這一階段本身并不相關。

例如,一個典型的NLP系統(tǒng)可能在早期執(zhí)行依存句法分析的任務,在結(jié)束階段時執(zhí)行共指解析(coreference resolution)任務,早期依存句法分析階段出現(xiàn)的任何錯誤都會產(chǎn)生級聯(lián)效應,影響共指解析的輸出。

今天我們發(fā)布SLING實驗系統(tǒng),它能以語義框架圖(semantic frame graph)的形式,將自然語言文本直接解析為文本語義表示。

輸出框架圖能直接捕獲用戶感興趣的語義標注(semantic annotation),因為沒有運行任何中間階段,所以避免了上述那種管道系統(tǒng)的缺陷,另外還減少了不必要的計算開銷。

SLING使用具有特殊用途的循環(huán)神經(jīng)網(wǎng)絡模型,通過框架圖上的增量編輯操作(incremental editing operation)來計算輸入文本的輸出表示。框架圖足夠靈活,可以捕獲大家感興趣的許多語義任務(下面有更多介紹)。SLING中的分析器(parser)只使用輸入詞來進行訓練,不需要額外再生成標注(例如依存句法分析)。

SLING通過提供高效的、可擴展的框架存儲實現(xiàn)(frame store implementation)和JIT編譯器來生成高效的代碼來執(zhí)行循環(huán)神經(jīng)網(wǎng)絡,從而在推理(inference)時能快速進行句法分析。

盡管SLING還處于實驗階段,但得益于高效的框架存儲和神經(jīng)網(wǎng)絡編譯器,它在臺式機CPU上能實現(xiàn)超過2500符號/秒的解析速度。

SLING使用C++,目前可以在GitHub上下載。這個系統(tǒng)在技術報告中有詳細描述。

框架語義句法分析(Frame Semantic Parsing)

框架語義表示文本的含義(例如一句話),是一套正規(guī)表述。每個正規(guī)表述都被稱為一個框架,可以被看作是知識或語義的一個單元,還包含與與它相關的概念或其他框架的相互作用。

SLING將框架組織成屬性槽(slot)列表,其中每個屬性槽都有對應的名稱(角色)和值(可能是literal或是到另一個框架的鏈接)。

下面是一個例句:

“很多人都宣稱自己預測到了黑色星期一?!保∕any people now claim to have predicted Black Monday)

下圖是SLING識別提到的實體(例如人物、地點或事件)、度量(例如日期或距離)和其他概念(例如動詞),并將它們放置在正確的語義角色中的說明。

 Google發(fā)布自然語言處理解析器SLING,免除模塊化分析級聯(lián)效應產(chǎn)生的缺陷

上面的例子相當簡單,框架圖的功能強大到可以模擬各種復雜的語義標注任務。對于初學者來說,這種框架可以非常方便地將語言的內(nèi)外部信息類型(例如知識庫)結(jié)合起來。這可以用于處理復雜的語言理解問題,例如引用、隱喻、轉(zhuǎn)喻等。這些任務的框架圖只在框架類型、角色和鏈接約束條件上有所不同。

SLING

SLING通過優(yōu)化語義框架來訓練循環(huán)神經(jīng)網(wǎng)絡。網(wǎng)絡隱藏層中學到的內(nèi)部表示取代了在前面那種管道系統(tǒng)中的手工特性組合和中間表示。

解碼器使用伴隨反復出現(xiàn)的特征一起的表示,來計算用于框架圖更新的一系列過渡,以獲得輸入語句的預期框架語義表示。在SLING中用TensorFlow和DRAGNN來訓練模型。

下面的動圖展示了使用過濾操作將框架和角色逐漸添加到框架圖中的構(gòu)建過程。

Google發(fā)布自然語言處理解析器SLING,免除模塊化分析級聯(lián)效應產(chǎn)生的缺陷

正如一開始討論的那個簡單例句,SLING使用ARG1角色將動詞和事件框架連接起來,表示事件框架是被預測的概念。

這個過渡系統(tǒng)的一個關鍵層面是,有一個很小的固定大小的框架緩沖區(qū),它代表了最近被喚起或修改的框架,用橙色方框標記。這個緩沖區(qū)會捕捉到我們傾向于記住的最近被喚起、提及或強化的知識的直覺。如果一個框架不再使用,那么當新的框架出現(xiàn)時,它最終會從這個緩沖區(qū)中被清除掉。我們發(fā)現(xiàn)這種簡單的機制在捕捉大量框架間鏈接的片段時非常有效。

下一步

上面所描述的實驗僅僅是對諸如知識提取、解析復雜引用和對話理解等語義句法分析研究任務的啟動研究。

在Github上發(fā)布的SLING中有上述任務的預訓練模型,還有一些示例和方法,大家可以在提供的綜合數(shù)據(jù)或自己的數(shù)據(jù)上來訓練解析器。希望SLING能對大家有所幫助有用,我們期待著在其他語義句法分析任務上應用和擴展SLING。

Github地址:https://github.com/google/sling

Via:Google Research Blog

雷鋒網(wǎng) AI科技評論編譯整理。

雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

Google發(fā)布自然語言處理解析器SLING,免除模塊化分析級聯(lián)效應產(chǎn)生的缺陷

分享:
相關文章

編輯

關注AI學術,例如論文
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說