日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學術(shù) 正文
發(fā)私信給楊曉凡
發(fā)送

1

和清華大學自然語言處理與社會人文計算實驗室一起讀機器翻譯論文

本文作者: 楊曉凡 2019-02-08 18:16
導語:論文海中一盞燈

雷鋒網(wǎng) AI 科技評論按:在生產(chǎn)和經(jīng)濟高度全球化的今天,機器翻譯(Machine Translation)是人類面對外語時最渴望擁有的工具,也是神經(jīng)網(wǎng)絡(luò)帶來最大變革的人工智能問題之一。

從最早的基于規(guī)則的機器翻譯,到基于概率的機器翻譯,再到現(xiàn)在的基于神經(jīng)網(wǎng)絡(luò)的機器翻譯,機器學習和語言學的研究人員們一起經(jīng)歷了幾十年的歷程。如今的機器翻譯系統(tǒng)雖然還算不上盡善盡美,但以谷歌翻譯、百度翻譯為代表的,使用神經(jīng)機器翻譯技術(shù)的大規(guī)模開放使用的翻譯系統(tǒng),已經(jīng)可以時不時地給出一些流暢、明了的雙語互譯結(jié)果了。

當然了,在神經(jīng)網(wǎng)絡(luò)/深度學習的沖擊之下,我們也不免看到這樣的調(diào)侃:“團隊里每開除一個語言學家,翻譯模型的準確率就可以再提升一點?!痹谠絹碓酱蟮恼Z料庫、越來越多的模型設(shè)計和訓練技巧的幫助下,來自語言學領(lǐng)域的指導帶來的提升遠不如機器學習領(lǐng)域的新技術(shù)成果、甚至已有技術(shù)成果的好的實現(xiàn)帶來的提升大。雷鋒網(wǎng) AI 科技評論的讀者們相信也有這樣的感覺。

機器翻譯,尤其是神經(jīng)機器翻譯(neural machine translation,NMT)也是清華大學自然語言處理與社會人文計算實驗室重點關(guān)注的研究課題之一。為了便于自己研究,也給這個課題的其他研究人員提供參考和指引,清華大學自然語言處理與社會人文計算實驗室機器翻譯小組在 GitHub 上維護著一份神經(jīng)機器翻譯論文清單,包含了這個領(lǐng)域內(nèi)他們認為起到重要作用的研究論文。

列表中的神經(jīng)機器翻譯論文劃分為了模型架構(gòu)、注意力機制、開放詞庫、訓練目標、解碼、低語言資源翻譯、先驗知識集成、文檔級別翻譯、魯棒性、可視化和可解釋性、語言學解釋、公平性和多樣性、效率、語音翻譯、多模態(tài)、集成和重新排序、預(yù)訓練、領(lǐng)域適應(yīng)、質(zhì)量估計、以人為中心的神經(jīng)機器翻譯、單詞翻譯及雙語專用語翻譯、詩歌翻譯等主題,內(nèi)容十分全面細致。除此之外,他們也列出了 10 篇必讀論文。

這 10 篇必讀論文是:

  • Peter E. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, and Robert L. Mercer. 1993. The Mathematics of Statistical Machine Translation: Parameter Estimation. Computational Linguistics. (Citation: 4,965)

  • Kishore Papineni, Salim Roukos, Todd Ward, and Wei-Jing Zhu. 2002. BLEU: a Method for Automatic Evaluation of Machine Translation. In Proceedings of ACL 2002. (Citation: 8,507)

  • Philipp Koehn, Franz J. Och, and Daniel Marcu. 2003. Statistical Phrase-Based Translation. In Proceedings of NAACL 2003. (Citation: 3,514)

  • Franz Josef Och. 2003. Minimum Error Rate Training in Statistical Machine Translation. In Proceedings of ACL 2003. (Citation: 2,982)

  • David Chiang. 2007. Hierarchical Phrase-Based Translation. Computational Linguistics. (Citation: 1,192)

  • Ilya Sutskever, Oriol Vinyals, and Quoc V. Le. 2014. Sequence to Sequence Learning with Neural Networks. In Proceedings of NIPS 2014. (Citation: 5,428)

  • Dzmitry Bahdanau, Kyunghyun Cho, and Yoshua Bengio. 2015. Neural Machine Translation by Jointly Learning to Align and Translate. In Proceedings of ICLR 2015. (Citation: 5,572)

  • Diederik P. Kingma, Jimmy Ba. 2015. Adam: A Method for Stochastic Optimization. In Proceedings of ICLR 2015. (Citation: 16,572)

  • Rico Sennrich, Barry Haddow, and Alexandra Birch. 2016. Neural Machine Translation of Rare Words with Subword Units. In Proceedings of ACL 2016. (Citation: 789)

  • Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, and Illia Polosukhin. 2017. Attention is All You Need. In Proceedings of NIPS 2017. (Citation: 1,047)

論文列表具體內(nèi)容請見:https://github.com/THUNLP-MT/MT-Reading-List

另外,在清華大學自然語言處理與社會人文計算實驗室機器翻譯小組的 GitHub 頁面還可以看到他們的開源神經(jīng)機器翻譯工具包 THUMT (https://github.com/THUNLP-MT/THUMT  )。

祝各位閱讀論文愉快。

雷鋒網(wǎng) AI 科技評論報道。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

和清華大學自然語言處理與社會人文計算實驗室一起讀機器翻譯論文

分享:
相關(guān)文章

讀論文為生

日常笑點滴,學術(shù)死腦筋
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說