日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開發(fā)者 正文
發(fā)私信給汪思穎
發(fā)送

0

Facebook開源VoiceLoop,根據(jù)開放場(chǎng)景語(yǔ)音文字合成新語(yǔ)音

本文作者: 汪思穎 2017-09-05 14:14
導(dǎo)語(yǔ):看Facebook最新開源語(yǔ)音合成方法

雷鋒網(wǎng) AI科技評(píng)論消息:Facebook研究員近日開源了他們?cè)诮衲昶咴掳l(fā)表的一篇論文(Voice Synthesis for in-the-Wild Speakers via a Phonological Loop)中的語(yǔ)音合成方法。

Facebook開源VoiceLoop,根據(jù)開放場(chǎng)景語(yǔ)音文字合成新語(yǔ)音

在論文中,他們提出了一種新的文字轉(zhuǎn)語(yǔ)音的神經(jīng)網(wǎng)絡(luò)方法,可以將從開放場(chǎng)景下采樣到的聲音中提取的文字轉(zhuǎn)化為語(yǔ)音。不同于其他的文字轉(zhuǎn)語(yǔ)音系統(tǒng),這種方法能夠處理從公開演講中提取出來(lái)的非約束性的樣本,而且網(wǎng)絡(luò)架構(gòu)比現(xiàn)存的解決同樣問題的架構(gòu)要簡(jiǎn)單。它基于新的移位緩沖內(nèi)存儲(chǔ)器區(qū)(shifting buffer working memory),這個(gè)緩沖區(qū)也可以用于評(píng)估注意力,計(jì)算輸出音頻,以及自身的更新。

Facebook開源VoiceLoop,根據(jù)開放場(chǎng)景語(yǔ)音文字合成新語(yǔ)音

通過(guò)使用與上下文無(wú)關(guān)( context-free)的查找表對(duì)輸入語(yǔ)句進(jìn)行編碼,該表的每個(gè)條目包含一個(gè)字符或音素。同樣,能通過(guò)一個(gè)短向量來(lái)表示說(shuō)話者,這個(gè)短向量也適用于新說(shuō)話者。而且在生成音頻之前,優(yōu)先準(zhǔn)備好緩沖區(qū)可以使生成的語(yǔ)音具有可變性。

上圖為實(shí)驗(yàn)樣例中生成的注意力圖,X 軸是輸出時(shí)間(聲學(xué)樣本),Y 軸是輸入(文本/音素)。

代碼地址:https://github.com/facebookresearch/loop

論文地址:https://arxiv.org/abs/1707.06588

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

Facebook開源VoiceLoop,根據(jù)開放場(chǎng)景語(yǔ)音文字合成新語(yǔ)音

分享:

編輯

關(guān)注AI學(xué)術(shù),例如論文
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)