日本在线看黄a美女久草|日本动漫亚洲在线一区|日韩人妻无码免费视频|A√有码中文字幕|日韩一级片视频热久久久|一区二区三区四区精品无码在线|亚洲AV成人无码一二三app|亚洲综合图片绯色|91极品人妻在线网站|国产成人精品一区二三区四区五区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給張莉
發(fā)送

0

谷歌、微軟、蘋(píng)果、亞馬遜、三星……哪家的語(yǔ)音助手支持語(yǔ)言種類(lèi)最多?

本文作者: 張莉 2019-02-06 17:43
導(dǎo)語(yǔ):語(yǔ)音助手大PK。

與大眾認(rèn)知相反,英語(yǔ)其實(shí)并不是全球使用人數(shù)最多的語(yǔ)言,甚至連第二名都排不上。事實(shí)上,排在第一位的是漢語(yǔ),第二是西班牙語(yǔ),西日耳曼語(yǔ)排在第三位,接下來(lái)是印地語(yǔ)、阿拉伯語(yǔ)、葡萄牙語(yǔ)、孟加拉語(yǔ)和俄語(yǔ)。

更令人意想不到的是,Google Assistant、蘋(píng)果的 Siri、亞馬遜的 Alexa和微軟的 Cortana 雖然已經(jīng)無(wú)比強(qiáng)大,但其實(shí)只能識(shí)別這些語(yǔ)言當(dāng)中相對(duì)較少的一部分。直到今年秋天,三星的Bixby才可以識(shí)別德語(yǔ)、法語(yǔ)、意大利語(yǔ)和西班牙語(yǔ),而這些語(yǔ)言的全球使用總?cè)藬?shù)高達(dá)6.16億人。Cortana 更是花了好幾年時(shí)間才精通西班牙語(yǔ)、法語(yǔ)和葡萄牙語(yǔ)。

為什么識(shí)別新語(yǔ)言的進(jìn)度如此緩慢?究其原因,主要還是訓(xùn)練語(yǔ)音識(shí)別算法的技術(shù)進(jìn)度緩慢,事實(shí)上,AI語(yǔ)音助手比我們表面看起來(lái)的要復(fù)雜得多。

為什么支持一門(mén)新語(yǔ)言如此艱難?

谷歌、微軟、蘋(píng)果、亞馬遜、三星……哪家的語(yǔ)音助手支持語(yǔ)言種類(lèi)最多?

給語(yǔ)音助手添加語(yǔ)言支持是一個(gè)多管齊下的過(guò)程,這需要在語(yǔ)音識(shí)別和語(yǔ)音合成方面進(jìn)行大量的研發(fā)。就語(yǔ)音識(shí)別而言,首先要將語(yǔ)音轉(zhuǎn)換成文本,接下來(lái)再進(jìn)行自然語(yǔ)言處理。

如今,大多數(shù)語(yǔ)音識(shí)別系統(tǒng)都借助于深度神經(jīng)網(wǎng)絡(luò)(deep neural networks)來(lái)預(yù)測(cè)音素,或感知區(qū)分不同的聲音單位(例如,英語(yǔ)單詞 pad、pat 和 bad 中的 p、b和 d)。以前的自動(dòng)語(yǔ)音識(shí)別(ASR)技術(shù)依賴(lài)于手工調(diào)整的統(tǒng)計(jì)模型來(lái)計(jì)算單詞組合在短語(yǔ)中出現(xiàn)的概率,而深度神經(jīng)網(wǎng)絡(luò)則不同,它可以將聲音(以分段譜圖或聲音頻率譜的表示形式)轉(zhuǎn)換成字符。這不僅降低了錯(cuò)誤率,而且在很大程度上替代了人工監(jiān)督。

但是,只進(jìn)行基礎(chǔ)的語(yǔ)言理解是不夠的。如果沒(méi)有本地化,語(yǔ)音助手就無(wú)法了解不同語(yǔ)言所承載的文化的特性。Next IT 首席技術(shù)創(chuàng)新官 Joe Dumoulin 在接受 Ars Technica 采訪(fǎng)時(shí)表示,為一門(mén)新語(yǔ)言構(gòu)建一個(gè)查詢(xún)理解模塊需要30至90天,具體時(shí)間取決于該模塊需要涵蓋多少意圖。即便是谷歌和亞馬遜推出的市場(chǎng)銷(xiāo)量領(lǐng)先的智能音箱,也很難聽(tīng)懂帶有某些口音的語(yǔ)言。由 Vocalize.ai 進(jìn)行的一項(xiàng)測(cè)試發(fā)現(xiàn),蘋(píng)果的 HomePod 和亞馬遜的 Echo 只能捕捉到78%的中文單詞,對(duì)英語(yǔ)和印度語(yǔ)的識(shí)別率則為94%。

不同語(yǔ)言的語(yǔ)法結(jié)構(gòu)差異很大。例如,在英語(yǔ)中,形容詞通常出現(xiàn)在名詞之前,副詞可以出現(xiàn)在名詞之前,也可以出現(xiàn)在名詞之后。如果有人說(shuō)“starfish”并且讓語(yǔ)音助手來(lái)識(shí)別的話(huà),很容易將“star”與“fish”理解為形容詞或單個(gè)名詞。語(yǔ)言里含有各種術(shù)語(yǔ),語(yǔ)音助手必須能適應(yīng)并學(xué)會(huì)辨別不同的習(xí)慣用語(yǔ)。

學(xué)一門(mén)語(yǔ)言已經(jīng)夠難了。亞馬遜 Alexa AI 部門(mén)的研究人員在2018年8月描述了實(shí)際使用中的一個(gè)典型問(wèn)題。在與助手聊天過(guò)程中,用戶(hù)經(jīng)常在連續(xù)的問(wèn)題中調(diào)用多個(gè)語(yǔ)音應(yīng)用程序。這些應(yīng)用程序需要重復(fù)調(diào)用變量——例如“town”和“city”。如果有人問(wèn)了方向,接著又問(wèn)了一個(gè)關(guān)于餐館位置的問(wèn)題,一個(gè)訓(xùn)練有素的語(yǔ)音助手需要能夠弄清楚在回答這個(gè)問(wèn)題時(shí)應(yīng)該參考哪條線(xiàn)索。然后,語(yǔ)音助手在分析之后必須做出準(zhǔn)確回應(yīng),其中的技術(shù)難度非常大。

各大語(yǔ)音助手支持的語(yǔ)言種類(lèi)有哪些?

1. Google Assistant

谷歌、微軟、蘋(píng)果、亞馬遜、三星……哪家的語(yǔ)音助手支持語(yǔ)言種類(lèi)最多?

今年1月,Google Assistant 新增了20多種語(yǔ)言,在各大語(yǔ)音助手中,它所能理解的語(yǔ)言數(shù)量位居榜首。目前,Google Assistant 已經(jīng)在80個(gè)國(guó)家的近30種語(yǔ)言中被廣泛使用,而在2017年,這一數(shù)字僅為8種語(yǔ)言和14個(gè)國(guó)家。其目前支持的語(yǔ)言包括:

  • 阿拉伯語(yǔ)(埃及、沙特阿拉伯)、孟加拉語(yǔ)、中文(繁體)、丹麥語(yǔ)、荷蘭語(yǔ)、英語(yǔ)(澳大利亞、加拿大、印度、印度尼西亞、愛(ài)爾蘭、菲律賓、新加坡、泰國(guó)、英國(guó)、美國(guó))、法語(yǔ)(加拿大、法國(guó))、德語(yǔ)(奧地利、德國(guó))、古吉拉特語(yǔ)、北印度語(yǔ)、印尼語(yǔ)、埃納德語(yǔ)、意大利語(yǔ)、日語(yǔ)、韓語(yǔ)、馬拉雅拉姆語(yǔ)、馬拉地語(yǔ)、挪威語(yǔ)、波蘭語(yǔ)、葡萄牙語(yǔ)(巴西)、俄語(yǔ)、西班牙語(yǔ)(阿根廷、智利、哥倫比亞、秘魯)、瑞典語(yǔ)、泰米爾語(yǔ)、泰盧固語(yǔ)、泰語(yǔ)、土耳其語(yǔ)、烏爾都語(yǔ)

2. 蘋(píng)果 Siri

谷歌、微軟、蘋(píng)果、亞馬遜、三星……哪家的語(yǔ)音助手支持語(yǔ)言種類(lèi)最多?

直到今年1月,蘋(píng)果的 Siri 在支持語(yǔ)言的廣度方面一直領(lǐng)先于 Google Assistant。目前,它支持36個(gè)國(guó)家的21種語(yǔ)言,其中包括:

  • 阿拉伯語(yǔ)、中文(普通話(huà)、上海話(huà)和廣東話(huà))、丹麥語(yǔ)、荷蘭語(yǔ)、英語(yǔ)、芬蘭語(yǔ)、法語(yǔ)、德語(yǔ)、希伯來(lái)語(yǔ)、意大利語(yǔ)、日語(yǔ)、韓語(yǔ)、馬來(lái)語(yǔ)、挪威語(yǔ)、葡萄牙語(yǔ)、俄語(yǔ)、西班牙語(yǔ)、瑞典語(yǔ)、泰語(yǔ)、土耳其語(yǔ)

Siri在澳大利亞和英國(guó)也有獨(dú)特的本地化語(yǔ)音功能,畫(huà)外音藝術(shù)家 Karen Jacobsen 曾在澳大利亞語(yǔ)中提供臺(tái)詞和短語(yǔ),前科技記者 Jon Briggs 則提供了他的聲音。

3.微軟 Cortana

谷歌、微軟、蘋(píng)果、亞馬遜、三星……哪家的語(yǔ)音助手支持語(yǔ)言種類(lèi)最多?

Cortana于2013年4月在微軟的 Build developer 大會(huì)上首次亮相,后來(lái)又通過(guò)與亞馬遜的合作,在 Windows 10、耳機(jī)、智能揚(yáng)聲器、Android、iOS、Xbox One,甚至 Alexa 上發(fā)布。Cortana 支持的語(yǔ)言可能不及谷歌 Assistant 和 Siri 那么多。盡管如此,六年來(lái)它已經(jīng)取得了長(zhǎng)足的進(jìn)步。以下是它能識(shí)別的語(yǔ)言:

  • 中文(簡(jiǎn)體)、英語(yǔ)(澳大利亞、加拿大、新西蘭、印度、英國(guó)、美國(guó))、法語(yǔ)(加拿大、法國(guó))、德語(yǔ)、意大利語(yǔ)、日語(yǔ)、葡萄牙語(yǔ)(巴西)、墨西哥語(yǔ)、西班牙語(yǔ)

和 Siri 一樣,Cortana 也進(jìn)行了廣泛的本地化處理。

4.亞馬遜 Alexa

谷歌、微軟、蘋(píng)果、亞馬遜、三星……哪家的語(yǔ)音助手支持語(yǔ)言種類(lèi)最多?

雷鋒網(wǎng)注:亞馬遜 Alexa

Alexa 可以在41個(gè)國(guó)家的150多種產(chǎn)品上使用,但它理解的語(yǔ)言是語(yǔ)音助手中最少的,包括:

  • 英語(yǔ)(澳大利亞、加拿大、印度、英國(guó)和美國(guó))、法語(yǔ)(加拿大、法國(guó))、德語(yǔ)、日語(yǔ)、墨西哥語(yǔ)、西班牙語(yǔ)

公平地說(shuō),亞馬遜已經(jīng)煞費(fèi)苦心地在新的地區(qū)進(jìn)行本地化處理。Alexa 去年進(jìn)入印度市場(chǎng)后,推出了一種“全新的英語(yǔ)語(yǔ)音”,能聽(tīng)懂當(dāng)?shù)匕l(fā)音,并能用當(dāng)?shù)匕l(fā)音交談。

亞馬遜正在通過(guò)眾包的方式逐步擴(kuò)展語(yǔ)言支持種類(lèi),有超過(guò)1萬(wàn)名工程師正在研究其 NLP 協(xié)議棧的各種組件。去年,亞馬遜發(fā)布了一項(xiàng)名為“Cleo”的游戲化功能,用于獎(jiǎng)勵(lì)那些用當(dāng)?shù)卣Z(yǔ)言和方言(如普通話(huà)、印地語(yǔ)、泰米爾語(yǔ)、馬拉地語(yǔ)、卡納達(dá)語(yǔ)、孟加拉語(yǔ)、泰盧谷語(yǔ)和古吉拉特邦語(yǔ))重復(fù)短語(yǔ)的用戶(hù)。

5.三星 Bixby

谷歌、微軟、蘋(píng)果、亞馬遜、三星……哪家的語(yǔ)音助手支持語(yǔ)言種類(lèi)最多?

雷鋒網(wǎng)注:三星 Bixby 

三星的 Bixby 內(nèi)置在三星的旗艦和中端 Galaxy 智能手機(jī)系列以及即將推出的 Galaxy 家庭智能揚(yáng)聲器中。Bixby 在全球200個(gè)市場(chǎng)上都有銷(xiāo)售,但只支持這些國(guó)家的少數(shù)幾種語(yǔ)言:

  • 英語(yǔ)、中文、德語(yǔ)、法語(yǔ)、意大利語(yǔ)、韓語(yǔ)、西班牙語(yǔ)

三星在歷史上曾因 NLP 技術(shù)不完善而受挫?!度A爾街日?qǐng)?bào)》在2017年3月報(bào)道稱(chēng),三星被迫推遲了英文版Bixby 的發(fā)布,因?yàn)?Bixby 無(wú)法理解某些語(yǔ)法。

雷鋒網(wǎng)編譯。

via: Venturebeat

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章

主筆

本人微信:15010591263
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話(huà)
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)