0
| 本文作者: 嫣然 | 2017-11-29 11:53 |
雷鋒網(wǎng)按:亞馬遜的閃耀新星Alexa近日登錄印度,這是繼德國(guó)美國(guó)英國(guó)之后Alexa即將征戰(zhàn)的第四片土地。在此之前,Alexa 的支持語(yǔ)言只有英語(yǔ)和德語(yǔ),相比之下,Google Assistant 已經(jīng)支持 5 種語(yǔ)言,蘋果 Siri 更是支持 24 種語(yǔ)言和 36 種方言。
原本在語(yǔ)言上就稍顯落后的Alexa,此舉可以說(shuō)野心勃勃。根據(jù) 2001 年的統(tǒng)計(jì),印度有 29 種語(yǔ)言的使用人口超過(guò)一百萬(wàn),有 122 種語(yǔ)言的使用人口超過(guò)一萬(wàn),除了英語(yǔ)和印地語(yǔ)兩種全國(guó)性的官方語(yǔ)言之外,印度憲法認(rèn)定的、在各個(gè)邦具有官方地位的語(yǔ)言還有 22 種。對(duì)于 Alexa 這樣面向消費(fèi)級(jí)用戶和大眾市場(chǎng)的語(yǔ)音交互產(chǎn)品來(lái)說(shuō),復(fù)雜的語(yǔ)言環(huán)境無(wú)疑是相當(dāng)大的挑戰(zhàn)。顯然,Alexa在這里將直面它的終極挑戰(zhàn)。它會(huì)一鳴驚人,還是遭受重大打擊呢?
Factory Daily近日發(fā)表文章,深入闡述了Alexa登錄印度所面臨的困難,亞馬遜為此所付出的努力,以及各方人士對(duì)此的看法。雷鋒網(wǎng)在不改變?cè)獾那闆r下,為您做如下編譯:

她現(xiàn)代化,會(huì)說(shuō)流利的英語(yǔ),能幫助您預(yù)訂出租車,找烹飪食譜,播放你最喜愛(ài)的音樂(lè),并被她最喜愛(ài)的演員沙魯克汗(Shah Rukh Khan)所深深吸引。她是一位典型的印度女士,她可能回答你所有的問(wèn)題。她最喜歡的女演員是Emily Stone和Rachel Weisz,最喜歡的冰淇淋味道是薄荷巧克力片。她是Alexa,出生在一個(gè)美國(guó)籍的亞馬遜家族,說(shuō)著一口帶印度口音的英語(yǔ)。
她是被訓(xùn)練成這樣的。 Alexa是亞馬遜的語(yǔ)音助理,印度是它推出的第四個(gè)國(guó)家。亞馬遜有雄心把Alexa放入一切場(chǎng)景。進(jìn)入你的手機(jī)。進(jìn)入你的車。進(jìn)入你整個(gè)家庭。甚至進(jìn)入酒店和辦公室。
Alexa在美國(guó)、英國(guó)和德國(guó)取得了一些早期的成功。世界各地有幾十家公司把Alexa嵌入了它們的產(chǎn)品。在國(guó)際消費(fèi)電子展上,福特、大眾和奧迪展示了將Alexa嵌入儀表板的汽車。

連接到互聯(lián)網(wǎng)后,Alexa會(huì)試圖回答你的問(wèn)題,遵照你的命令。但印度將是Alexa的終極考驗(yàn)。 “語(yǔ)音助手在單語(yǔ)或雙語(yǔ)國(guó)家運(yùn)作良好。但印度是不同的?!盠attice Bridge Infotech(簡(jiǎn)稱LBIT)的總經(jīng)理Mohan Ram說(shuō),他自2001年以來(lái)一直從事語(yǔ)音識(shí)別技術(shù)領(lǐng)域。
2001年剛開(kāi)始的時(shí)候,Ram告訴投資者,他的公司將在五年內(nèi)解決卡納塔克邦的語(yǔ)言和方言問(wèn)題。但是17年以來(lái),他承認(rèn)他只解決了80%的問(wèn)題。他說(shuō):“每隔100公里語(yǔ)言就會(huì)變化,每30公里方言就會(huì)變化?!钡馊斯ぶ悄?、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)將會(huì)很大程度上改善這些問(wèn)題。亞馬遜正在以此為籌碼,試圖解決印度的復(fù)雜性。
早在亞馬遜在印度推出Alexa的一年多之前,它已經(jīng)開(kāi)始了培訓(xùn),以滿足當(dāng)?shù)氐男枨?。“Alexa了解口語(yǔ)詞匯及其背景。印度與其他單一語(yǔ)言國(guó)家不同的是,我們要使用大量專有名詞——可能是一個(gè)人名,一個(gè)地方,一個(gè)寶萊塢唱片的名稱,一個(gè)詞作者或一部電影。”Puneesh Kumar說(shuō),他是 Alexa體驗(yàn)與設(shè)備在印度的區(qū)域經(jīng)理。
Kumar自2010年5月以來(lái)一直在亞馬遜工作。最初是實(shí)習(xí)生,然后在亞馬遜中國(guó)擔(dān)任高級(jí)項(xiàng)目經(jīng)理,并在亞馬遜在中國(guó)市場(chǎng)推出期間工作。他最長(zhǎng)的時(shí)間是作為亞馬遜全球銷售計(jì)劃的總經(jīng)理,工作了兩年半,一直到領(lǐng)導(dǎo)Alexa在印度的實(shí)踐之前。
“我們不得不跳出英語(yǔ)思維的框架之外去思考。 我們要訓(xùn)練Alexa了解泰米爾語(yǔ),印地語(yǔ),泰盧固語(yǔ),旁遮普語(yǔ),馬拉雅拉姆語(yǔ)中的專有名詞?!盞umar說(shuō),他現(xiàn)在在加羅爾工作。
這些問(wèn)題對(duì)印度來(lái)說(shuō)是獨(dú)一無(wú)二的,即使別的國(guó)家也有多種方言。例如,坐落在卡納塔克邦邊上的城市貝爾高姆,它從孔卡尼語(yǔ)、馬拉地語(yǔ)和卡納達(dá)語(yǔ)的混合中發(fā)展出了自己的語(yǔ)言。距離貝爾高姆386公里的烏杜皮,也是在卡納塔克邦,那里的人們講的語(yǔ)言是圖魯語(yǔ),馬拉雅拉姆語(yǔ)和卡納達(dá)語(yǔ)的混合。
硅谷研究公司Constellation Research的首席分析師兼董事長(zhǎng)Ray Wang表示:“鑒于印度人口眾多,在這個(gè)國(guó)家分不同洲推出產(chǎn)品可能更好?!?“亞馬遜在能力上仍然落后于谷歌,但正在快速趕上。(成功)所需要的正是很多用戶去測(cè)試和學(xué)習(xí)?!?/p>

Puneesh Kumar, Alexa體驗(yàn)與設(shè)備在印度的區(qū)域經(jīng)理。
Alexa建立在人工智能和機(jī)器學(xué)習(xí)框架之上,可以在云端不斷學(xué)習(xí)。亞馬遜結(jié)合了云計(jì)算和人工智能的兩項(xiàng)開(kāi)創(chuàng)性技術(shù),并以簡(jiǎn)單易用的語(yǔ)音作為用戶界面入口。
Kumar說(shuō):“正是因?yàn)樗鼨C(jī)器學(xué)習(xí)的背景,因此每一句話都在幫助它學(xué)習(xí)。 Alexa基于自然語(yǔ)言理解(NLU),意味著基本上它能理解句子和上下文,并將其從文本轉(zhuǎn)換為語(yǔ)音。這些情況因國(guó)家而異。在美國(guó)和英國(guó),當(dāng)人們談?wù)搈arks時(shí),他們是指劃痕。但在印度,marks通常是指成績(jī)和分?jǐn)?shù)。
Alexa也理解印度遵循著以十萬(wàn)和千萬(wàn)為單位的數(shù)字系統(tǒng),而不是百萬(wàn)和十億。 Alexa必須意識(shí)到這一點(diǎn),Kumar說(shuō)。它能識(shí)別UP(北方邦),MP(中央邦)和CM(首席部長(zhǎng))等縮寫詞。它也可以識(shí)別不同的PIN碼。它還囊括了北印度詞匯,如haldi,jeera和dhania,這些詞不是英語(yǔ)單詞,但是是常見(jiàn)的印度語(yǔ)單詞。
準(zhǔn)確的說(shuō),Echo設(shè)備的用戶體驗(yàn)(Echo能即時(shí)連接到Alexa播放音樂(lè),獲取新聞和天氣等信息,并使用語(yǔ)音控制智能家居)仍尚在發(fā)展中。FactorDaily加羅爾辦公室對(duì)Echo詢問(wèn)“誰(shuí)是Anand Murali”,得到了一個(gè)不正確的答案,而理想情況下它應(yīng)該查詢上下文,確定我們想問(wèn)的是誰(shuí)。 Google語(yǔ)音查詢會(huì)在搜索結(jié)果的頂部顯示Anand的LinkedIn(領(lǐng)英)個(gè)人資料。
Shonali Muthalaly在《印度教徒報(bào)》中寫道,“這遠(yuǎn)非完美。”“Alexa仍在了解印度的過(guò)程中,所以當(dāng)我要求她推薦餐館、提供交通預(yù)測(cè)和路線推薦時(shí),她回答的一團(tuán)糟?!睋?jù)推測(cè),隨著越來(lái)越多的印度人使用這個(gè)平臺(tái),結(jié)果會(huì)變得更好。
培訓(xùn)Alexa不容易,Kumar承認(rèn)。亞馬遜最初的語(yǔ)料集有限——大約有一萬(wàn)個(gè)。這被稱為訓(xùn)練數(shù)據(jù)。Kumar不記得確切的數(shù)字了。然后有一種叫做測(cè)試數(shù)據(jù)的,它是無(wú)限的,是人類互動(dòng)和萬(wàn)維網(wǎng)的混合體。
Kumar認(rèn)為,Alexa尚不完美,所以只邀請(qǐng)了少數(shù)人使用。(此前亞馬遜在印度當(dāng)?shù)靥暨x了一批公司高管和商務(wù)人士作為天使用戶,將一部分 Echo 音箱贈(zèng)送給他們?cè)囉谩#╇S著越來(lái)越多的人進(jìn)入Echo設(shè)備,Alexa將學(xué)習(xí)更多?!澳菚r(shí)機(jī)器學(xué)習(xí)就大顯身手了,并且開(kāi)始識(shí)別訓(xùn)練數(shù)據(jù)中不存在的新東西......隨著越來(lái)越多的人與設(shè)備交談,語(yǔ)言會(huì)擴(kuò)展。事情現(xiàn)在還不是應(yīng)該有的樣子,隨著時(shí)間的推移會(huì)變得更好。”他說(shuō)。
有一種叫做DWC(需求加權(quán)覆蓋)的東西。是最受歡迎和最常說(shuō)的詞語(yǔ)列表。為了識(shí)別這些詞語(yǔ),Alexa尋找模式,聲音,音素,背景,然后把它們放在一起,看看人們說(shuō)的話可能是什么。一旦發(fā)現(xiàn)不匹配,則跟蹤每個(gè)不匹配以改善體驗(yàn)。
早期時(shí),Alexa知道Amitabh Bachchan是一名演員,甚至可以獲取他的歌曲,但她會(huì)把Bachchan發(fā)音成Bakkan(遺漏了“chch”的發(fā)音)。隨著時(shí)間的推移它在學(xué)習(xí)。Kumar說(shuō),Alexa要學(xué)習(xí)的大部分經(jīng)驗(yàn)是用她的方式讀出正確的方言和發(fā)音——不僅僅是英文,還有印度語(yǔ)和泰盧固語(yǔ)的流行詞匯。

Kumar說(shuō),如果Alexa能夠理解對(duì)面的那個(gè)人,相當(dāng)于得到了圣杯(最高獎(jiǎng)賞)。 “無(wú)論如何,我們都希望Alexa了解話語(yǔ)背后的意圖。我們根據(jù)意圖來(lái)看大部分話語(yǔ)?!崩?,播放歌曲,播放電影中的歌曲,播放帶有某歌詞的歌曲,或不使用播放這個(gè)詞,給我唱首歌,幫我緩解一下心情——它們可能最終都要求Alexa獲取相同的結(jié)果。Kumar說(shuō):“我們正嘗試?yán)L制相關(guān)性?!?/p>
如果用戶在獲取結(jié)果后的幾秒鐘內(nèi)說(shuō)“不”或改變?cè)儐?wèn),機(jī)器學(xué)習(xí)算法就會(huì)明白Alexa沒(méi)有獲取正確意圖。即使這個(gè)輸入只是用于訓(xùn)練。
亞馬遜在訓(xùn)練Alexa時(shí)使用了機(jī)器學(xué)習(xí)和人工干預(yù)的混合,尤其是在同一個(gè)詞有多個(gè)發(fā)音的時(shí)候。Kumar說(shuō):“我們得到的回應(yīng)讓人很有信心,然后我們用一個(gè)非常熟悉這個(gè)詞的人做審查機(jī)制,以確保我們正確的理解了這些音素?!?/p>
但是不可能每次遇到這種詞都這么做。Alexa會(huì)提取前20或30個(gè)詞語(yǔ)進(jìn)行這個(gè)過(guò)程,每當(dāng)有一個(gè)這樣的詞語(yǔ)時(shí),這個(gè)程序就會(huì)繼續(xù)進(jìn)行,這時(shí)候這個(gè)詞語(yǔ)的表達(dá)水平已經(jīng)更高了。
不過(guò),Kumar說(shuō),這位女士(指Alexa)會(huì)有一個(gè)自己的聲音,它不會(huì)隨著從南到北的印度而變化,雖然亞馬遜希望Alexa能夠理解不同的文化、口音和對(duì)著麥克風(fēng)說(shuō)話的人的思維方式。 “我們看的是最終的綜合聲音。最終的聲音是對(duì)機(jī)器,音素,詞匯的調(diào)制,所有這些都以非常印度的聲音進(jìn)行預(yù)先錄制,”Kumar說(shuō)。
由于不可能錄下每個(gè)詞語(yǔ),他們錄制了一組詞語(yǔ)創(chuàng)建了所謂的基本結(jié)構(gòu)。 “我們采用了一個(gè)人聲,然后把它與機(jī)器學(xué)習(xí)、語(yǔ)音和詞典這些結(jié)合起來(lái)。我們把這個(gè)聲音看作一個(gè)組合?!彼f(shuō)。
另外,因?yàn)橐晃慌浚ㄉ衔奶岬降娜寺暤闹魅耍┎豢赡苁熘械目谝艉驼Z(yǔ)言,所以他們選擇了多個(gè)人來(lái)錄制。然而,在機(jī)器學(xué)習(xí)的幫助下,亞馬遜已經(jīng)成功地使Alexa的聲音變得一致,無(wú)論你在印度的什么地方使用。 Kumar說(shuō):“在印度說(shuō)話的Alexa會(huì)有一個(gè)自己的人格?!?nbsp;
第一天,在亞馬遜完成語(yǔ)音助理Alexa在印度的全面推廣之前,Alexa有10800個(gè)精確的技能。當(dāng)Alexa在美國(guó)推出時(shí),它只有13種技能。技能是基于語(yǔ)音的應(yīng)用程序,如移動(dòng)應(yīng)用程序,它讓用戶能使用語(yǔ)音命令來(lái)操作應(yīng)用程序。
亞馬遜的Alexa語(yǔ)音服務(wù)和技能主管Steve Rabuchin告訴Wired,該公司受到了“星際迷航”電腦的啟發(fā)——?jiǎng)?chuàng)建一個(gè)助手,讓用戶可以通過(guò)簡(jiǎn)單的語(yǔ)音命令來(lái)控制周圍的一切。
亞馬遜已經(jīng)與印度的開(kāi)發(fā)商合作,將流行的應(yīng)用程序與亞馬遜的語(yǔ)音助手整合在一起。對(duì)于旅行方面,有Ola,Goibibo,ixigo和Jet Airways。食物方面,有Faasos,Zomato,F(xiàn)reshmenu,Sanjeev Kapoor,達(dá)拉爾。音樂(lè)方面,有Saavn和Bollywood Hungama。運(yùn)動(dòng)方面,有ESPNCricinfo。新聞和教育方面有印度時(shí)報(bào),NDTV,ABP Live,AajTak和Byju's。智能家居解決方案,他們擁有Syska和Silvan,UrbanClap和Housejoy則提供勤雜工服務(wù)。

Kumar說(shuō),將Alexa與應(yīng)用程序整合是很容易的。他說(shuō):“已經(jīng)有年僅10歲的孩子建立起一門技術(shù),還有年紀(jì)大又沒(méi)有任何技術(shù)知識(shí)的人,他們也能夠建立一門技術(shù)。
對(duì)于ixigo的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Aloke Bajpai來(lái)說(shuō),Alexa是一個(gè)很好的傳播平臺(tái)。他說(shuō):“亞馬遜非常非常雄心勃勃,我們期望他們能夠在很短的時(shí)間內(nèi)達(dá)到幾百萬(wàn)臺(tái)設(shè)備。
但Bajpai并沒(méi)有將ixigo局限在Alexa上——他正在建立自己的語(yǔ)音助理Tara.“Alexa的使用是有限的...你問(wèn)一些東西,然后它反應(yīng)。它需要更積極主動(dòng),譬如如果一個(gè)長(zhǎng)周末即將到來(lái),它應(yīng)該能夠向你推薦一些東西,“Bajpai說(shuō),但是他同意,谷歌和亞馬遜把重心放在語(yǔ)音助手之后,情況正在發(fā)生變化。他說(shuō):“語(yǔ)音合成得到了改善......在我們正在使用他們的API的基礎(chǔ)上?!?/p>
在瘋狂學(xué)習(xí)的同時(shí),也有人為干預(yù)來(lái)塑造Alexa的人格。Kumar作為發(fā)言人在一封后續(xù)電子郵件中表示:“我們通過(guò)賦予Alexa特性屬性和個(gè)人偏好來(lái)賦予她人格?!八龑?duì)宗教是持不可知論的,政治上獨(dú)立,同時(shí)是科學(xué),技術(shù),創(chuàng)新,多樣性和社會(huì)進(jìn)步的堅(jiān)定支持者?!?/p>
Alexa可以成為女朋友還是忠誠(chéng)的伴侶? Kumar說(shuō):“我們希望Alexa能夠提供語(yǔ)音服務(wù),成為陪伴者,并且可以在任何情況下你都可以與之交談。 “如果你說(shuō)'我壓力很大',她會(huì)問(wèn)你是否想聽(tīng)一些冥想音樂(lè)?!?/p>
雷鋒網(wǎng)編譯 via Factory Daily
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。