Facebook使用AI來實現(xiàn)文字轉(zhuǎn)語音系統(tǒng)
2017-09-11 11:38:16 來源:TechWeb 熱度:
在人工智能領(lǐng)域中,語音也是AI技術(shù)的一部分,說到語音合成,它是通過機械的、電子的方法產(chǎn)生人造語音的技術(shù)。TTS技術(shù)(又稱文語轉(zhuǎn)換技術(shù))隸屬于語音合成,它是將計算機自己產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)榭梢月牭枚摹⒘骼臐h語口語輸出的技術(shù)。

據(jù)媒體報道,F(xiàn)acebook研究員開源了其在今年七月發(fā)表的一篇論文中的語音合成方法。在論文中,他們提出了一種新的文字轉(zhuǎn)語音的神經(jīng)網(wǎng)絡(luò)方法,可以將從開放場景下采樣到的聲音中提取的文字轉(zhuǎn)化為語音。

說到神經(jīng)網(wǎng)絡(luò),該技術(shù)基于新的移位緩沖內(nèi)存儲器區(qū),評估使用者注意力,計算輸出音頻,以及自身的更新,可用于在開放場景下采樣到的聲音轉(zhuǎn)化成文字,再轉(zhuǎn)化成語音。該技術(shù)的網(wǎng)絡(luò)架構(gòu)比現(xiàn)存的同類架構(gòu)要簡單。
此外,通過使用與上下文無關(guān)的查找表對輸入語句進行編碼,該表的每個條目包含一個字符或音素。同樣,能通過一個短向量來表示說話者,這個短向量也適用于新說話者。而且在生成音頻之前,優(yōu)先準(zhǔn)備好緩沖區(qū)可以使生成的語音具有可變性。
責(zé)任編輯:黃焱林
相關(guān)推薦
ARM再壯大 Facebook硬件負責(zé)人加入Calxeda
Facebook硬件設(shè)計和供應(yīng)鏈運營的負責(zé)人加入了Calxeda董事會,Calxeda是一家致力于在ARM處理器之外搭建服務(wù)器的公司。Calxeda于上周四宣布了這一戰(zhàn)略性的任命, Frankovsky所負責(zé)的部門是目前芯片產(chǎn)品的最大購買者,也是Open Source數(shù)據(jù)中心硬件Open Compute Project計劃的領(lǐng)導(dǎo)者,他加入Calxeda董事會后,可以進一步了解這家有野心在數(shù)據(jù)中心領(lǐng)域取代I