
7月5日,阿里巴巴第一款人工智能音箱:天貓精靈X1正式落地。
此前界面新聞報(bào)道過這款人工智能音箱的定價(jià)、基本硬件參數(shù)。阿里人工智能實(shí)驗(yàn)室負(fù)責(zé)人陳麗娟告訴界面新聞?dòng)浾?,這款音箱除了市場上常見的內(nèi)容播出、提醒設(shè)置、鬧鐘天氣等,它在購物場景上更會(huì)領(lǐng)先行業(yè)均值。比如,179.99美元的亞馬遜Echo在購物上還是停留在以加入購物車為主,而阿里的這款“天貓精靈X1”音箱已經(jīng)能夠完成從回溯購買記錄、挑選下單到最后支付的整個(gè)過程。這主要得益于其搭載了內(nèi)置第一代中文人機(jī)交流系統(tǒng)AliGenie。這是阿里第一次正式發(fā)布智能音箱產(chǎn)品和中文人機(jī)交流系統(tǒng)。這款音箱的誕生也代表阿里對語音交互的重視,體現(xiàn)了其試圖搶占物聯(lián)網(wǎng)入口的企圖。
淘寶上的商品成千上萬,一款語音交互產(chǎn)品如何能挑選出消費(fèi)者想要的商品?陳麗娟表示,該款產(chǎn)品擁有“決策力”,它會(huì)學(xué)習(xí)消費(fèi)者的購物習(xí)慣、了解用戶畫像,然后再進(jìn)行興趣推薦。阿里在電商領(lǐng)域長期積累起來的技術(shù)優(yōu)勢可以直接用在語音交互場景下。
中美的居家環(huán)境有很大差異,所以直接將亞馬遜的Echo、蘋果的HomePod搬到中國市場來可能并不是很接地氣。美國人使用智能音箱頻率最高的場景是在廚房,做菜時(shí)需要訂一個(gè)倒計(jì)時(shí)等。到了國內(nèi)市場,智能硬件設(shè)備千差萬別、中國用戶更需要一個(gè)助手級的、對中文語音交互友好的“全能產(chǎn)品”。
語音交互拆解來看,可以分成語音識別、語音合成和自然語言處理等,每一個(gè)大塊又可以分成更細(xì)節(jié)的處理步驟。而國內(nèi)做語音行業(yè)的公司,多半停留在語音輸入法(如科大訊飛),或語音搜索。真正能將語音交互商用的仍十分有限。除了產(chǎn)品層面,自然語音處理技術(shù)(NLP)仍是人工智能行業(yè)最有挑戰(zhàn)的部分。
阿里正是看中了這樣的市場機(jī)會(huì)和行業(yè)風(fēng)口。
阿里人工智能實(shí)驗(yàn)室負(fù)責(zé)人陳麗娟是淘寶最早的一批產(chǎn)品經(jīng)理。按照阿里慣常的方法,這款人工智能音箱也是采用了“淘寶模式”,即對開發(fā)者足夠友好,開放API接口,接入各種智能設(shè)備和軟件App。這與蘋果的HomePod完全不同,蘋果公司為了安全考慮,要求所有接入Homekit平臺(tái)的設(shè)備都要裝入特殊的MFi芯片,這無意間抬高了硬件創(chuàng)業(yè)公司接入蘋果設(shè)備的成本。
據(jù)界面新聞?dòng)浾吡私猓⒗锎笊鷳B(tài)環(huán)境的支持將成為這款音箱最核心的優(yōu)勢。在軟件層面,阿里音箱有阿里文娛體系下內(nèi)容的支持,比如優(yōu)酷的視頻內(nèi)容轉(zhuǎn)錄;目前第三方App在陸續(xù)適配,例如健身軟件Keep和喜馬拉雅FM等。在硬件上,有阿里智能IoE的接入,目前正在談得包括古北科技、涂鴉科技等;品類總量在100家以上。阿里大生態(tài)環(huán)境的支持將成為這款音箱最核心的優(yōu)勢。
阿里鼓勵(lì)用戶建立自己的“語音公眾號”,這部分更針對個(gè)人。在輔助的App里,用戶可以錄入自己的音頻文件,直接在后臺(tái)播放,未來還可能嘗試付費(fèi)模式。鼓勵(lì)用戶充分建立自己的語音信息,運(yùn)用到具體的場景里。
雖然這款產(chǎn)品的名字是掛在“天貓”下面的,但足夠可以看出阿里對于語音交互的重視。在這場幾乎所有互聯(lián)網(wǎng)公司都已經(jīng)入場的技術(shù)大戰(zhàn)中,阿里不希望落后。
在阿里巴巴技術(shù)團(tuán)隊(duì)中,流傳著這樣一句話:“阿里巴巴的商業(yè)掩蓋了技術(shù)光芒。”不論正確與否,至少這代表了阿里的技術(shù)自信。
阿里巴巴的語音識別技術(shù)早就存在,只是一直沒有對外公布。最早的應(yīng)用在客服體系中,因?yàn)榭头墙佑|語音最多的部門,客戶每天會(huì)打電話進(jìn)來,在客服的質(zhì)檢抽查中,人工質(zhì)檢效率低下,就需要語音技術(shù)識別、轉(zhuǎn)化成文字版本,這是語音技術(shù)的第一個(gè)應(yīng)用場景。
在天貓?zhí)詫欰pp中,都已經(jīng)嵌入了語音搜索功能,神馬搜索中也使用到了語音搜索技術(shù)。雖然識別的準(zhǔn)確率有待提高,但這些都表明,阿里的語音交互產(chǎn)品是多年積累下來的技術(shù),可以用在各個(gè)產(chǎn)品和場景中。
在接受采訪時(shí),陳麗娟強(qiáng)調(diào),阿里巴巴所采用的供應(yīng)商思必馳只是用了它六個(gè)麥克風(fēng)陣列的架構(gòu)設(shè)計(jì),語音交互是阿里的核心技術(shù)之一。在語料的搜集上,都是使用阿里生態(tài)各產(chǎn)品中的語料,淘寶有4.5億的月活,其中如果只有1%的使用語音搜索,其可訓(xùn)練語料都非??捎^;也有一些語料采用了眾包購買的方式。
未來,除了這款音箱,語音交互可能更多用于阿里生態(tài)中的購物充值、汽車操作系統(tǒng)、TTS語音轉(zhuǎn)換(Text to Speech)等場景中。
在天貓精靈X1發(fā)布的同一天,百度也公布了基于自然語言處理的DuerOS語音系統(tǒng),這與阿里巴巴的語音交互系統(tǒng)Ali Genie形成正面競爭。
在評價(jià)競爭對手時(shí),陳麗娟說,“今天我們的天貓精靈大家手上就能拿得到,上手可用。但是DuerOS這個(gè)東西大家買過嗎?它的差距不光只是說技術(shù)層面的,我們要把這個(gè)路都跑通,成功了才會(huì)有更多這樣的合作伙伴跟我們一起玩。”
這話更直白一點(diǎn),意思就是,盡管李彥宏已經(jīng)坐著有人駕駛的“無人駕駛汽車”在五環(huán)上上路,DuerOS距離完全可商用產(chǎn)品的面市還有一段時(shí)間。
阿里智能音箱是阿里巴巴人工智能實(shí)驗(yàn)室出手的第一臺(tái)商用產(chǎn)品,是語音交互能力的集中體現(xiàn)。
在最開始,阿里并沒有想做一款語音硬件產(chǎn)品,因?yàn)橛布a(chǎn)品供應(yīng)鏈長。但后來團(tuán)隊(duì)發(fā)現(xiàn)一款智能音箱涉及的關(guān)鍵環(huán)節(jié)太多,阿里放棄了完全代工的模式,轉(zhuǎn)而自主研發(fā)。整個(gè)研發(fā)周期前后跨度一年,最大的難點(diǎn)就在于每條鏈路都是單線的。
比如,麥克風(fēng)陣列里面需要密封,第一版產(chǎn)品密封性不好,稍微漏氣就會(huì)影響到ASR(自動(dòng)語音識別),ASR不準(zhǔn)確會(huì)進(jìn)一步影響到NLP(自然語言處理),進(jìn)而影響到全局,是一個(gè)線性增長放大的蝴蝶效應(yīng)。
從2017年開始,阿里巴巴正在不斷加強(qiáng)對人工智能的人力投入,挖來前南洋理工大學(xué)終身教授王剛,還找來亞馬遜資深主任科學(xué)家(Senior Principal Scientist)任小楓擔(dān)任人工智能團(tuán)隊(duì)iDST的副院長和首席科學(xué)家等。
從組織架構(gòu)上,阿里的人工智能實(shí)驗(yàn)室組織劃分也更加明確。2013年前后成立的iDST是AI基礎(chǔ)技術(shù)研究機(jī)構(gòu),也是2016年成立的人工智能實(shí)驗(yàn)室(AI Labs)的前身,其研究成果來源于iDST的技術(shù)積累,并應(yīng)用于阿里巴巴的各個(gè)產(chǎn)品線。
在大框架上,實(shí)驗(yàn)室內(nèi)部分為終端實(shí)驗(yàn)室、硬件實(shí)驗(yàn)室、代碼實(shí)驗(yàn)室,并不是完全按照產(chǎn)品線劃分。以人工智能領(lǐng)域很重要的計(jì)算能力來講,在不同實(shí)驗(yàn)室里,計(jì)算能力又分為在云端計(jì)算和在終端上的計(jì)算能力。
AI實(shí)驗(yàn)室看起來更應(yīng)該從事底層技術(shù)研究,阿里巴巴也沒有太多硬件傳統(tǒng),更多定位于一家大數(shù)據(jù)驅(qū)動(dòng)的公司。在解釋阿里為什么會(huì)做硬件時(shí),陳麗娟這樣表述:“我們不想把它停留在實(shí)驗(yàn)室。AI應(yīng)該是具體的服務(wù),應(yīng)該給用戶帶來新的體驗(yàn)。哪怕淘寶第一版購物體驗(yàn)很差,但相比于線下購物,仍然能給用戶帶來不一樣的感覺。今天AI應(yīng)該是技術(shù)產(chǎn)品還是產(chǎn)品技術(shù),這是一個(gè)問題。”
責(zé)任編輯:黃焱林
相關(guān)推薦
樂視網(wǎng)阿里巴巴角逐智能電視操作系統(tǒng)
PC操作系統(tǒng)爭霸成就了微軟,手機(jī)操作系統(tǒng)爭霸,安卓,蘋果iO S以及微軟W indow sPhone、塞班等正激烈博弈以實(shí)現(xiàn)最大的商業(yè)價(jià)值,隨著大...
彩電廠商或遭阿里TV逐個(gè)擊破
消息人士透露,目前阿里已經(jīng)與長虹取得深度交流,雖然長虹還未加盟阿里,但不排除雙方有走在一起的可能阿里推出的阿里TV操作系統(tǒng)一時(shí)間引發(fā)...