中國在AI領(lǐng)域發(fā)展的成績一直備受矚目。2017年年底,國家科技部網(wǎng)站就曾發(fā)布公告稱“將全面推進規(guī)劃和重大科技項目啟動實施”,并強調(diào)“要把發(fā)展人工智能作為當(dāng)前乃至未來一項戰(zhàn)略性任務(wù)來抓”,同時還公布了以百度為首的首批國家新一代人工智能開放創(chuàng)新平臺名單。
在中國互聯(lián)網(wǎng)公司中,百度一直以更強的技術(shù)基因著稱,在無人駕駛、人臉識別、語音技術(shù)等AI領(lǐng)域中都取得了不菲的成績,而這些也讓百度成為AI技術(shù)的中國名片。2018年開年,百度AI技術(shù)平臺體系(AIG)平臺下的“橋頭堡”——百度輸入法為百度AI技術(shù)打響了第一戰(zhàn)。主題為“AI輸入,開啟全感官輸入時代”的發(fā)布會于1月17日在京舉辦,會上百度輸入法指出:截至目前百度輸入法月活用戶已達4億,語音輸入日流量超過2.5億。
據(jù)悉,發(fā)布會的亮點之一是百度語音技術(shù)的最新突破——Deep Peak2模型,該技術(shù)的發(fā)布是語音識別工業(yè)歷史上巨大的技術(shù)進步,百度先于其他國家將AI語音識別技術(shù)適配進日漸國際化的日常聊天場景中。Deep Peak2模型,全稱為“基于 LSTM和 CTC的上下文無關(guān)音素組合建模”,突破了沿用十幾年的傳統(tǒng)模型,更能充分發(fā)揮神經(jīng)網(wǎng)絡(luò)模型的參數(shù)優(yōu)勢,大幅提升中英文、多種口音、多種風(fēng)格(如朗讀、聊天、輕聲)混合輸入的識別準(zhǔn)確率,聊天場景下的相對正確率較行業(yè)領(lǐng)先水平提升20%。
此外,大會當(dāng)天還發(fā)布了百度輸入法v8.0全新版本。該版本擁有“語音速記”和“AR表情”兩大亮點功能。“語音速記”的發(fā)布,同時標(biāo)志著“聲紋識別”技術(shù)在輸入法領(lǐng)域的獨家首發(fā)。該技術(shù)針對2-3人小型會議場景,可根據(jù)聲紋自動區(qū)別發(fā)言人,實現(xiàn)智能化的語音識別。同時,百度輸入法還先于全球其他公司將該功能定為終身免費,將先進的AI技術(shù)拉近每一位用戶,從而解決實際問題。而“AR表情”功能則基于百度領(lǐng)先的人臉識別技術(shù)和 AR技術(shù),不僅可支持用戶根據(jù)相機或相冊進行人臉識別、制作表情包,還支持用戶通過自己的表情控制虛擬人物形象而制作表情包。對于“表情包”的大量使用,不僅是中國年輕一代特有的文化,被眾多網(wǎng)民笑稱“當(dāng)代第五大發(fā)明”,還是中國移動科技飛速進步的表現(xiàn)之一。而百度輸入法此次結(jié)合國際級非物質(zhì)文化遺產(chǎn),同比全球其他科技公司,率先全面普及AR表情的制作與使用,更能體現(xiàn)出其“科技領(lǐng)先、貼近用戶、落地實際”的快速執(zhí)行力。
百度在AI方面的發(fā)展,不僅以技術(shù)突破為重點,也同樣看中技術(shù)應(yīng)用在產(chǎn)品中,實際服務(wù)生活,從而推動社會的進步。目前,百度在AI方面的布局已經(jīng)非常完善,通過“平臺化+生態(tài)化”,百度正在帶動著中國AI行業(yè)整體發(fā)展,讓技術(shù)真正能夠用于生活、影響社會發(fā)展。