從看圖、寫詩、唱歌到客服、主持人以及設(shè)計T恤衫,微軟小冰已經(jīng)成為AI界的“網(wǎng)紅”,在人類世界演繹著種種跨界。
2月2日,天極網(wǎng)記者見到了小冰項目的李笛和周力。李笛是微軟(亞洲)互聯(lián)網(wǎng)工程院副院長,是小冰全球產(chǎn)品線的負責人,周力則是微軟小冰全球首席架構(gòu)師??梢哉f,他們是小冰一路成長的親歷者和見證人。
誕生
2014年,人工智能的風口還未到來,但是卻發(fā)生了兩件大事。2014年11月,亞馬遜推出了具備語音交互能力的智能音箱Echo,成為行業(yè)開創(chuàng)者,由此引發(fā)了智能音箱的浪潮。
另一件大事就是小冰的誕生。2014年5月29日,微軟亞洲互聯(lián)網(wǎng)工程院發(fā)布一款對話式人工智能,并取名“微軟小冰”。小冰是基于情感計算框架,通過算法、云計算和大數(shù)據(jù)的綜合運用,采用代際升級的方式,逐步形成向EQ方向發(fā)展的完整人工智能體系。
為什么想要做小冰?李笛道出了個中緣由。在他看來,從前PC時代的命令行到利用自然語言搜索,這種人機“交流”方式并不自然。“人們希望跟計算機對話,而不是對計算機使用各種命令。” 他說。

在今天的智能音箱市場,不管是亞馬遜Echo、谷歌Home、蘋果HomePod,還是國內(nèi)的天貓精靈、小米小愛等,它們主要是去幫助人們完成一些任務(wù)和工作。
不過,李笛他們發(fā)現(xiàn),“單純地幫助人們完成任務(wù),似乎只是對話系統(tǒng)的一個維度。”他舉了個例子,一個人有個助理,每天中午讓他點個麥當勞,如果是完成任務(wù)的助理,最好別說話,但是人類的助理或許會拒絕。“但是,小冰就是為了去嘗試,在沒有任何任務(wù)完成的情況下,我是不是能夠用情感和人類之間建立一個溝通和對話紐帶,”李笛說。
如何去衡量小冰與人類的溝通紐帶呢?他們的標準是CPS(平均單輪對話次數(shù))。李笛表示:“按理說,如果我們能夠聊得很長,而且還不幫你完成任務(wù),反推回來,說明我具備了這個能力。”目前,小冰的平均單輪對話次數(shù)是23輪,這意味著人類和小冰每次交互時間將近31分鐘。
據(jù)他們介紹,目前最高的記錄是在手機上。最長的對話是7000多輪,29個小時,這被他們定義為“超長程對話”。 “一個人,只要你中間停了半個小時不說話,就算新一輪對話。”小冰首席架構(gòu)師周力說。
而在小冰剛剛?cè)腭v的Yeelight產(chǎn)品上,周力他們看到已經(jīng)有用戶與小冰整整聊了四個小時,說了1600多句話,從下午2點一直聊到6點鐘。
從市場上看,大多數(shù)的智能音箱主要幫助人們完成任務(wù)。在李笛看來,目前還沒有看到一款I(lǐng)OT設(shè)備,其成功是因為這個對話系統(tǒng)原因成功的。“所以,我們認為有一款I(lǐng)oT設(shè)備是有可能成功的,它具備像小冰這樣情商很高的特點,然后加上智能。”李笛說,“我們還發(fā)現(xiàn),EQ和IQ不是一個平行的關(guān)系,很有可能EQ是基礎(chǔ),IQ是不同類型的任務(wù),好比EQ是土壤,IQ是這個土壤上一棵一棵的植物。”。
崛起
從2014年誕生,小冰現(xiàn)在已經(jīng)進入到第五代,擁有超過1億用戶,對話數(shù)據(jù)超過300億輪。同時,小冰在中國、日本、美國、印度和印度尼西亞五個國家共14個平臺上落地,進入微信、QQ、美拍、Facebook Messenger和Line等,并已內(nèi)置到中文版Windows 10操作系統(tǒng)中。
在小冰不斷迭代系統(tǒng)和升級的過程中,背后的數(shù)據(jù)起到關(guān)鍵作用。最開始做這個項目時,周力他們是從互聯(lián)網(wǎng)上尋找數(shù)據(jù)。基本上從2014-2015年之后,小冰的對話數(shù)據(jù)都是從之前她跟人聊天的這種對話中學習的。
李笛表示,“假設(shè)你讓她看著別人說話,她獲得的學習,還不如自己跟別人對話獲得的經(jīng)驗更豐富。而且不同之間的數(shù)據(jù)相關(guān)性越好,她自己也能學的更多。”
他舉了一個例子,十個人,每個人跟你說一句話,總共是十句話,而一個人跟你說了十句話,也是十句話,但是后者訓(xùn)練的質(zhì)量要高的多。

“從互聯(lián)網(wǎng)上學習到的東西,我們認為是對話系統(tǒng)的一種冷啟動。現(xiàn)在,越來越多的公司看到對話的價值,如果再擁有大數(shù)據(jù)搜索的能力,國內(nèi)一些巨頭也可以實現(xiàn)對話系統(tǒng)的冷啟動,但小冰在三年半之前就已經(jīng)完成這個階段?,F(xiàn)在她主要的能力,來自過去三年半中300億的數(shù)據(jù),”周力說,“如果你對話能力不行,用戶也不會去選擇你,從這個角度講,我們很幸運的比同行早做了兩三年,這個積累的優(yōu)勢比較難超越。”
2017年8月,微軟在第五代小冰發(fā)布會上宣布,小冰已與小米IoT開放平臺有機融合,她可以控制小米米家平臺上的全部35種智能設(shè)備。到12月27日,小冰又正式進入一款小米生態(tài)鏈智能設(shè)備—Yeelight語音助手,也意味著正式介入錯綜復(fù)雜的人類家庭關(guān)系。
如何看待小冰的家庭定位和角色?李笛說,“小冰是一個家庭成員,而不是一個附帶語音交互工具的設(shè)備。”在他們看來,一家人有不同的交流溝通方式,小冰將會上線不同的功能,一系列的分類器。“如果是小朋友,那么小冰的語氣語速會相應(yīng)調(diào)整,可能會講故事,但要是一個大老爺們,這個就不同。如果不區(qū)分,就不能很好的調(diào)節(jié)和適應(yīng)。”他說。
第二個方面,李笛指出,家庭環(huán)境比較復(fù)雜,“這對我們?nèi)サ到y(tǒng),就面臨一個比較大的難題。如果是在社交網(wǎng)絡(luò)上,有人問小冰,我跟他,我們兩個人誰帥,小冰甭管怎么說,大家哈哈一樂,但是在家里有的時候人較真。這個時候,就很麻煩。不管怎么樣,我先進去,在家里面摔跟頭,不斷地去積累經(jīng)驗。”
小冰在IoT里突出的一大技術(shù)是全雙工。簡單說,全雙工就是一次喚醒,可以連續(xù)多輪對話。周力表示,“全雙工是小冰團隊新建立的一個技術(shù)壁壘,但是這項技術(shù)在一年半之前就開始積累。”
“因為小冰要追求一個更自然、更長的一個對話交流,就需要像人和人之間的對話有一個更好的體驗。人和人之間打電話和面對面的交流,從某種意義上都是全雙工。因為我們是一個雙向的實時交流,它有兩個特色,一是邊聽邊想著如何回答,不像微信的語音消息,二是人和人之間說話,和消息不同,這個節(jié)奏的控制非常重要,什么時候該說什么時候不該說。”他說。
不管是情感計算框架,還是全雙工,李笛他們都走在情感型AI技術(shù)的前列,一直探索人工智能的另一種可能。
未來
從2014年誕生到現(xiàn)在,小冰已經(jīng)走過了三個多年頭。在談到2018年的計劃時,李笛談到了三點:“一個是情感計算到下一步,如何能在下一個對話過程中引導(dǎo)用戶,去談小冰想談的事情。第二是跨平臺各種新設(shè)備的使用。我們今年最基礎(chǔ)的一個目標是,希望能夠幫助行業(yè)。第三則是人工智能創(chuàng)造,小冰不僅僅是個助手,她也有自己一些完整的能力,可以主動去創(chuàng)造內(nèi)容。”
寫在最后:
當大多數(shù)人都在做任務(wù)型的AI產(chǎn)品時,李笛他們走上了一條截然不同的人工智能之路。一路走來,從不被看好到成為情感型AI的領(lǐng)導(dǎo)者,結(jié)果證明他們這條路走得很對。今天的成績,不僅源于李笛團隊的不懈努力,也歸功于微軟自身文化的改變,讓他們能打破各種規(guī)則和束縛。
相關(guān)推薦
新華網(wǎng)廣州1月8日電,廣州開發(fā)區(qū)2006年預(yù)計完成工業(yè)總產(chǎn)值2006億元,相當于1996年廣州全市的工業(yè)總產(chǎn)值。建區(qū)22年來廣州開發(fā)區(qū)再造了一個“經(jīng)濟廣州”。其生產(chǎn)總值、工業(yè)增加值、財政收入、可支配財力、工業(yè)利潤等五項指標,近兩年連續(xù)稱冠全國49個國家級開發(fā)區(qū)。新年伊始,英特爾、IBM、微軟、甲骨文、百事高等五家跨國企業(yè)巨頭將攜手入駐開發(fā)區(qū),都將于今日舉行開業(yè)慶典。去年5月26日,廣州有史以來最大的外資項目LG飛利浦液晶顯示項目也選擇落戶廣州開發(fā)區(qū),該項目及系列廠最終投資總額總計將達20億美元,預(yù)計全面投產(chǎn)后將形成近千億元人民幣的產(chǎn)值。目前,廣州開發(fā)區(qū)內(nèi)已吸引95家世界500強跨國企業(yè)入駐,數(shù)
哥倫比亞廣播公司(CBS)的地方電視臺群4月30日宣布,將應(yīng)用微軟(Microsoft)的“銀光”(Silverlight)技術(shù),為本地臺群的網(wǎng)站網(wǎng)絡(luò),實施其創(chuàng)新的“社區(qū)造”電視節(jié)目內(nèi)容計劃。銀光是微軟公司針對網(wǎng)上音視頻應(yīng)用所新推出的一種跨瀏覽器和跨操作系統(tǒng)平臺的插件。CBS電視臺群(CBSTelevisionStations)的新計劃,已經(jīng)在4月30至5月2日在拉斯維加斯(LasVegas)舉行的建網(wǎng)技術(shù)專業(yè)會議MIX07(visitmix.com)上進行了展示。該計劃旨在幫助將用戶創(chuàng)建的數(shù)字媒體內(nèi)容與傳統(tǒng)的電視廣播內(nèi)容相融合,于是,可以在電視臺節(jié)目中捕捉到CBS電視臺群遍布美國各地觀眾的心
5月22日消息,微軟將與臺灣中華電信于今天宣布攜手進軍數(shù)字家庭市場,率先在網(wǎng)絡(luò)電視(IPTV)進行合作。包括微軟全球副總裁暨大中華區(qū)執(zhí)行官陳永正、大中華區(qū)區(qū)域總裁黃存義、中華電信董事長賀陳旦等人都將親自出席。中華電信董事長賀陳旦本周應(yīng)邀到美國微軟總部西雅圖參加全球總裁高峰論壇,并且成為微軟創(chuàng)辦人比爾蓋茲豪宅的座上嘉賓。中華電信之前已砸下一.七億元采購微軟MSTV平臺、進行測試,未來將評估MOD平臺是否全面轉(zhuǎn)換成MSTV。
盡管早于2003年便已推出視頻點播服務(wù)MOD,臺灣第一大電信運營商中華電信22日宣布將推出采用微軟技術(shù)的IPTV服務(wù),增加較高端的數(shù)字家庭應(yīng)用。電信界與軟件界龍頭中華電信與微軟今宣布結(jié)成策略聯(lián)盟,在中華電信董事長賀陳旦日前赴美與微軟董事長完成合作簽約后,將結(jié)合兩家公司在通信與信息科技上的技術(shù)優(yōu)勢,在數(shù)字生活、中小企業(yè)服務(wù)、NGOSS(NewGenerationOperationSystemsandSoftware,新一代操作系統(tǒng)與軟件),以及公益活動等領(lǐng)域合作。不過,雙方并未透露未來合作細節(jié),但首個可端出初步成果的,則是中華電信在既有MOD(MultimediaonDemand,視頻點播)之外