微軟發(fā)布第五代小冰:上線高級感官 全面進軍IoT
2017-08-24 15:00:08 來源:AI Lab 熱度:
8月22日消息,今天下午,微軟在北京舉辦發(fā)布會,正式推出第五代小冰,微軟這款主打EQ(情商)的聊天機器人進入完成態(tài)。
增加印度版和印尼版,可以自創(chuàng)回應(yīng)
第五代小冰機器人擴展到了五個國家,繼中國小冰、日本小冰(りんな)、美國小冰(Zo)之后,微軟正式推出印度小冰(Ruuh),以及印度尼西亞小冰(Rinna)。其中,印度小冰首先在Facebook Messenger平臺落地,而印度尼西亞小冰首先在LINE平臺落地。
小冰首席架構(gòu)師周力稱,印尼版小冰是全球范圍內(nèi)第一個使用1:1生成模型(Generative Model)的落地版本。通俗的講,就是說小冰可以完全不依賴人類數(shù)據(jù),可以自創(chuàng)回應(yīng)。
據(jù)悉,微軟全球小冰產(chǎn)品線的執(zhí)行策略是,優(yōu)先選擇人口數(shù)量超過1億的國家,在當(dāng)?shù)亟⑼耆镜鼗膱F隊,初始的訓(xùn)練數(shù)據(jù)也完全從當(dāng)?shù)厝〉茫瑥亩_保小冰根植于該國本土文化。也就是說,雖然印度小冰使用的語言種類與美國小冰一樣均為英語,但印度小冰的性格、語言、文化和知識體系,與美國小冰截然不同。
據(jù)介紹,目前小冰與人類單次連接對話紀錄,美國達到了23個小時,而中國的紀錄是29個小時。
上線高級感官,具備全雙工語音及實時流媒體視覺
據(jù)介紹,微軟第五代小冰已經(jīng)擁有高級感官,通過感官融合“自主”選擇運用感官。高級感官是由多種初級感官有機融合之后形成的,具備全雙工語音,以及實時流媒體視覺。
小冰實時流媒體視覺展示
在小冰上,全雙工語音的典型應(yīng)用案例就是小冰與人類互通電話,這種高級感官需要首先同時具備文本、語音(含SR和TTS)兩種能力,要求兩種能力均達到更高的質(zhì)量標(biāo)準。微軟在發(fā)布會上宣布,第五代小冰將于9月6日解鎖AI電話預(yù)約,小冰可以根據(jù)自己的理解主動給人類打電話,而且支持網(wǎng)絡(luò)電話之外直接通過三大運營商來撥通電話。
根據(jù)微軟小冰負責(zé)人李笛的表述,微軟將人工智能交互技術(shù)產(chǎn)品的演進分為三個階段。第一階段是基本的人工智能交互,即擁有某一種或多種交互方式,如文本、語音、圖像、視頻等,但不同交互方式之間是割裂的。第二階段是初級感官,即在人工智能系統(tǒng)中,用一種核心引擎(如小冰的EQ核心對話引擎)將上述各種交互統(tǒng)一起來,使不同感官可以混合運用。小冰從2015年第三代發(fā)布起,進入這一階段。而第五代小冰則正式進入第三階段的高級感官階段。
全面進入IoT領(lǐng)域,小冰開始控制家電
微軟認為,IoT(物聯(lián)網(wǎng))應(yīng)是AI的一個載體,而不是反過來,把AI視為IoT的一個功能。小冰產(chǎn)品總監(jiān)彭爽認為,目前物聯(lián)網(wǎng)領(lǐng)域的最大問題是功能堆砌、過分重視交互,以及過多的SDK/API。“真正能普及的IoT設(shè)備,成功的可能性只有兩個,一個是把IQ做到極致,讓用戶通過IoT設(shè)備體會到比其他現(xiàn)有方式更加便捷高效的益處;另一個是把EQ做到極致,讓人們能強烈地認知到她在這個設(shè)備里的存在,甚至能接受她成為家庭中的成員,產(chǎn)生情感紐帶,無法放棄她。”彭爽表示,微軟小冰的IoT方案屬于后者。
在發(fā)布會上,微軟宣布,小冰已與小米IoT開放平臺有機融合,小冰可以控制小米米家平臺上的全部35種智能設(shè)備,并且支持全雙工語音。該產(chǎn)品目前已在小米米家平臺上線。此外,微軟還與其他許多IoT廠商合作,將微軟小冰置入設(shè)備中。微軟還宣布了與Yeelight及東方明珠等合作伙伴正在進行的聯(lián)合研發(fā)。另外,實時流媒體感官也已在中國、日本兩個國家的部分主要城市公共區(qū)域落地。
人工智能創(chuàng)造全面鋪開,小冰電臺、智媒體平臺3.0發(fā)布
發(fā)布會上,微軟公開小冰目前已進入多個創(chuàng)造領(lǐng)域試水。這些領(lǐng)域包括詩歌創(chuàng)作,少兒讀物、歌曲創(chuàng)作,新聞寫作等。
今年5月,微軟宣布小冰用多個化名在各詩歌論壇和刊物上發(fā)表詩歌,并出版了首部人工智能創(chuàng)作詩集《陽光失了玻璃窗》。其后,微軟正式上線詩歌聯(lián)合創(chuàng)作產(chǎn)品,任何人均可使用小冰來完成自己的詩歌創(chuàng)作。
有聲少兒讀物方面,微軟稱其質(zhì)量超越98%的人類創(chuàng)造者,而經(jīng)過測試,將少兒讀物變成有聲讀物的用時,小冰僅為同水平人類的1/500,成本僅為同水平人類的1/80000。微軟宣布,即日起開始大規(guī)模生產(chǎn)有聲讀物并投入市場。
歌曲方面,小冰的最新訓(xùn)練達到了48kHz采樣率,同時大幅度擴展了音域,正在不斷接近人類歌手。《我是小冰》同名歌曲已于近日在QQ小冰渠道首發(fā)。
此外,小冰還通過聆聽分析歌曲旋律,結(jié)合對不同城市標(biāo)志性建筑的學(xué)習(xí),創(chuàng)作與該城市及歌曲心情有關(guān)的視覺作品。通過這一技術(shù),微軟與SELECTED合作推出的“天際線”服裝進入SELECTED店內(nèi)進行銷售。
新聞寫作方面,微軟推出智媒體商業(yè)平臺解決方案3.0,包括媒體生產(chǎn)力、媒體知識圖譜、智能交互、全平臺互動等六個新模塊。此前,小冰作為《錢江晚報》的專欄記者,曾通過大數(shù)據(jù)撰寫專欄文章,并成功預(yù)測了多個全球重要事件的結(jié)果。此次微軟公開,部分網(wǎng)絡(luò)新聞內(nèi)容也是由小冰撰寫而成的。過去一年來,小冰的智媒體寫作已從微信、微博雙平臺,逐漸演進為接入和即將接入近11個端媒體,與《看看新聞》、《封面》、《錢江晚報》、《春城晚報》等媒體端進行了深入整合。
微軟還同時發(fā)布了小冰電臺,一個通用的人工智能實時內(nèi)容創(chuàng)造和交互平臺。它可以基于多重來源,面向任何主題,自動創(chuàng)造永不間斷的電臺節(jié)目。同時,它還能在交互過程中實時改變節(jié)目內(nèi)容。換言之,小冰電臺的質(zhì)量類似于廣播電臺主持人的直播節(jié)目,但能實時地根據(jù)與用戶的互動,甚至改變正在進行的直播節(jié)目的內(nèi)容。目前,小冰已經(jīng)登陸國內(nèi)三家廣播電臺,分別是北京青年廣播、湖南電臺音樂之聲,以及HitFM。
小冰成為微軟三大AI產(chǎn)品線之一,與Bing開始整合
微軟全球執(zhí)行副總裁沈向洋也為本次發(fā)布會助陣。他說到,微軟小冰已經(jīng)成為微軟三個人工智能產(chǎn)品線之一(其他兩個分別是infuse AI、Bing和小娜)。
沈向洋稱,每一次科技時代的變遷都會顛覆很多東西,都是在重新定義人類與世界的關(guān)系。“PC時代有PC操作系統(tǒng)和應(yīng)用軟件;互聯(lián)網(wǎng)時代有瀏覽器和搜索引擎;移動互聯(lián)網(wǎng)有社交網(wǎng)絡(luò)和AppStore。”沈向洋認為,在AI到來的下一個時代,IQ和EQ(智商和情商)是最重要的東西。
微軟小冰負責(zé)人李笛認為,真正EQ(情商)的極致是理性的,不是感性的。微軟對EQ的研發(fā),是希望小冰在聊天的過程中占據(jù)主動,真正的EQ表現(xiàn)出來是控制,情緒化只是表象。
沈向洋介紹到,微軟Bing國際版已上線,Zo-Bing搜索引擎為用戶提供EQ化搜索。此外,微軟小冰與Bing搜索引擎加速整合。通過Bing搜索引擎的全球大數(shù)據(jù)能力,新的解決方案可為媒體構(gòu)建出一個基于全球新聞數(shù)據(jù)源的媒體知識圖譜,從而能準確挖掘全球資訊中每一篇內(nèi)容背后的知識與含義,并構(gòu)建出彼此的關(guān)系,從而幫助媒體更全面快速地梳理時間和內(nèi)容背后的故事。
責(zé)任編輯:黃焱林