在 2017 年 10 月的秋季發(fā)布會上,Google 發(fā)布了智能相機 Clips,它沒有取景框和麥克風(fēng),只有攝像頭和快門,使用機器學(xué)習(xí)來幫助用戶抓拍精彩瞬間,所有一切都自動完成。這個其貌不揚的「小產(chǎn)品」實際上凝聚了 Google 在智能硬件上的巨大野心。
在那次發(fā)布會上,Google 提出了「AI+硬件+軟件」的概念,而 Clips 正是這個理念下最具代表性的產(chǎn)品。1 月 27 日,Clips 終于上架 Google 商店,以 249 美元的價格出售。也許是為了配合上市,Google 以 Clips 為案例發(fā)表了一篇長文,闡述「以人為本」的設(shè)計理念,從中可以看到 Google 對 AI 應(yīng)用的一些思考、堅持的原則和方法論。
以下內(nèi)容根據(jù) Google Design 發(fā)表的「The UX of AI」一文編譯,內(nèi)容有適當(dāng)刪減。
解決真正的人類需求
機器學(xué)習(xí)無法得知哪些問題需要被解決,如果不從人的需求出發(fā),最終就會為了一個很小甚至是不存在的需求,去建立一個強大的系統(tǒng)。所以,AI 應(yīng)該從人的需求出發(fā)。
在今年,人們將拍攝大約一萬億張照片,對于大多數(shù)人來講,這意味著我們會有一個實際上不會再去翻看的電子相冊。尤其是對于新生兒的父母,他們生活中的每個點滴都值得記錄。在那些珍貴而又短暫的時刻,他們需要將注意力放在手機上,通過屏幕來看自己的孩子,而不是和孩子進(jìn)行交流。
我們需要一個隨時隨地在線的攝影師在身邊,捕捉那些珍貴但轉(zhuǎn)瞬即逝的時刻,比如孩子的微笑,Clips 就是為此而生。
AI 需要人類的引導(dǎo)
機器學(xué)習(xí)是一個多學(xué)科的系統(tǒng),根據(jù)數(shù)據(jù)自動分析出規(guī)律然后進(jìn)行預(yù)測。模型的任務(wù)就是評判這些規(guī)律的重要性,盡可能保證準(zhǔn)確。但需要注意的是,從建立模型、選擇數(shù)據(jù)源到打標(biāo)簽,都會影響最終的結(jié)果,而這些都會受到人類判斷的影響。所以,人類引導(dǎo)在機器學(xué)習(xí)中的作用不可忽視。
解決抓拍照片的問題,最緊迫的一點是:如果人們拍攝了大量照片,但其實并不想事后重新編輯、整理,那么該如何標(biāo)記這些照片呢?這就需要一個理論上的「人類專家」來完成這個任務(wù)。這里的理論有兩層含義:首先,如果人類無法完成這個任務(wù),那么 AI 也不能。其次,通過研究人類專家的行為,我們可以知道如何進(jìn)行數(shù)據(jù)收集、標(biāo)記和建立機器學(xué)習(xí)模型。
通過不斷的嘗試,我們找到了一個紀(jì)錄片制作人、一個攝影記者和一個藝術(shù)攝影師,利用他們的專業(yè)知識和經(jīng)驗,試圖回答「哪些瞬間值得被記錄」。
判斷標(biāo)準(zhǔn)要統(tǒng)一
我們將景深、三分法則、燈光照明、構(gòu)圖、故事性等標(biāo)準(zhǔn)全部加入進(jìn)去,讓它在一個足夠簡化的框架下進(jìn)行學(xué)習(xí)。
老師給出兩個完全不同的例子時,學(xué)生會快速給出反饋,但算法不會。對于 Clips 來說,不光要讓它學(xué)會哪些瞬間值得記錄,還要知道忽略哪種類型的照片。
比如在抓拍時,忽略手指擋住鏡頭、快速晃動、模糊的照片,留下穩(wěn)定、清晰、構(gòu)圖合適的照片,面部檢測可以實現(xiàn)這一點
拍照的前提是彼此熟悉,用相機朝向某人時,他們會微笑或點頭表示同意,有了智能相機,可以根據(jù)社交關(guān)系來判斷你所要關(guān)注的人是誰,判斷標(biāo)準(zhǔn)可以使這些人在你照片中出現(xiàn)的次數(shù)等,這樣就避免抓拍到不相關(guān)的陌生人。
建立信任
Google 在 Clips 上投入精力的原因之一是想向全世界展示,將機器學(xué)習(xí)內(nèi)置到設(shè)備中,并進(jìn)行隱私保護(hù)的重要性。相機是個很私人的東西,我們一直在努力確保它的硬件、智能系統(tǒng)和內(nèi)容都只屬于用戶自己,所以在 Clips 上增加了軟件取景器和快門按鈕。用戶對于留下來的照片有最終決定權(quán),我們會展示被挑選出的「精彩瞬間」,用戶也可以自己選擇視頻的長短,或者刪除哪些照片。
和傳統(tǒng)的工具相比,機器學(xué)習(xí)系統(tǒng)無法避免 bug,所以「完美」是不可能的,甚至不能當(dāng)成一個目標(biāo)。因為用機器學(xué)習(xí)進(jìn)行預(yù)測,本身就是一個模糊的技術(shù)。但也正是因為這種模糊性,我們可以設(shè)計出更強大、復(fù)雜的判別系統(tǒng)。Clips 能做的不僅是保存、刪除、編輯,還根據(jù)用戶、拍攝對象的狀態(tài)不斷變化,隨時間不斷學(xué)習(xí)。
在「以人為本」的理念下,我們可以釋放機器學(xué)習(xí)更大的潛力,讓機器變得更加智能,探索增強人類能力的方法。首先要牢記幾點:尋找和解決人類的真正需求、維護(hù)人類的價值、增強人類的能力而不是將一切都自動化。
人工智能的作用不應(yīng)該是替我們大海撈針,而是向我們展示它能清除多少海草,以便我們更容易找到針。
相關(guān)推薦
北京時間4月21日消息,據(jù)國外媒體報道,湯森路透旗下風(fēng)投資訊網(wǎng)站PEHub當(dāng)?shù)貢r間周二消息稱,谷歌(Google)已經(jīng)收購了芯片設(shè)計創(chuàng)業(yè)公司Agnilux。谷歌發(fā)言人證實雙方已經(jīng)達(dá)成收購協(xié)議,但沒有披露進(jìn)一步詳情。業(yè)界目前對Agnilux的了解并不多,只知道它是由蘋果2008年收購的芯片設(shè)計公司P.A.Semi的前員工創(chuàng)辦的?!都~約時報》經(jīng)過調(diào)查發(fā)現(xiàn),Agnilux聯(lián)合創(chuàng)始人中包括數(shù)名P.A.Semi和蘋果員工,以及數(shù)字錄像設(shè)備廠商TiVo前軟件設(shè)計師斯科特·雷德曼(ScottRedman)。業(yè)內(nèi)人士指出,谷歌收購Agnilux可能意在服務(wù)器。多年來,谷歌一直自行設(shè)計服務(wù)器硬件?!都~約時報》認(rèn)
據(jù)媒體報道,Google(Google)已經(jīng)收購了芯片設(shè)計創(chuàng)業(yè)公司Agnilux。Google發(fā)言人證實雙方已經(jīng)達(dá)成收購協(xié)議,但沒有披露進(jìn)一步詳情。業(yè)界目前對Agnilux的了解并不多,只知道它是由蘋果2008年收購的芯片設(shè)計公司P.A.Semi的前員工創(chuàng)辦的。《紐約時報》經(jīng)過調(diào)查發(fā)現(xiàn),Agnilux聯(lián)合創(chuàng)始人中包括數(shù)名P.A.Semi和蘋果員工,以及數(shù)字錄像設(shè)備廠商TiVo前軟件設(shè)計師斯科特·雷德曼(ScottRedman)。業(yè)內(nèi)人士指出,Google收購Agnilux可能意在服務(wù)器。多年來,Google一直自行設(shè)計服務(wù)器硬件?!都~約時報》認(rèn)為,Agnilux在開發(fā)一款服務(wù)器芯片。但是,由于
近幾年通過與日本索尼和夏普的激烈競爭,三星電子和LG電子的全球電視市場占有率已分列前二。其間,專家們認(rèn)為韓國的電視產(chǎn)業(yè)會在一段時間內(nèi)領(lǐng)先于日本。但蘋果和谷歌加入戰(zhàn)團(tuán),這就成為了會改變市場格局的新變數(shù)。蘋果公司CEO史蒂夫-喬布斯最近說:“將在年內(nèi)推出非凡(extraordinary)的新產(chǎn)品。”外電將這段話解釋為,蘋果公司可能涉足電視市場。此外,谷歌也在加緊推出內(nèi)裝谷歌開發(fā)的操作系統(tǒng)——Android的電視。蘋果公司和谷歌計劃推出的電視可以上網(wǎng)下載各種視頻和軟件,具有一定的電腦功能。例如,“谷歌電視”(GoogleTV)可以在觀看電視時切換到推特(Tweet)或Facebook等社交服務(wù)網(wǎng)站,
周鴻祎的辦公室擺放著一套近300萬元人民幣的音響設(shè)備,拍照前,他叮囑攝影師不要碰到它在中國互聯(lián)網(wǎng)的世界里,周鴻祎絕對是個人物:他和李彥宏搶過生意打過官司、和馬云相互“封殺”對方、搶過丁磊的地盤、連楊致遠(yuǎn)都親自給VC寫信說不要投資給他、和管網(wǎng)站注冊報備的CNNIC干過仗,現(xiàn)在則讓互聯(lián)網(wǎng)安全同行寢食難安,口口聲聲要學(xué)習(xí)馬化騰的“先進(jìn)經(jīng)驗”、卻又時時盯著對方的腳步。他起初是國企的項目經(jīng)理,然后創(chuàng)業(yè),被跨國公司收購又當(dāng)了中國區(qū)CEO,入職過國際