“人工智能”(AI)概念的普及,讓專攻領域的學者們更加意識到研究的緊迫性。如何在日新月異的當下不斷挖掘人工智能的深度是所有學術(shù)研究者必須思考的問題。恰逢2017年開局之際,DVBCN推出了人工智能年度人物專欄,聚焦當前人工智能領域,本期分享谷歌云首席科學家、斯坦福終身教授李飛飛女士與人工智能的奇妙之旅。
“作為人工智能領域的領導者之一,對于開創(chuàng)那些最前沿、可以造福人類的技術(shù),以及培養(yǎng)出未來可以做這些貢獻的技術(shù)人才,我始終抱有極大的熱情和責任。”李飛飛教授說道:“我覺得這是我的夙愿和使命。”
李飛飛,1976年出生于北京,16歲隨父母移居美國新澤西州。1999年畢業(yè)于普林斯頓大學后,2005年獲得加州理工學院電子工程博士學位,2009年加入斯坦福大學任助理教授,并于2012年擔任終身教授、斯坦福人工智能實驗室與視覺實驗室主任,2016年11月15日,加入谷歌公司任人工智能(AI)研究員。李飛飛是全球人工智能領域最具影響力的科學家之一。
2007年,李飛飛與普林斯頓大學教授李凱發(fā)起的ImageNet(圖片網(wǎng)絡),目前已經(jīng)成為全球最大的圖像識別數(shù)據(jù)庫,對計算機圖像識別的研究起到了顛覆性的推動作用,是本世紀人工智能領域最大的進展之一。
從兼職生到斯坦福教授的逆襲,追夢之旅
李飛飛教授16歲跟隨父母從中國來美國追夢,為了夢想成真一路上她付出了很多。為了能進一所好一些的高中,她獨自一人在各個政府機構(gòu)與高中學校來回奔波,才勉強入學一所中等學校。入學后的養(yǎng)活自己成了大問題,所以她開始了兼職生活,做清潔工、當中餐館收銀員、開洗衣店……高中畢業(yè),她進入了全額的獎學金的普林斯頓大學。
為了改善父母生活,李飛飛敏銳地注意到了市場上的機會,借錢買下一家洗衣店,交給父母經(jīng)營。她從此過上了雙城生活,周一到周五,她是普林斯頓的高材生,拼命努力吸收知識;周六到周日,她則走出實驗室,回到Parsippany穿上白圍裙,給洗衣店幫忙。
1999年,李飛飛以最高榮譽從普林斯頓本科畢業(yè)。當時正值大牛市,華爾街眾多投行和咨詢公司都向她發(fā)來了邀請,數(shù)十萬的年薪眼看唾手可得。但這個自從來到美國以后,就飽受經(jīng)濟壓力的乖乖女,卻少見地叛逆了一回。她決定去西藏研究一年藏藥,之后去加州理工學院攻讀PHD。
博士畢業(yè)后,她又選擇了當時還不太流行的圖像識別作為研究方向。當我們今天縱觀李飛飛的人生時,會發(fā)現(xiàn),這種追隨內(nèi)心的熱情和強硬堅韌的作風,始終貫穿著她的行為軌跡。
執(zhí)著跟隨自己內(nèi)心,冷靜探索熱門領域

人生中真正的挑戰(zhàn)到底是什么?李飛飛教授給出了這樣的回答:“最現(xiàn)實的生存挑戰(zhàn)是如何全力以赴、如何身兼重任并誠實地面對心中的夢想。”她認為,真正生命中的最關鍵問題是如何充分發(fā)揮一個人的潛力,既要單帶生活的責任,又要對得起自己的夢想。
在2017年1月中旬連續(xù)參加完“極客公園 2017 創(chuàng)新大會”以及“未來論壇”等多項國內(nèi)熱門活動之后,李飛飛表示,她完全沒有想到國內(nèi)對人工智能的熱情如此之高,也沒有料到自己竟意外地身處這股風潮的正中心。盡管如此,她依舊保持著自己的冷靜與真心,她說:“我個人的心得是,眼睛看到的前方應該是比較空曠的。”“如果你眼睛看到的前方是熱鬧的,那這個方向就不是最好的研究方向。而空曠的地方一般都不是熱點,因此你必須找準自己的焦點。”李飛飛坦承,她不是一個特別關注熱點的人,“如果我關注熱點,就沒有今天的ImageNet。”
她也給年輕人囑咐道,“找到你內(nèi)心的熱情,去堅持做一件事情。年輕人很容易被外在的熱鬧所吸引,但是最終要找到自己內(nèi)心的東西。知道怎么聽自己的聲音,這是一種慢慢形成的心理習慣和生活態(tài)度。它需要內(nèi)心的安靜,需要有能力不斷為自己創(chuàng)造時間和空間,去讀該讀的書、思考自己該思考的問題。沒有養(yǎng)成這種內(nèi)心的習慣,臨時來做是非常難的。”
“作為計算機視覺的科學家,我們希望使用能夠?qū)W習視覺世界的人工智能算法來識別圖像和視頻,我們有這樣一個小目標,讓計算機視覺為數(shù)字世界帶來光明。”
在孩子的學習中感悟計算機訓練之道

李飛飛教授表示,在找到更好的算法之前,我們需要給計算機進行像孩子們大腦發(fā)育時期一樣的訓練,也即是給計算機比目前領域內(nèi)所使用得多得多的訓練數(shù)據(jù)集。他們花了很多時間來做這項研究,她和普林斯頓的同事一起在網(wǎng)絡上找到了很多圖片、很多數(shù)據(jù),用了成百上千的圖片構(gòu)建這套系統(tǒng)。
在三年的辛勤研究后,2009年李飛飛教授與她的團隊終于做出了這樣一個體系,其中包括1500萬張圖片和22000個不同的單詞門類,都是我們?nèi)粘R姷降?,從?shù)量和質(zhì)量來說,這個系統(tǒng)在計算機視覺和機器學習方面都是前所未有的,也因此在解決計算機物體識別這個問題上,比以往任何時候都準備充分。李飛飛教授總結(jié)到,從孩子的角度他們獲取了寶貴的第一課,從大量數(shù)據(jù)中學習。
來自大腦的靈感建立卷積神經(jīng)網(wǎng)絡

卷積神經(jīng)網(wǎng)絡,最初是由70、80年代代科學家們開拓的一個領域,其靈感來自大腦。李飛飛教授談到,就像人類的大腦一樣,卷積神經(jīng)網(wǎng)絡有成百上千個“類神經(jīng)元”單位互相連接在一起。這是一個非常經(jīng)典的放在電腦上的神經(jīng)系統(tǒng),它大概有2400萬個節(jié)點,1.4億個參數(shù)和150億個接口。擁有這么龐大的信息的圖片庫,卷積神經(jīng)網(wǎng)絡算法以難以預料到的速度迅速發(fā)展了起來,也在物品識別上給我們帶來了一些非常振奮人心的結(jié)果。
李飛飛教授認為要教電腦看懂圖片,并且用一句話來描述它,其實需要用到神經(jīng)系統(tǒng),并且把神經(jīng)系統(tǒng)推向一個高度,需要把視覺信息和文本信息結(jié)合起來,并且讓它生成出一句具有意義的句子。因此在得到大腦的啟發(fā)之后,李飛飛教授和團隊發(fā)現(xiàn)深度學習的算法和公式能夠幫助他們做一些視覺方面的檢測。
從技術(shù)從業(yè)者的視角: 讓真實世界從中獲益

在神經(jīng)網(wǎng)絡和深度學習技術(shù)得到如此大的發(fā)展之后,李飛飛教授也開始把焦點轉(zhuǎn)向其它一些視覺領域,比如視頻,在圖片識別中學習到的東西能否復制到視頻中去,能否讓真實世界從中獲益。
他們調(diào)取一些醫(yī)院的安檢視頻,通過深度傳感器的視頻來進行分析應用,通過這樣可以識別出人類的肢體活動,看看他們在環(huán)境下的行為是安全的還是危險的。他們還和歐洲一個火車站進行了合作,將成百上千個傳感器安裝在公共空間,利用這些計算機的傳感器來追蹤每個乘客的行動,通過這樣一種監(jiān)測可以幫助優(yōu)化火車站的空間,調(diào)整火車發(fā)車時段。
利用了深度學習和卷積神經(jīng)網(wǎng)絡、遞歸神經(jīng)網(wǎng)絡讓機器學習如何預測人類行為的軌跡,這項工作的有趣之處在于能夠把我們前邊所討論的問題結(jié)合在一起,這樣,算法不僅有IQ——可以識別出人,而且它也有EQ,有情商——可以預測人的社會行為,譬如說機器人的行為:機器人不應該干擾人的行為,或者是機器人在空間行走時不能打破東西。
高度重視AI多樣性,在提高的路上不斷前行
在AI中多樣性的必要性,李飛飛教授指出有三個理由使我們必須要提高AI的多樣性:
第一個就是涉及到經(jīng)濟和勞動力的原因:AI人工智能是一個日益增長的技術(shù),會影響到每個人,我們需要更多人能開發(fā)出更好的技術(shù);
第二個原因是涉及到創(chuàng)造力和創(chuàng)新:很多研究都顯示出,當擁有多種多樣背景的人共同合作時,會產(chǎn)生更好的結(jié)果,會找到更具有創(chuàng)意的解決方案;
最后也是涉及到社會正義和道德價值的:當各種各樣背景的人聚集到一起時,他們有著各種各樣不同的價值觀,代表著人類的技術(shù)也會有更加多樣性的思考。
人工智能浪潮讓技術(shù)大爆炸,讓世界更美好
在今年的人工智能浪潮中,李飛飛注定是一個無法繞開的名字。作為斯坦福大學人工智能實驗室和計算機視覺實驗室的負責人,這位氣質(zhì)出眾的人工智能大咖此前一直在科研界工作,她所帶頭創(chuàng)立的 ImageNet 是目前世界上圖像識別最大的數(shù)據(jù)庫。每年舉辦的 ImageNet 計算機視覺比賽都會吸引全世界這個領域的頂級研究團隊參與其中。李飛飛說,目前的圖像識別與人工智能,還只相當于一個牙牙學語的3歲兒童。而從3歲到10歲的過程,才是AI技術(shù)的難點和關鍵。未來的AI開發(fā),將交棒給工業(yè)界,這也是她加入谷歌的原因。
對于中國人工智能市場,李飛飛教授也有著自己獨到的看法。她認為中國有大量的應用場景、大量的數(shù)據(jù)和非常熱情的科技及創(chuàng)業(yè)界,這是非常大的優(yōu)勢。未來期待中國在人工智能的基礎科學方面能做更多研究,因為產(chǎn)業(yè)創(chuàng)新需要基礎研究支持。此外,數(shù)據(jù)的開源也很重要,只有公開更多的數(shù)據(jù),才能進一步挖掘這些數(shù)據(jù)的價值,對更多人產(chǎn)生作用。
視覺和智能的發(fā)展造成了動物品種多樣性在5億年前大爆炸式的增長,李飛飛教授相信,現(xiàn)在如果我們能夠讓更多的人參與到AI教育和研究當中,我們可以鼓勵更多技術(shù)多樣化的發(fā)展,這樣我們會看到技術(shù)發(fā)現(xiàn)上的寒武紀大爆炸,會使我們的世界變得更好。