【新智元導(dǎo)讀】5月23日起,有AlphaGo之父之稱(chēng)的哈薩比斯將率領(lǐng)DeepMind的數(shù)位大將,與谷歌大腦的精英團(tuán)隊(duì)一起,在中國(guó)烏鎮(zhèn)參加圍棋人機(jī)終極對(duì)決,其中最受關(guān)注的自然是與柯潔的三場(chǎng)大戰(zhàn)。本文綜合《衛(wèi)報(bào)》、BI、Wired 等媒體的報(bào)道,試圖還原“超級(jí)英雄”哈薩比斯前半生的傳奇經(jīng)歷:其母親有中國(guó)血統(tǒng),從少年時(shí)期哈薩比斯就被贊為“神童”,在數(shù)學(xué)和棋類(lèi)游戲上頗有造詣。他的理想,是通用人工智能。
40 歲的著名人工智能(AI)實(shí)驗(yàn)室 DeepMind 的聯(lián)合創(chuàng)始人戴密斯·哈薩比斯,被世界公認(rèn)為他所在領(lǐng)域最聰明的思想家之一。
哈薩比斯被《衛(wèi)報(bào)》形容為“人工智能超級(jí)英雄”,曾經(jīng)是劍橋和倫敦大學(xué)學(xué)院計(jì)算機(jī)科學(xué)和認(rèn)知神經(jīng)科學(xué)的神童。
哈薩比斯在17歲的時(shí)候就和別人共同制作了電子游戲“Theme Park”,接著他成立了自己的電子游戲公司,并最終于2010 年成立了DeepMind。
2014年1月,哈薩比斯將DeepMind 以4億英鎊的價(jià)格出售給了Google,這是迄今為止歐洲范圍內(nèi)最大的一筆收購(gòu)。這家公司的 AlphaGo 去年擊敗了圍棋世界冠軍,創(chuàng)造了歷史。現(xiàn)在,DeepMind 正在將注意力轉(zhuǎn)向?qū)⑺惴☉?yīng)用于可以使人類(lèi)受益的領(lǐng)域,包括醫(yī)療保健和氣候變化等。
從小就表現(xiàn)出棋類(lèi)游戲的天賦,特別是國(guó)際象棋
哈薩比斯1976 年7 月27 日出生,父親是塞浦路斯希臘族,母親是新加坡華人。
哈薩比斯是三個(gè)兄弟姐妹中最年長(zhǎng)的,他的父母是老師。據(jù)《衛(wèi)報(bào)》報(bào)道,他的妹妹是一名鋼琴家和作曲家,而他的弟弟則在學(xué)習(xí)創(chuàng)意寫(xiě)作。
“我的父母不是技術(shù)人員,”他在接受衛(wèi)報(bào)采訪時(shí)說(shuō)。“他們真的不喜歡計(jì)算機(jī),他們有點(diǎn)文藝范,我的妹妹和弟弟都走了藝術(shù)路線,沒(méi)有人進(jìn)入數(shù)學(xué)或科學(xué)領(lǐng)域...這很奇怪,我不太清楚所有這一切都來(lái)自于什么。”
哈薩比斯現(xiàn)在有兩個(gè)兒子。
哈薩比斯從小就表現(xiàn)出棋類(lèi)游戲的天賦,特別是國(guó)際象棋。
據(jù)Wired 報(bào)道,哈薩比斯四歲時(shí)就看他父親和叔叔下國(guó)際象棋,展現(xiàn)出了濃厚興趣。兩個(gè)星期后,哈薩比斯就在比賽中擊敗了大人。
左下角的孩子是哈薩比斯
五歲以前,他在全國(guó)各地比賽,六歲時(shí)贏得了倫敦八歲以下組別的冠軍。他九歲時(shí)已經(jīng)成為了英格蘭11歲以下國(guó)際象棋隊(duì)的隊(duì)長(zhǎng)。
8 歲買(mǎi)了第一臺(tái)計(jì)算機(jī),16歲被劍橋錄取
八歲時(shí),哈薩比斯買(mǎi)了人生中第一臺(tái)計(jì)算機(jī)——ZX Spectrum。
哈薩比斯用他從國(guó)際象棋比賽中贏的200 英鎊買(mǎi)了這臺(tái)機(jī)器。
“那時(shí)計(jì)算機(jī)的驚人之處在于你可以對(duì)其進(jìn)行編程,”哈薩比斯告訴Wired,“我爸會(huì)帶我去Foyles(倫敦最大的書(shū)店),坐在計(jì)算機(jī)編程類(lèi)書(shū)籍的區(qū)域,學(xué)習(xí)如何在游戲中無(wú)限續(xù)命,我從直覺(jué)上感到這是一個(gè)神奇的設(shè)備,你可以釋放你的創(chuàng)造力。”
13歲時(shí),哈薩比斯成為了國(guó)際象棋大師。當(dāng)時(shí)他在14 歲以下組別世界排名第二。
14歲時(shí),他完成了GCSE (類(lèi)似于中國(guó)的中學(xué)會(huì)考),這比同班同學(xué)提前了兩年。十五歲時(shí),他達(dá)到了數(shù)學(xué) A level,16歲時(shí)則達(dá)到了高等數(shù)學(xué)、物理學(xué)和化學(xué)的 A level。
他向劍橋大學(xué)提出了申請(qǐng),拿到了一個(gè)入學(xué)名額,但劍橋沒(méi)讓他真正開(kāi)始,因?yàn)樗?dāng)時(shí)只有16歲,于是他休息了一年。
他的事業(yè)起步于英國(guó)Bullfrog Productions 工作室的電子游戲。當(dāng)時(shí)他 15 歲,還在Amiga Power雜志贏得了一份工作。在Bullfrog,他共同設(shè)計(jì)并領(lǐng)導(dǎo)了“主題公園(Theme Park)”的編程,游戲挑戰(zhàn)玩家建立一個(gè)成功的主題公園。
哈薩比斯在去年七月告訴PCGamesN :“我從游戲中得到的最大樂(lè)趣來(lái)自90年代初的職業(yè)經(jīng)歷。特別是在 Bullfrog,我當(dāng)時(shí)很幸運(yùn)地處在英國(guó)游戲行業(yè)的黃金期,游戲一個(gè)接一個(gè)地被創(chuàng)造出來(lái)。”
Peter Molyneux
那段時(shí)間,他曾在傳奇游戲設(shè)計(jì)師 Peter Molyneux 手下工作,Molyneux 是 Bullfrog Productions 的創(chuàng)始人。
“我想我們彼此影響很大,”哈薩比斯告訴PCGamesN,“多年來(lái)我們合作密切——很難說(shuō)誰(shuí)影響了誰(shuí),但這是我生活中非常重要的一部分。”
“主題公園”于 1994 年發(fā)行,當(dāng)時(shí)哈薩比斯17歲,游戲賣(mài)了數(shù)百萬(wàn)份。
哈薩比斯于1994 年離開(kāi)了Bullfrog Productions,到劍橋?qū)W習(xí)計(jì)算機(jī)科學(xué)。
據(jù)“金融時(shí)報(bào)”報(bào)道,劍橋大學(xué)本科生主要學(xué)習(xí)的內(nèi)容是“狹義AI ”,狹義 AI 能夠?qū)W習(xí)如何執(zhí)行具體任務(wù),但哈薩比斯對(duì)開(kāi)發(fā)“通用 AI ”更感興趣。
1997年,20歲的哈薩比斯從劍橋皇后學(xué)院畢業(yè),他獲得了雙重一級(jí)榮譽(yù)學(xué)位(a double first-class honours degree)。
“沉迷”于游戲,從游戲公司開(kāi)始創(chuàng)業(yè)
1997年畢業(yè)后,哈薩比斯再次在Molyneux 手下工作,工作室是 Lionhead。
在Lionhead,哈薩比斯為標(biāo)志性的上帝視角游戲“黑與白”開(kāi)發(fā)了早期的AI 原型版本。
一年后,他離開(kāi)了Lionhead,成立了自己的電子游戲公司。
1998年,哈薩比斯創(chuàng)立了Elixir Studios,為全球發(fā)型商如Vivendi Universal 和Microsoft 創(chuàng)造了一批屢獲殊榮的游戲。
在高峰期Elixir 雇用了大約60人,制作了AI 模擬游戲如“共和國(guó):革命”和“邪惡天才”,這些都是獲BAFTA 提名的。
據(jù)“金融時(shí)報(bào)”報(bào)道,哈薩比斯將Elixir 的5%股權(quán)出售給了創(chuàng)建了Lara Croft“古墓麗影”系列的Eidos。股權(quán)售價(jià)為60 萬(wàn)英鎊,公司估值為1200 萬(wàn)英鎊。
神經(jīng)科學(xué)博士:尋求在人類(lèi)大腦中尋找新的AI 算法靈感
在電子游戲初創(chuàng)公司里工作了十年之后,哈薩比斯于2005 年回到了倫敦大學(xué)學(xué)院(UCL),在那里他完成了四年的認(rèn)知神經(jīng)科學(xué)博士學(xué)位。
在他讀博期間,他開(kāi)始尋求在人類(lèi)大腦中尋找新的AI 算法靈感。
他關(guān)于記憶與想象力的研究被列入 2007 年十大科學(xué)突破之列。
2009 年,哈薩比斯獲得了Henry Wellcome 博士后研究獎(jiǎng)學(xué)金,繼續(xù)在 UCL 進(jìn)行研究。他還在波士頓、哈佛和 MIT 度過(guò)了一段研究時(shí)光。
創(chuàng)建DeepMind,走上巔峰
2010年,哈薩比斯成立了自己迄今為止最大的公司:DeepMind。
DeepMind 是一家位于倫敦的創(chuàng)業(yè)公司,希望“解決智能”,并用它來(lái)“使世界變得更美好”。
該公司正在開(kāi)發(fā)復(fù)雜的自學(xué)習(xí)算法,可以在給定數(shù)據(jù)集面前自我學(xué)習(xí),勝任特定任務(wù)。這些算法的創(chuàng)建混合了來(lái)自神經(jīng)科學(xué)和機(jī)器學(xué)習(xí)的研究和專(zhuān)業(yè)知識(shí)。
到目前為止,這些算法已經(jīng)擊敗了圍棋中的世界冠軍,幫助Google 削減了巨額的電費(fèi)。DeepMind 還將其算法應(yīng)用于許多NHS 項(xiàng)目。
哈薩比斯和童年好友 Mustafa Suleyman 共同創(chuàng)立了 DeepMind。
Suleyman 是 DeepMind 應(yīng)用AI 的負(fù)責(zé)人,也是 DeepMind Health 部門(mén)的負(fù)責(zé)人,該部門(mén)正在與NHS在許多項(xiàng)目上展開(kāi)合作。
Suleyman 也很聰明,在牛津大學(xué)學(xué)習(xí)哲學(xué)和神學(xué),但他第二年就退學(xué)了,當(dāng)時(shí)他19歲,創(chuàng)立了穆斯林青年幫助熱線。Suleyman 后來(lái)?yè)?dān)任了倫敦市長(zhǎng)KenLivingstone 的政策官。此后,他創(chuàng)立了“變革實(shí)驗(yàn)室(Change Labs)”,旨在提供解決復(fù)雜問(wèn)題的咨詢(xún)服務(wù)。
另一個(gè)創(chuàng)始人是 Shane Legg,新西蘭人,他也是 UCL 蓋茨比計(jì)算神經(jīng)科學(xué)組的博士后。
Legg 是 DeepMind 首席科學(xué)家。他在瑞士 Dalle Molle人工智能研究所(IDSIA)獲得博士學(xué)位,師從超智能機(jī)器理論模型專(zhuān)家 Marcus Hutter 教授。
現(xiàn)年43歲的 Legg 與哈薩比斯共同領(lǐng)導(dǎo) DeepMind 的研究工作。Legg 大部分時(shí)間花在招聘人才上,以及對(duì) DeepMind 下一步應(yīng)該重點(diǎn)關(guān)注什么進(jìn)行決策。更重要的是,Legg 還領(lǐng)導(dǎo) DeepMind 在 AI 安全方面的工作,包括開(kāi)發(fā)一個(gè)巨大的“紅色按鈕”以在機(jī)器失控時(shí)按下按鈕,中斷機(jī)器。
與 DeepMind 的其他共同創(chuàng)始人相比,Legg 顯得更加低調(diào),接受媒體的采訪更少。除了少有的曾在去年12月接受彭博社采訪外,你很難在有關(guān) DeepMind 的無(wú)數(shù)報(bào)道中找到 Legg 的只言片語(yǔ)。
哈薩比斯的早期投資者包括特斯拉億萬(wàn)富翁 Elon Musk,以及 Skype 聯(lián)合創(chuàng)始人 Jaan Tallinn。
馬斯克今年早些時(shí)候接受《名利場(chǎng)》采訪時(shí)這樣評(píng)價(jià) DeepMind:
“它讓我對(duì)事情發(fā)展的速度有了更清晰的了解,而且我覺(jué)得它們發(fā)展的速度正在加快,遠(yuǎn)遠(yuǎn)快于人們能夠意識(shí)到的。主要是因?yàn)槿藗冊(cè)谌粘I钪胁粫?huì)看到機(jī)器人在到處走,也許你加的 Roomba 或其他什么會(huì)走動(dòng),但 Roomba 不會(huì)接管世界。”
但 DeepMind 也不是所有項(xiàng)目都很有名。在被 Google 收購(gòu)之前,DeepMind 做過(guò)一個(gè)利用 AI 的時(shí)尚網(wǎng)站 KITSEE。
KITSEE 使用 AI 技術(shù)向用戶(hù)推薦衣服,然后用戶(hù)可以繼續(xù)瀏覽和購(gòu)買(mǎi)。這個(gè)網(wǎng)站還提供了一系列由 DeepMind 的作家團(tuán)隊(duì)操刀的時(shí)尚博文。
但當(dāng) DeepMind 被 Google 收購(gòu)時(shí),KITSEE 似乎已經(jīng)被放棄了,Google 這位搜索巨頭可能對(duì)它不感興趣。
2013年12月,DeepMind 宣布機(jī)器在玩 Atari 游戲上超過(guò)了人類(lèi)水平,通過(guò)使用屏幕上的原始像素作為輸入訓(xùn)練軟件。這是 DeepMind 取得的一項(xiàng)突破。
DeepMind被谷歌收購(gòu),金額4億英鎊,當(dāng)時(shí)只有50名員工
DeepMind 于 2014年被 Google 收購(gòu),據(jù)報(bào)道收購(gòu)金額是 4億 英鎊,當(dāng)時(shí) DeepMind 有約50名員工。
如今,DeepMind 屬于 Google 母公司 Alphabet 旗下,公司位于倫敦國(guó)王十字車(chē)展附近,擁有約400名員工。DeepMind 還在加州山景城的 Google 總部有一個(gè)小團(tuán)隊(duì),該團(tuán)隊(duì)致力于將 DeepMind 的技術(shù)應(yīng)用到 Google 的產(chǎn)品。但它仍然是一個(gè)獨(dú)立的組織。
作為 Google 收購(gòu)協(xié)議的一部分,哈薩比斯以及其他聯(lián)合創(chuàng)始人與 Google 成立了 AI 倫理委員會(huì)。不過(guò)誰(shuí)是這個(gè)委員會(huì)的頭,從來(lái)沒(méi)有公開(kāi)。
2015年,DeepMind 發(fā)表有關(guān)學(xué)習(xí)掌握 Atari 游戲的算法的論文,登上了 Nature 雜志的封面——這是許多科學(xué)家夢(mèng)寐以求的。
挑戰(zhàn)圍棋,聞名全球
搞定 Atari 游戲之后,哈薩比斯和他的迅速擴(kuò)大的團(tuán)隊(duì)開(kāi)始把注意力轉(zhuǎn)移到古老的中國(guó)游戲,圍棋——一個(gè)被廣泛認(rèn)為是 AI 領(lǐng)域的圣杯的游戲。
圍棋有著3000多年的歷史,是一個(gè)雙人棋盤(pán)游戲,玩法表面看起來(lái)很簡(jiǎn)單——每個(gè)玩家輪流落一子,目的是用自己的子圍住對(duì)方的棋子。
然而,任何一個(gè)落子的動(dòng)作都意味著很多可能的動(dòng)作,圍棋實(shí)際上是人類(lèi)開(kāi)發(fā)的最復(fù)雜的游戲之一,AI 科學(xué)家們研究了幾十年一直無(wú)法突破。
AlphaGo 通過(guò)玩無(wú)數(shù)遍游戲,逐漸從錯(cuò)誤中學(xué)習(xí)。
2016年3月,DeepMind 讓它的圍棋算法 “AlphaGo” 和圍棋世界冠軍李世乭進(jìn)行了一場(chǎng)比賽。
這是在韓國(guó)首爾的五星級(jí)四季酒店舉行的,一共五局的比賽。DeepMind 在五局棋中贏了4局,最終取得勝利。
李世乭可能受到了沖擊,但自那以后他還沒(méi)有輸過(guò)一場(chǎng)比賽。自從輸給 AlphaGo 之后,他一直通過(guò)與 AlphaGo 算法交手來(lái)提高自己的棋藝。
寫(xiě) AlphaGo 算法的程序員主要是 David Silver,他和哈薩比斯同是在劍橋大學(xué)念本科。
Silver 和哈薩比斯在 DeepMind 創(chuàng)立之前曾一起在 Elixir 工作。
哈薩比斯在2016年2月接受《衛(wèi)報(bào)》采訪時(shí)說(shuō):“Dave 和我是多年的老友,我們?cè)鴫?mèng)想一生都在這個(gè)領(lǐng)域工作,所以可以對(duì)19歲時(shí)的我們說(shuō)放心了,我們做到了。”
DeepMind 在2016年1月第二次登上 Nature 封面,內(nèi)容是有關(guān) AlphaGo 算法的研究論文。
AlphaGo 現(xiàn)在正在前往中國(guó),即將與發(fā)明圍棋的這個(gè)國(guó)家的最厲害的棋手們對(duì)弈。
許多 AI 專(zhuān)家,包括牛津大學(xué)教授 Nick Bostrom 在內(nèi),認(rèn)為 DeepMind 將在這場(chǎng) AI 競(jìng)賽中贏得頭籌,領(lǐng)先于 Facebook 和 Amazon 等公司。
Nick Bostrom 和哈薩比斯
哈薩比斯已經(jīng)獲得許多榮譽(yù),包括今年5月份獲得“亞洲獎(jiǎng)”年度科技最佳貢獻(xiàn)獎(jiǎng)。
2014年,哈薩比斯獲得了英國(guó)皇家學(xué)會(huì)頒發(fā)的“穆拉德獎(jiǎng)”(Mullard Award),然后2016年,他被 Nature 雜志評(píng)為“年度十大人物”。
2017年,哈薩比斯被《時(shí)代》提名為全球最具影響力100人之一。
超級(jí)英雄到來(lái),AlphaGo的中國(guó)之行即將啟幕
圍棋被看成是一個(gè)計(jì)算機(jī)很難攻克的游戲,因?yàn)樗鼑?yán)重地依賴(lài)于直覺(jué)、策略思考,需要在棋盤(pán)上贏下多場(chǎng)戰(zhàn)役。僅僅是記住所有的棋子位置組合、評(píng)估棋局、構(gòu)造和執(zhí)行贏棋的策略,對(duì)于單臺(tái)計(jì)算機(jī)來(lái)說(shuō),是非常有難度的。
但是這些都沒(méi)能阻止DeepMind 的AlphaGo,它戰(zhàn)勝了這一切。AlphaGo的深度神經(jīng)網(wǎng)絡(luò)讓它能自己學(xué)會(huì)下棋。程序員們?cè)O(shè)置了關(guān)于圍棋的基礎(chǔ)啟發(fā)式(heuristics),給AlphaGo一個(gè)數(shù)據(jù)庫(kù),從160,000個(gè)現(xiàn)實(shí)生活中的圍棋對(duì)弈游戲中抽取出3000萬(wàn)個(gè)棋局, 來(lái)進(jìn)行分析,分解其核心思想,然后,計(jì)算機(jī)能數(shù)百萬(wàn)次地重復(fù)游戲,在這一過(guò)程中進(jìn)行學(xué)習(xí)。
這個(gè)策略已經(jīng)有所回報(bào)。 2015年10月,AlphaGo以5:0 的比分戰(zhàn)勝歐洲冠軍樊麾,這是歷史上第一次,電腦在一個(gè)全面的19x19棋盤(pán)上擊敗了一名專(zhuān)業(yè)人士。 2016年3月,它擊敗了韓國(guó)的世界冠軍李世石,比分是4比1,而從2016年底到2017年初,AlphaGo(偽裝成“Magister”和“Master”)秘密地打了51場(chǎng)在線比賽,對(duì)手都是世界上的頂級(jí)玩家。
現(xiàn)在,最后的對(duì)決即將到來(lái):5月23日,AlphaGo和世界排名第一圍棋手柯潔將在中國(guó)烏鎮(zhèn)進(jìn)行顛覆對(duì)決。
在圍棋上的成就使得AlphaGo成為了聚光燈的焦點(diǎn),但是,DeepMind 的這一程序還有另外一些東西,也就是智力(Mind)。DeepMind的聯(lián)合創(chuàng)始人Demis Hassabis表示:“總而言之,我們的工作說(shuō)明了利用生物學(xué)啟發(fā)機(jī)制結(jié)合最先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)來(lái)創(chuàng)建能夠?qū)W習(xí)和掌握各種挑戰(zhàn)性任務(wù)的代理人的能力。”
而且,如果不斷地輸給一個(gè)近乎完美的機(jī)器人對(duì)手,這對(duì)人類(lèi)來(lái)說(shuō)也并不是什么有趣的事。AlphaGo的粉絲它在圍棋上的統(tǒng)治力是一種解放。人類(lèi)可以從中進(jìn)行學(xué)習(xí)。正如哈薩比斯所指出的那樣,完美都希望與更強(qiáng)的對(duì)手競(jìng)賽,這一才能提升自己。
“阿爾法的游戲使我們感到解放,也就是說(shuō),沒(méi)有什么下法是不可能的”,專(zhuān)業(yè)的圍棋手周瑞羊說(shuō)。 “現(xiàn)在每個(gè)人都試圖以一種以前沒(méi)有嘗試過(guò)的風(fēng)格來(lái)下棋。”
但是,AlphaGo的勝利并不完美。正如李世石曾經(jīng)說(shuō)過(guò)的那樣,“機(jī)器人將永遠(yuǎn)不會(huì)像人類(lèi)一樣體會(huì)到圍棋之美。”
他可能是正確。至少目前來(lái)看是,人類(lèi)所感知的世界與機(jī)器所“看”到的世界是截然不同的。
不過(guò),當(dāng)我們的目標(biāo)只是贏得比賽或者解決問(wèn)題,上面的這些還重要嗎?拿無(wú)人車(chē)來(lái)說(shuō),也許有人會(huì)喜歡駕駛的愉悅,這種心情,機(jī)器肯定體會(huì)不到。但是,這是否意味著機(jī)器就不能更高效地運(yùn)送乘客、減少交通擁堵、避免事故,消除路怒,甚至在不需要救護(hù)車(chē)的情況下把病人直接送到醫(yī)院?
并且,如果這件事確實(shí)如此重要的話,那么大師李世石所提到的“美”,也確實(shí)在AlphaGo中得到了體現(xiàn)。
樊麾就曾對(duì)AlphaGo與李世石比賽中第二盤(pán)的“第37步”念念不忘,“這不是人類(lèi)會(huì)下出來(lái)的棋”,樊麾說(shuō),“我從來(lái)沒(méi)看到過(guò)有人走出這樣的棋,太美了。”
DeepMind 宣布的烏鎮(zhèn)圍棋人機(jī)對(duì)戰(zhàn)時(shí)間表:
第一天,5月23日,開(kāi)幕式、柯潔與DeepMind比賽第一場(chǎng)、媒體會(huì);
第二天,5月24日,未來(lái)AI論壇;
第三天,5月25日,柯潔比賽第二場(chǎng),媒體會(huì);
第四天,5月26日,組合對(duì)戰(zhàn),團(tuán)隊(duì)比賽,媒體會(huì);
第五天,5月27日,柯潔比賽第三場(chǎng),閉幕式。