熱點資訊

熱點資訊

了解國興智能的最新動態

人工智能的漫漫長路,這些人功不可沒
2017-02-06
熱點資訊
圖片來自123rf

時至春(chun)季(ji),人工智(zhi)能的春(chun)天也來(lai)了。

從去年 AlphaGo 與李世(shi)石的(de)人(ren)機大戰之后,人(ren)工智能瞬(shun)間成(cheng)為科技行業最為耀眼的(de)明星。除了國內外的(de)巨頭動作頻(pin)繁,該領(ling)域的(de)創業公(gong)司也如雨后春筍(sun)般生長起來(lai)。而這背后,自然離不開讓機器學會思考的(de)造物主們(men)(men)。本文(wen),我們(men)(men)就(jiu)來(lai)認識(shi)一些(xie)將(jiang)人(ren)工智能夢(meng)想變成(cheng)現實的(de)功臣們(men)(men)。

阿蘭⋅圖靈

圖片來源BBC

二戰(zhan)時阿蘭⋅圖靈在布萊切利公園擔(dan)任解碼專(zhuan)家,于 1940 年創造出(chu)可以破譯德軍密報的(de)機(ji)器 Bombe,為(wei)盟軍的(de)勝(sheng)利立下了汗馬功勞。戰(zhan)后,他任職于泰丁(ding)頓(dun)國家物理研究所,開(kai)始從事“自動計(ji)算機(ji)”的(de)邏輯設計(ji)和具(ju)體研制工作(zuo)。1946 年,圖靈發(fa)表(biao)論文闡(chan)述存儲程序(xu)計(ji)算機(ji)的(de)設計(ji),因此被(bei)稱(cheng)為(wei)計(ji)算機(ji)之(zhi)父。

基于(yu)計算機,他還思考怎么去創造一個(ge)思考的(de)機器(qi)(Thinking Machine)。他說(shuo):“要(yao)建造一個(ge)智能的(de)機器(qi)的(de)話,可能最(zui)好的(de)方法就是用錢買得(de)到的(de)最(zui)好的(de)感知器(qi)來(lai)組建它,并(bing)教會它使用英文。”

圖(tu)靈并沒有建立(li)起人工(gong)智(zhi)(zhi)能這(zhe)(zhe)個(ge)領(ling)(ling)域,但是(shi)他(ta)帶來(lai)了最初的(de)一(yi)些重要的(de)思(si)想(xiang)元素:我們(men)要做一(yi)個(ge)會(hui)思(si)考的(de)機(ji)(ji)器,里面就(jiu)需(xu)要包括:視覺(jue)、語言。另(ling)外,圖(tu)靈還提(ti)出著名(ming)的(de)“圖(tu)靈測試(shi)”,指出如(ru)(ru)果第三者(zhe)無法辨別人類與人工(gong)智(zhi)(zhi)能機(ji)(ji)器反應(ying)的(de)差(cha)別,則可(ke)以(yi)論斷該機(ji)(ji)器具備(bei)人工(gong)智(zhi)(zhi)能。“圖(tu)靈的(de)成就(jiu)不得地讓我們(men)聯(lian)想(xiang),是(shi)否等到人類滅亡(wang)之后會(hui)留下機(ji)(ji)器人來(lai)統(tong)治(zhi)這(zhe)(zhe)個(ge)世(shi)界。”互聯(lian)網之父(fu)文特·瑟夫如(ru)(ru)此評論。正(zheng)是(shi)圖(tu)靈開(kai)啟了人工(gong)智(zhi)(zhi)能研究的(de)先河。如(ru)(ru)今,由美國計(ji)算(suan)機(ji)(ji)協(xie)會(hui)(The Association for Computing Machinery)設立(li)圖(tu)靈獎為(wei)其最高獎項(xiang),以(yi)表彰圖(tu)靈在計(ji)算(suan)機(ji)(ji)以(yi)及人工(gong)智(zhi)(zhi)能領(ling)(ling)域的(de)特殊貢獻。

Terry Winograd

Terry Winograd

Terry 是人(ren)工智能(neng)界,第(di)一代(dai)把圖靈的(de)思想(xiang)付(fu)諸實踐的(de)人(ren),他(ta)也(ye)是現(xian)在在世的(de)計算機界最偉大的(de)科學(xue)家(jia)之一。Terry 不光在人(ren)工智能(neng)領域(yu)做(zuo)了(le)最重要(yao)的(de)工作(zuo),而(er)且他(ta)后(hou)來(lai)轉行去做(zuo)人(ren)機交(jiao)互,也(ye)把這個領域(yu)重新帶(dai)動了(le)起來(lai)。

在 Terry 看來,要實現人工智能,需要有這 3 個要素:語法,語義和推理。他說一個人,或者一個機器,要去理解世界,需要去感知。感知以后,需要做的第一件事是對這個世界的結構進行理解,這叫語法的理解(Syntax Understanding)。Terry 說,機器能夠理解語法以后,接下去需要做的就是理解語義(Semantics)。語義就是指含義,語言有語言的含義,視覺有物體、有動作,有視覺的含義。最后,當我們把語法和語義解決以后,智能的機器或者是人主要解決的問題就是統計推理(Inference)這個過程。1970 年,Terry Winograd 教授在麻省理工學院人工智能實驗室創建了 SHRDLU(積木世界),其被譽為微世界程序的最高成就,它能用普通的英語句子與人交流,還能作出決策并執行操作。可以說它既是自然人展示自己如何借助計算機實現自然語言理解的一個經典示例,也是怎樣應用計算機有效進行自然語言處理的一個里程碑。
Geffory Hinton

Geoffrey Hinton

人類大(da)腦(nao)有數(shu)十億個神經(jing)(jing)細胞(bao),它(ta)們之間通過神經(jing)(jing)突觸相互影響(xiang),形成極(ji)其復(fu)雜的(de)(de)(de)(de)相互聯(lian)系(xi)。然而科學家們并(bing)不能解釋(shi)這(zhe)(zhe)些具體的(de)(de)(de)(de)影響(xiang)和(he)聯(lian)系(xi)。神經(jing)(jing)到底是如何(he)進行學習以及計算的(de)(de)(de)(de),對于(yu) Hinton,這(zhe)(zhe)些正是他(ta)(ta)所關心的(de)(de)(de)(de)問題(ti)。他(ta)(ta)不知道所有的(de)(de)(de)(de)答案,但在他(ta)(ta)的(de)(de)(de)(de)努力之下已經(jing)(jing)取得(de)了(le)進展(zhan)。

Geoffrey Hinton 被尊稱(cheng)為(wei)“神(shen)經(jing)(jing)網絡(luo)之(zhi)父”,將 Back Propagation(反向傳(chuan)播)算法應用到神(shen)經(jing)(jing)網絡(luo)與(yu)深度學(xue)習(xi),還(huan)提(ti)出了“Dark Knowledge”概念。他(ta)將神(shen)經(jing)(jing)網絡(luo)帶入(ru)到研究(jiu)與(yu)應用的(de)(de)(de)熱潮,這些人(ren)工神(shen)經(jing)(jing)網絡(luo)可以(yi)收集(ji)信(xin)息,也可以(yi)對(dui)其做出反應。它們(men)能對(dui)事物的(de)(de)(de)外形和聲音做出解(jie)釋。它們(men)對(dui)語言(yan)的(de)(de)(de)理解(jie)也在進步。它們(men)可以(yi)自行學(xue)習(xi)與(yu)工作,而不(bu)需要人(ren)為(wei)提(ti)示或者參與(yu)控制。這些正是它們(men)與(yu)傳(chuan)統的(de)(de)(de)學(xue)習(xi)機(ji)(ji)器(qi)的(de)(de)(de)區別。隨(sui)著時間的(de)(de)(de)推移,計算機(ji)(ji)能力的(de)(de)(de)發展,神(shen)經(jing)(jing)網絡(luo)也更加快速(su),靈活,高效,得到了很好(hao)的(de)(de)(de)擴展。

據了解(jie),早(zao)在 80 年(nian)代初期,當 Hinton 和(he)他的(de)同事們(men)(men)(men)剛開(kai)始(shi)這(zhe)項研究(jiu)時(shi),那時(shi)的(de)電腦(nao)還不(bu)(bu)夠快,不(bu)(bu)足以處理(li)有關神經網絡的(de)這(zhe)些龐大的(de)數(shu)據,他們(men)(men)(men)取(qu)得的(de)成就是有限的(de)。而(er)當時(shi) AI 普遍的(de)研究(jiu)方向也與他們(men)(men)(men)相反,都在試圖尋找(zhao)捷徑,直接模擬出行為,而(er)不(bu)(bu)是試圖通過模仿大腦(nao)的(de)運作來(lai)實現。在這(zhe)樣(yang)艱難的(de)環境下,只有 Hinton 和(he)他的(de)同事堅持了下來(lai),而(er)事實則證明他們(men)(men)(men)是對的(de)。

Geoffrey Hinton 于 2006 年在《Science》上(shang)發表(biao)的(de)(de)(de)論(lun)文首次提出深度學習(xi)的(de)(de)(de)主要觀點(dian)。從(cong) 2012 年取得 ImageNet 競(jing)賽(sai)的(de)(de)(de)標志性(xing)事件之后,深度學習(xi)不斷取得一系列(lie)的(de)(de)(de)重大進展,解決了(le)(le)人工(gong)智(zhi)能界的(de)(de)(de)盡最大努(nu)力很(hen)多年仍沒有(you)進展的(de)(de)(de)問題,除了(le)(le)在圖(tu)像(xiang)識(shi)別(bie)、語(yu)音識(shi)別(bie)等領域打破(po)了(le)(le)紀錄,還在其他(ta)的(de)(de)(de)領域擊敗了(le)(le)其他(ta)機器學習(xi)技(ji)術(shu),包(bao)括(kuo)預測潛在的(de)(de)(de)藥(yao)物(wu)分(fen)子(zi)的(de)(de)(de)活(huo)性(xing)、分(fen)析粒子(zi)加速器數據、重建大腦(nao)回路、預測非編碼(ma) DNA 突變(bian)對基因表(biao)達和疾(ji)病的(de)(de)(de)影響(xiang)。更令人驚訝的(de)(de)(de)是(shi),深度學習(xi)在自(zi)(zi)然語(yu)言(yan)理解的(de)(de)(de)各項(xiang)任務(wu)中也有(you)非常可(ke)喜的(de)(de)(de)成果,特別(bie)是(shi)主題分(fen)類、情感分(fen)析、自(zi)(zi)動問答和語(yu)言(yan)翻譯。

可以說,正是 Geoffrey Hinton 將(jiang)“深度學習”從邊緣(yuan)課題變成了谷歌等互聯網(wang)巨頭(tou)仰賴(lai)的(de)核(he)心技術。

Yann LeCun

yann-lecun-660x440

Yann LeCun,Geoffrey Hinton 的(de)博士后(hou)學生,也是將(jiang) CNNs 應(ying)用(yong)最成功的(de)人(CNNs,是一種深度的(de)監督學習(xi)(xi)下的(de)機(ji)器(qi)學習(xi)(xi)模型)。目前感(gan)興趣的(de)研(yan)究領域包括(kuo)人工智(zhi)能(neng)(neng)、機(ji)器(qi)學習(xi)(xi)、計算(suan)機(ji)感(gan)知、機(ji)器(qi)人和計算(suan)神經(jing)科學。他(ta)最出名的(de)是對深度學習(xi)(xi)和神經(jing)網絡的(de)貢(gong)獻,特別(bie)是廣(guang)泛用(yong)于計算(suan)機(ji)視覺和語音識別(bie)應(ying)用(yong)的(de) CNN(卷積神經(jing)網絡),他(ta)第一個(ge)把 BP 算(suan)法(fa)用(yong)在(zai) CNN 上并且完善(shan) CNN 使(shi)得它可以(yi)在(zai)真實場景中(zhong)得以(yi)應(ying)用(yong),并在(zai)這(zhe)些主題(ti)以(yi)及手(shou)寫字體識別(bie)、圖像壓縮和人工智(zhi)能(neng)(neng)硬件等(deng)主題(ti)上發表(biao)過 190 多(duo)份(fen)論文(wen)。

LeCun 使 CNN 成為目(mu)前(qian)人(ren)工智能領域最有用(yong)的模(mo)型。在谷歌,卷積神經網絡幫助(zhu)他(ta)們在安卓手機上開發語音識別系(xi)統;而百度則可(ke)以利用(yong)它(ta)開發全新的視覺搜索引(yin)擎。

Yann LeCun 是紐約大學(xue)終身(shen)教授,現任 Facebook 人工智能實驗室負(fu)責人。LeCun 位列(lie)新澤西州的發明家(jia)名(ming)人堂,并獲得(de) 2014 年 IEEE 神經網絡先(xian)鋒獎、2015 年 IEEE PAMI 杰出研究(jiu)獎、2016 年 Lovie 終身(shen)成就(jiu)獎和來自墨西哥 IPN 的名(ming)譽博士學(xue)位。

Yoshua Bengio

Yoshua Bengio

Yoshua Bengio 教授是機器學(xue)習大(da)神之一(yi),尤(you)其是在深度(du)學(xue)習這個(ge)領域。他連同 Geoff Hinton 以及 Yann LeCun 教授,締造了 2006 年開始的深度(du)學(xue)習復興。

其他(ta)方(fang)面(mian),Bengio 的(de)《a neural probabilistic language model》這篇論文開創了神(shen)經(jing)(jing)網(wang)絡做 language model 的(de)先河,里面(mian)的(de)思路影(ying)響、啟發了之后的(de)很多基于(yu)神(shen)經(jing)(jing)網(wang)絡做 nlp(自然(ran)語音處理) 的(de)文章。

Bengio 博士后(hou)的(de)(de)導師(shi) Jordan 曾提(ti)到(dao):“到(dao)目前為止,在(zai)更高級(ji)的(de)(de)自然(ran)語(yu)言處理(li)任(ren)務中(zhong),深(shen)度學習并未像(xiang)在(zai)語(yu)音識(shi)別(bie)、物體識(shi)別(bie)等任(ren)務上做到(dao)的(de)(de)那樣(yang),顯著降低錯誤(wu)率。”所(suo)以在(zai) Hinton 提(ti)出深(shen)度學習概(gai)念激活了(le)整個(ge)領(ling)域、lecun 發表了(le)卷(juan)積神經(jing)網(wang)絡 (CNN) 這樣(yang)的(de)(de)階段性突破成果的(de)(de)前提(ti)下(xia),Bengio 對自然(ran)語(yu)音處理(li)難(nan)題的(de)(de)貢獻是非常有(you)意義的(de)(de)。

Jürgen Schmidhuber

Jürgen Schmidhuber

1997 年,Schmidhuber 博士和他的(de)同(tong)事發表了(le)一篇技(ji)術論文,后(hou)來證明這(zhe)篇論文對最(zui)近的(de)視覺和語音上(shang)的(de)快速進展起到(dao)了(le)關鍵(jian)作用(yong)。這(zhe)個方法(fa)被稱長短期記(ji)憶,簡稱為 LSTM。這(zhe)個方法(fa)在剛(gang)引(yin)進時沒有(you)得到(dao)廣(guang)泛(fan)的(de)理(li)解。它主要提供了(le)一種記(ji)憶形式,或者說(shuo)是一種神經網(wang)絡的(de)環境。

就像(xiang)(xiang)人類不會每(mei)次都從頭學起一樣,神(shen)經(jing)網絡的(de)(de)機(ji)制中存在循環和記憶的(de)(de)機(ji)制,每(mei)個輸入的(de)(de)單詞和觀察到的(de)(de)像(xiang)(xiang)素都會被其(qi)理解。長短時記憶(LSTM)的(de)(de)出(chu)現讓這種系統的(de)(de)表現得到了很大(da)的(de)(de)提升,輸出(chu)結果(guo)瞬間變得準(zhun)確。

去年,谷歌(ge)的(de)(de)研究(jiu)人員在這(zhe)一方面(mian)的(de)(de)研究(jiu)得到發表,他們(men)使用 LSTM 減少了 49% 的(de)(de)語音識別錯誤,這(zhe)是一個飛(fei)躍性進步(bu)。

 

相關標簽