譯者:一只鳥的天空
引言
在大數(shù)據(jù)技術(shù)飛速發(fā)展的今天,誰才是我們大數(shù)據(jù)科研與工業(yè)界中最有威望的科學家呢?下面我們來進行梳理,共羅列了25位當今世界,無論是在學術(shù)與工業(yè)界都產(chǎn)生巨大影響的數(shù)據(jù)科學家(Data Scientists)。他(她)們推動了整個領(lǐng)域的發(fā)展,毫無疑問,無論是在學術(shù)界還是還工業(yè)界,他(她)們都是一座座山頭式的人物。他(她)們是我們這些從事大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的榜樣。他(她)們便是所謂的大師級人物。
數(shù)以萬計的數(shù)據(jù)從業(yè)者通過他(她)們的論文、博客、視頻、講義等進行學習與進步,并找到相應(yīng)的應(yīng)用場景解決方案。這些大師為人們解開了統(tǒng)計機器學習、神經(jīng)網(wǎng)絡(luò)以及深度學習的神秘。
下面從三個類別對這25位大師進行簡介,雖然這個分類可能并不那么恰當,但是可以加深讀者對他(她)們的了解。
科研學術(shù)界大師(Research Oriented Data Scientists)
這些科學家全身心致力于在數(shù)據(jù)中發(fā)明新的算法或者模型,他(她)們更傾向于學術(shù)與科研界的創(chuàng)新與創(chuàng)造。
工業(yè)界應(yīng)用大師(Data Scientists Turned Entrepreneurs)
這些科學家致力于將技術(shù)轉(zhuǎn)變?yōu)樯a(chǎn)力,應(yīng)用數(shù)據(jù)技術(shù)去創(chuàng)造產(chǎn)品和服務(wù)。
實踐中的大師(Data Scientists in Action)
顯然,并不是說上面兩類大師不是實踐派。只是為了強調(diào)這類大師將數(shù)據(jù)科學引入到實踐當中所作的貢獻。
為了便于大家去全面深入得了解和學習這些數(shù)據(jù)大拿,本文所列舉的每個大拿都有其鏈接(LinkedIn/Twitter).
Research Oriented Data Scientists: 科研學術(shù)界大師
Geoffrey Hinton
只要是在機器學習屆混的或者懂點機器學習的人們,抑或懂點神經(jīng)網(wǎng)絡(luò)的人們,相信都知道“Back Propagation“反向傳播的鼎鼎大名。Hinton便是將BP算法應(yīng)用到神經(jīng)網(wǎng)絡(luò)與深度學習中人員之一,并且是主導者(co-inventor). Hinton 提出了“Dark Knowledge”黑暗知識概念(“Dark Knowledge”這本書籍已經(jīng)出版,亞馬遜上面有賣,288RMB,可見其nb性),該概念是受小概率比率事件中的“大部分知識”對于訓練與測試中的代價函數(shù)是沒有影響的。Hinton在人工智能領(lǐng)域中無人不知無人不曉是因為其在人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks)中所作出的貢獻。
早在上世紀60年代,Hinton在高中時期,就有一個朋友告訴他,人腦的工作原理就想全息圖一樣。創(chuàng)建一個3D全息圖,需要大量的記錄入射光被物體多次反射的結(jié)果,然后將這些信息存儲在一個龐大的數(shù)據(jù)庫中。大腦存儲信息的方式與全息圖類似,大腦并非將記憶存儲在一個特定的地方,而是砸整個神經(jīng)網(wǎng)絡(luò)里傳播。從此,Hinton對神經(jīng)網(wǎng)絡(luò)深深得著迷。他在劍橋大學學習心理學期間,發(fā)現(xiàn)科學家們并沒有真正理解人類大腦,人類大腦有數(shù)十億個神經(jīng)細胞,它們之間通過神經(jīng)突觸互相影響,形成極其復雜的相互聯(lián)系,然而科學家們并不能解釋這些具體的影響和聯(lián)系。神經(jīng)到底是如何進行學習以及計算的,對于Hinton,這些正是他所關(guān)心的問題。Hinton在愛丁堡大學獲得了人工智能的博士學位,現(xiàn)為多倫多大學的特聘教授。在2012年獲得了加拿大2012年基廉獎(Killam Prizes,Killam Prizes是有“加拿大諾貝爾獎”之稱的國家最高科學獎)。在2013年,他加入Google,并帶領(lǐng)一個AI團隊,目前正進行著Google Brain項目。
他和他的團隊強力將“神經(jīng)網(wǎng)絡(luò)”從垂死邊緣一步步帶入到當今的研究與應(yīng)用的熱潮,變成了炙手可熱的的學術(shù)界課題,將“深度學習”從邊緣課題變成了Google等互聯(lián)網(wǎng)巨頭仰賴的核心技術(shù)。目前神經(jīng)網(wǎng)絡(luò)與深度學習已在自然語言處理、語音處理以及計算機視覺等領(lǐng)域中得到了空前廣泛與成功地應(yīng)用。越來越多的科學家從事神經(jīng)網(wǎng)絡(luò)與深度學習的研究工作。換句話說,深度學習是目前的主流,我們不再是極端分子了。
Yann Lecun
Lecun在多倫多大學隨Hinton讀博士后,即他是Hinton的學生。他是另一個神經(jīng)網(wǎng)絡(luò)與深度學習大拿。他在皮埃爾瑪麗居里大學(又稱巴黎第六大學, Université Pierre et Marie Curie (Paris VI))獲得了計算機科學博士學位,期間提出后向傳播算法。他如今在Facebook帶領(lǐng)團隊進行人工智能工作,即他是Facebook人工智能實驗室的負責人。他在紐約大學任職了12年,是紐約大學的終身教授,是紐約大學數(shù)據(jù)科學中心的負責人。為了表彰他在深度學習領(lǐng)域里所作出的貢獻,IEEE計算機學會頒給他著名的“神經(jīng)網(wǎng)絡(luò)先鋒獎”,在2014年北京計算智能大會上授予。在加盟Facebook之前,Lecun已在貝爾實驗室工作超過20年,期間他開發(fā)了一套能夠識別手寫數(shù)字的系統(tǒng),叫作LeNet,用到了卷積神經(jīng)網(wǎng)絡(luò)(Cnvolutional Neural Networks, CNN),已開源。他研發(fā)了很多關(guān)于深度學習的項目,并且擁有14項相關(guān)的美國專利。他甚至開發(fā)了一種開源的面向?qū)ο缶幊陶Z言Lush,比Matlab功能還要強大,并且也是一位Lisp高手。他在機器學習、深度學習、計算機視覺、計算神經(jīng)科學領(lǐng)域進行了深度研究。