作者: Andrew Nusca,Robert Hackett,Shalene Gupta
譯者:樸成奎
摘自:財富中文網(wǎng)
大數(shù)據(jù)不只是要處理很多的數(shù)字,還得要通過這些數(shù)字建立模型、深入挖掘,并且尋找那些有可能改變企業(yè)運營方式的信息。以下謹(jǐn)為大家介紹20位大數(shù)據(jù)領(lǐng)域的頂尖人才。
Pinterest數(shù)據(jù)科學(xué)家安德莉亞·伯班克
Pinterest是一家以圖片為主的社交網(wǎng)絡(luò),數(shù)據(jù)科學(xué)家安德莉亞?伯班克主要負(fù)責(zé)該公司的A/B測試,評估公司網(wǎng)站、APP的外觀或功能變化會對它的6000萬全球用戶產(chǎn)生哪些影響。如果Pinterest網(wǎng)站上的某個小模塊讓你想邀請朋友也來玩一玩,或是某一封它發(fā)來的推薦郵件讓你關(guān)注了更多話題,那么這很可能就是伯班克團(tuán)隊的那只“看不見的手”起了作用。她在今年三月的一次行業(yè)會議上表示:“為了今后能為幾十億用戶提供服務(wù),我們已經(jīng)針對幾百萬用戶做了數(shù)百次試驗。”試驗還拓展到了Pinterest自身的運營上。伯班克最大的成就之一,就是給Pinterest的其他員工賦權(quán),讓他們也能開展試驗。她表示:“以前只有一個故障點,但也只有一個知識點,現(xiàn)在不同了。”——Andrew Nusca
0xdata公司物理學(xué)家、黑客阿諾·康代爾
阿諾·康代爾從小就生長在一個科研氛圍濃厚的環(huán)境中。他出生于瑞士一個叫做下錫根塔爾的小村子,這個村子恰好位于擁有歐洲頂級粒子加速實驗室的保羅謝爾學(xué)院(Paul Scherrer Institute)和歐洲大陸最著名的科技院校蘇黎士聯(lián)邦理工學(xué)院(ETH Zürich)之間。在學(xué)習(xí)粒子物理學(xué)和超級計算機學(xué)期間,康代爾曾經(jīng)在電腦上建立過宇宙的模型。后來他搬到美國加利福尼亞州,在斯坦福大學(xué)直線加速器中心的全國加速實驗室中工作(SLAC National Accelerator Laboratory),后來又開始創(chuàng)業(yè),成為Skytree公司的創(chuàng)始工程師,并且設(shè)計了幾套高性能的機器學(xué)習(xí)算法?,F(xiàn)在他是Oxdata公司h2o數(shù)據(jù)分析平臺的核心開發(fā)者,他開發(fā)的這個h2o平臺,被編程社區(qū)GitHub的成員譽為最優(yōu)秀的開源Java機器學(xué)習(xí)項目,而且它還可以兼容流行的統(tǒng)計編程語言——R語言。他在Oxdata公司的頭銜是“物理學(xué)家兼黑客”。——Robert Hackett
Hortonworks聯(lián)合創(chuàng)始人阿蘭·默西
阿蘭·默西最早在雅虎公司(Yahoo)工作,現(xiàn)在已然用途極廣的開源存儲和處理軟件Hadoop在那時尚處于早期原型階段。默西的團(tuán)隊的任務(wù)就是擴展Hadoop的功能,讓它用于雅虎的網(wǎng)頁搜索。于是默西研發(fā)了一個名叫YARN的資源負(fù)載管理系統(tǒng),它的作用大致相當(dāng)于Hadoop的一個操作系統(tǒng)。默西表示:“第一版的Hadoop看起來就像還在用Notepad的Windows,但是我們真正想要的是能用Powerpoint、Word和Excel的Windows。”這正是YARN的魅力所在:它允許用戶向Hadoop中插入多種應(yīng)用以存儲各類信息。默西表示:“我家里有兩個孩子,但YARN就像是我的第三個孩子。”——Robert Hackett
NuoDB首席執(zhí)行官巴里·莫里斯
很多科技公司都想發(fā)起一場技術(shù)革命,但是很少能獲得上一波技術(shù)革命領(lǐng)導(dǎo)者的支持。馬薩諸塞州劍橋市的NuoDB公司卻一舉網(wǎng)羅了上一波數(shù)據(jù)庫革命“四大天王”的其中之三——Ingres公司前CEO加理?摩根泰勒、Sybase公司前CEO米切爾?克茲曼、Informix公司前CEO羅杰·斯普爾。只有最后一名“天王”,也就是甲骨文(Oracle)的CEO棄權(quán)了,但他也身在投資人之列。這么一家名不見經(jīng)傳的公司何以有這么大的號召力?因為NuoDB的技術(shù)解決了一個多年來被行業(yè)視為“圣杯”的問題:如何讓一個數(shù)據(jù)庫在多個服務(wù)器上運行。“關(guān)鍵在于用更多的機器,而不是更大的機器。”該公司CEO巴里?莫里斯表示:“那個問題聽起來雖然簡單,但一直沒得到解決。”DuoDB公司成立于2010年,現(xiàn)在這家公司已經(jīng)簽下了一個大客戶——歐洲第二大軟件廠商達(dá)索系統(tǒng)公司(Dassault Systèmes)。另外莫里斯認(rèn)為,公司正在飛速朝著一個“新的聚焦點”邁進(jìn)。他認(rèn)為DuoDB將走上舞臺的中央。“它的意義不在于數(shù)據(jù)的規(guī)?;蜻\行速度,而在于形成一種數(shù)據(jù)導(dǎo)向型模式。持續(xù)改進(jìn)的能力才是它的革命性所在。”——Andrew Nusca