Goldman是斯坦福物理學(xué)博士畢業(yè),他非常著迷于越來越多的用戶關(guān)聯(lián)和豐富的用戶個人資料。這些原本只能帶來一堆雜亂的數(shù)據(jù)和笨拙的分析,但是,當(dāng)他開始探究用戶之間的聯(lián)系時,他開始看到新的可能。于是他開始組織他的理論,檢驗他的猜想,建立模型,預(yù)測用戶愿意與誰建立聯(lián)系。他感到,他正在開發(fā)的新功能,能帶給用戶價值。但是LinkedIn的工程師們當(dāng)時忙于提升網(wǎng)站性能,沒有理睬,有些同事則公開表示不看好Goldman的想法:為什么用戶想要LinkedIn告訴他們該和哪些用戶建立聯(lián)系呢?網(wǎng)站已經(jīng)有一個導(dǎo)入通訊錄的功能,能導(dǎo)入用戶的所有聯(lián)系人。
幸運的是,公司的聯(lián)合創(chuàng)世人兼當(dāng)時的CEO Reid Hoffman根據(jù)自己在PayPal的經(jīng)驗,相信數(shù)據(jù)分析的強大力量,給予了Goldman高度的自主權(quán)。其中一項就是,Goldman可以繞開傳統(tǒng)的產(chǎn)品發(fā)布流程,而以廣告的形式把這個小模塊發(fā)布在網(wǎng)站最受歡迎的頁面上。
通過這個模塊,Goldman開始了他的試驗,用戶可能認(rèn)識一些人,比如和用戶來自同一個學(xué)校或工作單位, 卻還沒有在網(wǎng)站上建立起這些關(guān)系,如果把這些名字告訴用戶,他們會作何反應(yīng)。他根據(jù)用戶在網(wǎng)站上注冊時填寫的背景資料,找出了每個用戶可能最想與之建立聯(lián)系的三個用戶,然后定制了一套廣告。幾天之內(nèi),很明顯地,奇妙的事情發(fā)生了,這些廣告的點擊率前所未有的高。接下來,Goldman根據(jù)“閉環(huán)理論”改進了他的推薦方法,閉環(huán)理論指的是如果你同時認(rèn)識張三和李四,那么張三和李四很可能也相互認(rèn)識。同時,Goldman和他的團隊讓用戶對每個推薦的操作可以一鍵搞定。
很快LinkedIn的高層開始認(rèn)識到這是個很好的主意,并將其列為標(biāo)準(zhǔn)功能。從那時起,事情真的開始起飛了。“你可能認(rèn)識的人(People You May Know)”廣告獲得了30%的點擊率,比其他任何的站內(nèi)推廣廣告點擊率都要高,共計產(chǎn)生了數(shù)百萬個新頁面瀏覽。得益于這項新功能,LinkedIn的成長速度大幅提升。
新新職業(yè)
Goldman 是一個很好的例子來說明組織中的重要新成員“數(shù)據(jù)科學(xué)家”。這是非常高階的專業(yè)崗位,要有在數(shù)據(jù)海洋中尋寶的好奇心和相應(yīng)訓(xùn)練。這個頭銜存在有幾年了,第一次出現(xiàn)是2008由 D.J. Patil(本文作者之一)和Jeff Hammerbacher提出的,他們后來分別成為了LinkedIn和Facebook的數(shù)據(jù)和分析團隊的負(fù)責(zé)人。但現(xiàn)在已經(jīng)有數(shù)千位數(shù)據(jù)科學(xué)家工作于創(chuàng)業(yè)公司和成熟的大型企業(yè)。他們在行業(yè)里的忽然走俏,反應(yīng)了這樣一個現(xiàn)狀,企業(yè)需要處理的信息正以從未遇見過的規(guī)模和渠道涌現(xiàn)。如果你的機構(gòu)存儲了幾個PB的數(shù)據(jù),或者對于你的生意最重要的信息是表格式的,而不再是行列的數(shù)據(jù),或者要回答你最大的問題需要各種分析手段的“混搭”,你趕上大數(shù)據(jù)時代了。
現(xiàn)階段對于大數(shù)據(jù)的主要熱情都集中在大數(shù)據(jù)的處理技術(shù)上,比如,使用最廣泛的分布式文件處理系統(tǒng)Hadoop,和相關(guān)的開源工具、云計算、數(shù)據(jù)可視化技術(shù)。這些突破性技術(shù)都是非常重要的,重要程度就不亞于有能力與腦力運用好技術(shù)的人。對數(shù)據(jù)科學(xué)家的需求快速增加,已經(jīng)超過了供給,事實上,人才缺乏開始嚴(yán)重制約某些行業(yè)。Greylock Partners是一家投資初創(chuàng)企業(yè)的風(fēng)投公司,曾經(jīng)投資過Facebook, LinkedIn, Palo Alto Networks和Workday,它非常擔(dān)憂緊張的人才儲備,因而建立了自己的招聘團隊,負(fù)責(zé)給自己投資的公司輸送人才。招聘團隊的負(fù)責(zé)人Dan Portillo說,“這些公司一旦有了數(shù)據(jù),就需要有人管理數(shù)據(jù),發(fā)現(xiàn)真知。”
他們是誰?
從大數(shù)據(jù)中獲利需要雇傭稀缺的數(shù)據(jù)科學(xué)家,管理人員面臨三大挑戰(zhàn),識別人才,吸引人才,善用人才。和其他職責(zé)明確的崗位相比,這三項任務(wù)都不那么直接明了。首先,目前沒有高校項目培養(yǎng)相關(guān)人才,同時,數(shù)據(jù)科學(xué)家在組織中處于什么位置,如何讓他們創(chuàng)造最大價值,如何衡量他們的作用,這些都沒有公認(rèn)的標(biāo)準(zhǔn)。