本文獨(dú)家探討了IT行業(yè)發(fā)展最快、業(yè)內(nèi)討論最多的角色之一–數(shù)據(jù)科學(xué)家。根據(jù)CNN報(bào)道,數(shù)據(jù)科學(xué)家是2012年度最佳的新工作之一,《哈佛商業(yè)評(píng)論》的評(píng)論文章甚至稱其為21世紀(jì)“最性感”的工作。數(shù)據(jù)科學(xué)家的工作是使用數(shù)據(jù)分析作為交易工具,在浩如煙海的數(shù)據(jù)容量中發(fā)掘有意義的關(guān)聯(lián)數(shù)據(jù),并將其轉(zhuǎn)化為有利可圖的商業(yè)洞察力。

經(jīng)過(guò)為期數(shù)月的高失業(yè)率和仍然搖擺不定的經(jīng)濟(jì)態(tài)勢(shì)之后,從就業(yè)市場(chǎng)上得到的任何好消息都能迅速獲得關(guān)注,但即便是這樣,對(duì)于大家都關(guān)注著一個(gè)突然非常“in”的工作職務(wù):數(shù)據(jù)科學(xué)家這樣的事情,似乎沒(méi)能完全解釋得清。
根據(jù)CNN報(bào)道,數(shù)據(jù)科學(xué)家是2012年度最佳的新工作之一,《哈佛商業(yè)評(píng)論》的評(píng)論文章甚至稱其為21世紀(jì)“最性感”的工作。
數(shù)據(jù)科學(xué)家的巨大誘惑力直接根源于市場(chǎng)對(duì)大數(shù)據(jù)與分析的強(qiáng)烈興趣。數(shù)據(jù)科學(xué)家的工作是使用數(shù)據(jù)分析作為交易工具,在浩如煙海的數(shù)據(jù)容量中發(fā)掘有意義的關(guān)聯(lián)數(shù)據(jù),并將其轉(zhuǎn)化為有利可圖的商業(yè)洞察力。
此外,那些適應(yīng)多維度工作崗位,糅合計(jì)算機(jī)科學(xué),掌握先進(jìn)的定量概念、業(yè)務(wù)領(lǐng)域知識(shí)和溝通技巧的人常常是鶴立雞群、鳳毛麟角。隨著數(shù)據(jù)科學(xué)家的供不應(yīng)求,數(shù)據(jù)工作者的收入達(dá)到了6位數(shù)字,人力資源公司Modis高級(jí)副總裁Matthew Ripaldi表示。
招聘人員同樣表示數(shù)據(jù)科學(xué)家崗位飛速增長(zhǎng),即便工作職位的數(shù)量并不那么驚人。“當(dāng)我們兩年前開(kāi)始尋找符合該職位要求的人時(shí),僅僅只有8個(gè)工作崗位,但現(xiàn)在工作崗位有42個(gè)。”Tom Silver表示,他在工作搜索網(wǎng)站Dice.com擔(dān)任北美地區(qū)高級(jí)副總裁?!?3000個(gè)工作崗位中的42個(gè),實(shí)在是不算龐大,但我決不會(huì)懷疑這個(gè)崗位在未來(lái)的快速發(fā)展”。
眾人矚目之外,有任何數(shù)據(jù)和計(jì)算機(jī)工作背景的人自然會(huì)心生懷疑,誰(shuí)會(huì)成為數(shù)據(jù)科學(xué)家,我能不能成為數(shù)據(jù)科學(xué)家?筆者在此試著解答一些最基本的問(wèn)題。
數(shù)據(jù)科學(xué)家是什么?
這個(gè)看似簡(jiǎn)單的問(wèn)題的答案,取決于你問(wèn)的對(duì)象。網(wǎng)址縮短服務(wù)Bit.ly公司首席科學(xué)家Hilary Manson對(duì)數(shù)據(jù)科學(xué)家的定義獲得了廣泛接受與認(rèn)可: 數(shù)據(jù)科學(xué)家指能獲取、清洗、探索、建模與解釋數(shù)據(jù)的人。
位于新墨西哥州圣達(dá)菲的咨詢機(jī)構(gòu)Hired Brains公司首席執(zhí)行官兼首席分析師 Neil Raden則更為深入,他將數(shù)據(jù)科學(xué)家分成兩種類型。
第一種類型–他們是真正的科學(xué)家,研究創(chuàng)造算法和方法,發(fā)表論文,并積極參與這些規(guī)則的溝通。這些單個(gè)的人物常見(jiàn)于以算法和方法為核心的研究機(jī)構(gòu)和學(xué)術(shù)機(jī)構(gòu)(想想谷歌、亞馬遜和華爾街),Raden表示。
第二種類型–這個(gè)類型的人群更接近于我們今天提到的雇傭市場(chǎng)上的人–他們不是科學(xué)家而是數(shù)據(jù)從業(yè)者,Raden補(bǔ)充道。他們都是統(tǒng)計(jì)學(xué)與數(shù)學(xué)建模及開(kāi)發(fā)領(lǐng)域的專家,掌握并采用定量分析方法,設(shè)計(jì)、測(cè)試和部署模型。
預(yù)測(cè)分析服務(wù)提供商Opera解決方案研發(fā)中心全球負(fù)責(zé)人Jacob Spoelstra,也把在Opera工作的人大致歸類為數(shù)據(jù)科學(xué)家,以及由他本人與同事負(fù)責(zé)的其他工作。
Opera公司的“數(shù)據(jù)科學(xué)家”–與Raden分類的第一種類型人群十分符合–在機(jī)器學(xué)習(xí)(能力)的水平上工作,開(kāi)發(fā)統(tǒng)計(jì)模型和模式識(shí)別算法,從海量數(shù)據(jù)流中發(fā)現(xiàn)和提取智能預(yù)測(cè)。他們將分析發(fā)現(xiàn)轉(zhuǎn)化為直接行動(dòng),通過(guò)減少財(cái)務(wù)欺詐或檢測(cè)高風(fēng)險(xiǎn)抵押貸款等類似措施,幫助提升業(yè)務(wù)。Spoelstra估計(jì),類似谷歌這樣的公司雇傭了數(shù)百位這種類型的數(shù)據(jù)科學(xué)家,而Opera公司近700位雇員中,有三分之一是機(jī)器學(xué)習(xí)(能力)領(lǐng)域的專家。
同時(shí),天才分析(Talent Analytics)公司CEO Greta Roberts堅(jiān)信當(dāng)前對(duì)數(shù)據(jù)科學(xué)家工作的理解實(shí)際上包含四大功能角色。一項(xiàng)針對(duì)數(shù)據(jù)科學(xué)家的調(diào)查詢問(wèn)了他們?nèi)绾畏峙?1項(xiàng)分析功能的時(shí)間,出現(xiàn)了四個(gè)集群:數(shù)據(jù)準(zhǔn)備人員(他們花費(fèi)絕大部分時(shí)間,進(jìn)行數(shù)據(jù)的采集、制備和分析);程序員(他們創(chuàng)建程序并做相應(yīng)的一些分析);管理人員(他們專注于數(shù)據(jù)管理、管控、展示、詮釋與設(shè)計(jì));最后一種為通才(什么都干,什么都只會(huì)一點(diǎn)點(diǎn))。
更多詳細(xì)信息,請(qǐng)您微信關(guān)注“計(jì)算網(wǎng)”公眾號(hào):