“當(dāng)我最開始聽說這些的時(shí)候,我認(rèn)為’沒有人符合該定義–他們怎么可能?’”Robert說,“因?yàn)檫@是一個(gè)新角色,我覺得人們把什么職責(zé)都扔給了他。當(dāng)你過度指定,最終只能得到一個(gè)空集”。許多商業(yè)人士視作數(shù)據(jù)科學(xué)家的,實(shí)際上是一個(gè)團(tuán)體的人表現(xiàn)出的各種各樣的功能。盡管現(xiàn)在依然缺乏符合這些角色的人,實(shí)際情況也與“鳳毛麟角”相去甚遠(yuǎn),有太多的人擁有這樣的天賦,成長為一個(gè)或多個(gè)所需的角色。
必要的技能與憑據(jù)是什么?
正如Robert表明的那樣,詳細(xì)的數(shù)據(jù)科學(xué)技能如雨后春筍般在網(wǎng)絡(luò)上列出,列表令人生畏。絕大多數(shù)指定經(jīng)驗(yàn)要求先進(jìn)的數(shù)學(xué)和統(tǒng)計(jì)分析(包括對類似R、SAS和Stata工具等的掌握)、創(chuàng)建程序(包括C、C++、Python和Java語言)、SQL數(shù)據(jù)庫、平臺如Hadoop/MapReduce、數(shù)據(jù)挖掘和建模、數(shù)據(jù)虛擬化、創(chuàng)造性和溝通能力與商務(wù)理解力。
當(dāng)然,數(shù)據(jù)科學(xué)家的確需要與先前的數(shù)據(jù)分析人員決然不同的能力與技巧,這是事實(shí)。Raden承認(rèn),例如,他們需要有能力處理當(dāng)前各種各樣的有效數(shù)據(jù),并且最終分析數(shù)組可以采用,Raden表示。
他們需要掌握編程技巧,也要有定量方法和調(diào)查與建模方向的背景;在涉及到數(shù)據(jù)的時(shí)候,他們必須能夠辨別什么數(shù)據(jù)是有意義的,什么數(shù)據(jù)是無意義的,Raden補(bǔ)充道。高效的數(shù)據(jù)科學(xué)家還需要足夠的業(yè)務(wù)領(lǐng)域知識,在復(fù)雜學(xué)科上與缺乏相應(yīng)背景工具和方法的人順暢溝通的能力,他說。
到底是什么導(dǎo)致數(shù)據(jù)科學(xué)家優(yōu)于其他分析人士呢?Ripaldi解釋,是溝通能力–通常的C系列–數(shù)據(jù)告訴他們結(jié)果,以及針對此結(jié)果應(yīng)該如何采取行動(dòng)?!澳憧梢苑治鏊心阆胍臄?shù)據(jù),但如果你不能清晰的表達(dá)出數(shù)據(jù)告訴你的東西,你就不能算作是數(shù)據(jù)科學(xué)家”,他說。畢竟,我們的目標(biāo)是推進(jìn)經(jīng)營戰(zhàn)略,如減少客戶流失,提供跨渠道,化解金融風(fēng)險(xiǎn)。
然后再一次,Robert看到了這些需求本身存在的固有的沖突,她坦陳,“他們不得不能夠坐在那里,在一段時(shí)間內(nèi)尋找數(shù)據(jù),然后翻轉(zhuǎn)開關(guān),化身為能引人入勝的主持人?這完全是兩個(gè)不同的人?!?/p>
Opera–也雇傭了各種各樣機(jī)器學(xué)習(xí)(能力)的數(shù)據(jù)科學(xué)家–在尋找這樣的人,他們擁有定量領(lǐng)域背景,有數(shù)學(xué)和統(tǒng)計(jì)概念資質(zhì),能夠?qū)⑦@些概念以計(jì)算機(jī)程序進(jìn)行實(shí)例化,接受大容量數(shù)據(jù)流并對解決實(shí)際商業(yè)問題有一定興趣。
“我們對那些需要學(xué)習(xí)機(jī)器學(xué)習(xí)算法的人感到自在,如果他們對數(shù)學(xué)和解決問題的能力表現(xiàn)出色?!監(jiān)pera分析部門全球負(fù)責(zé)人Joseph Milanna表示,“他們可能不是一名合格的數(shù)學(xué)家或已經(jīng)建立了神經(jīng)網(wǎng)絡(luò),但他們應(yīng)該表現(xiàn)出激情與興趣,這樣我們才會(huì)選擇他”。
擁有怎樣的背景,才能成為一名數(shù)據(jù)科學(xué)家?
在Opera,大多數(shù)成功的申請者都擁有更高水平的學(xué)術(shù)培訓(xùn)甚至擁有PhD。“鑒于在機(jī)器學(xué)習(xí)科學(xué)和其他新出現(xiàn)的新型技術(shù)的進(jìn)步,科學(xué)家的確需要更高水平的訓(xùn)練,浸淫最新思想成果”,Milanna說。即便是在求職搜索網(wǎng)站Dice,半數(shù)的數(shù)據(jù)科學(xué)家都指定要求必須具備PhD學(xué)位,Silver表示,“這不是絕對必要的,但卻是主要的獎(jiǎng)勵(lì)”,他補(bǔ)充。
Opera雇員跨越了各種各樣的數(shù)據(jù)驅(qū)動(dòng)型學(xué)科,包括計(jì)算機(jī)科學(xué)、電子工程、統(tǒng)計(jì)學(xué)、機(jī)械工程和心理學(xué)。這樣跨學(xué)科的知識大有裨益,Milanna強(qiáng)調(diào)。例如,他已經(jīng)看到了來自水文學(xué)的分子式應(yīng)用于股票市場交易信號。
對于更大的數(shù)據(jù)科學(xué)家池,Raden堅(jiān)信PhD學(xué)位不是必要的。如果一個(gè)人現(xiàn)在的工作室商業(yè)智能和定量分析,并且在那之前表現(xiàn)出了先進(jìn)的數(shù)學(xué)和統(tǒng)計(jì)建模能力,就可以成長為企業(yè)的數(shù)據(jù)科學(xué)家,為企業(yè)提供如預(yù)測建模和大數(shù)據(jù)等類似關(guān)鍵領(lǐng)域的指導(dǎo)與培訓(xùn)。
Roberts表示同意,專注于特定技能和學(xué)歷。某些時(shí)候可能會(huì)成為潛在求職者思考的代理人?!八麄冋緢D衡量的是‘你喜歡學(xué)習(xí)嗎?’但一堆方法可以用來獲取該結(jié)論”,她表示。在天才分析(Talent Analytics)公司的調(diào)查中,數(shù)據(jù)科學(xué)家的先天特性包括好奇心、創(chuàng)造力、客觀、有條理地思考能力與對細(xì)節(jié)的專注力,她強(qiáng)調(diào)。Milanna和Spoelstra也同意該觀點(diǎn),他們尋找候選人的最重要的天然特質(zhì)也包括好奇心、邏輯思維、常識力、毅力、實(shí)用性和良好的判斷力。 更多詳細(xì)信息,請您微信關(guān)注“計(jì)算網(wǎng)”公眾號: