同時(shí),森古普塔表示,當(dāng)今云計(jì)算的低成本意味著“你真的可以做那些以前從來不可能實(shí)現(xiàn)的的事情。”
(6)機(jī)器算法將取代人類分析
森古普塔認(rèn)為在分析大數(shù)據(jù)方法有一個(gè)有趣的二分法。“有人說,解決這個(gè)問題需要成千上萬的數(shù)據(jù)科學(xué)家來分析解決,隨后,又有人說,采用機(jī)器學(xué)習(xí)就可以做到這一切。這將是完全自動(dòng)的。”
但是,桑古塔并不認(rèn)為這些都是合適的解決方案。“沒有足夠的數(shù)據(jù)科學(xué)家,成本將快速上升。”他說,“此外,企業(yè)用戶有多年的域名登錄經(jīng)驗(yàn),并有著對他們業(yè)務(wù)的直覺。當(dāng)你請來一個(gè)數(shù)據(jù)科學(xué)家,并認(rèn)為他會(huì)搞定這些工作,并告訴你該怎么做。這實(shí)際上創(chuàng)造了一個(gè)確切的錯(cuò)誤,數(shù)據(jù)科學(xué)家們往往無法無法足夠了解企業(yè)的業(yè)務(wù)。”
“完美”的數(shù)據(jù)科學(xué)家,是那些準(zhǔn)確理解具體業(yè)務(wù)如何運(yùn)作,以及其數(shù)據(jù)是如何工作的,這是一個(gè)誤區(qū)。森古普塔說,“這樣的人根本不存在。”
在現(xiàn)實(shí)中,森古普塔說,“大多數(shù)數(shù)據(jù)科學(xué)項(xiàng)目實(shí)際上沒有得到實(shí)施,因?yàn)樗侨绱似D難,需要幾個(gè)月得到完成,而當(dāng)它完成的時(shí)候,你所關(guān)心的問題是已經(jīng)陳舊過時(shí)了。”
但是,也有過于依賴機(jī)器學(xué)習(xí)問題。“機(jī)器學(xué)習(xí)只是給出一個(gè)答案,但并沒有解釋。它告訴人們該怎么做,而不是為什么要那樣做,”他說。“人們不喜歡別人告訴他該怎么做,尤其是神奇的機(jī)器。”他說,其關(guān)鍵是不只是答案,而是其解釋和建議。
一方面,他說,數(shù)據(jù)科學(xué)家將變得越來越專業(yè)化,而這是真正困難的問題。“想一想各機(jī)構(gòu)和企業(yè)開始建設(shè)了數(shù)據(jù)處理部門和一些處理部門。世界500強(qiáng)企業(yè)也有數(shù)據(jù)處理部門“或數(shù)字加工部門。但他們基本上變成了Excel,Word和PowerPoint。”盡管如此,人們?nèi)匀皇菙?shù)據(jù)和數(shù)字處理方面的專家。
“如果我去摩根士丹利,相信我,那些數(shù)據(jù)處理和數(shù)字處理方面的專家仍然存在。他們只是有著不同的名稱和不同的工作,但在真正的情況下,這些人仍然存在,但80%-90%的專家已經(jīng)轉(zhuǎn)移到Excel,Word和PowerPoint方面,這是全球在大數(shù)據(jù)方面應(yīng)該發(fā)展的主要原因。”