大數(shù)據(jù)這個關(guān)鍵字從去年紅到今年,早已成為科技業(yè)的重要趨勢,研調(diào)機(jī)構(gòu)IDC便預(yù)測2015年將有超過25%的企業(yè)導(dǎo)入巨量資料方案,而美國專業(yè)招聘公司羅致恒富(Robert Halt)公布的《2015薪資指南(2015 Salary Guide》更把大數(shù)據(jù)工程師列為今年薪資漲幅最大的六大行業(yè)之一,預(yù)計薪資年成長率9.3%,平均年薪119,250美元至168,250美元。
臺灣從企業(yè)到政府也人人高喊大數(shù)據(jù),連向來對新科技接受速度最慢的政府都開始動作。行政院長毛治國甫上任祭出的科技三箭,就有兩箭跟數(shù)據(jù)息息相關(guān),一個是開放資料,一個是大數(shù)據(jù),新北市政府日前也推出全國第一個「傳統(tǒng)產(chǎn)業(yè)大數(shù)據(jù)應(yīng)用示范計劃」,希望導(dǎo)入大數(shù)據(jù)分析,幫助金屬、機(jī)械和紡織等傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型,還在日前的新北大數(shù)據(jù)論壇活動中請來美國大數(shù)據(jù)分析與儲存技術(shù)公司Teradata首席技術(shù)長寶立明(Stephen Brobst)來分享大數(shù)據(jù)趨勢。
Teradata中國專區(qū)落戶36大數(shù)據(jù)>>>
寶立明此次來臺除了出席新北大數(shù)據(jù)論壇分享大數(shù)據(jù)趨勢,更受邀至行政院與毛治國暢談開放資料政策,分享美國政府開放資料的經(jīng)驗以供臺灣借鏡。寶立明去年被ExecBank選為全美排名第四的CTO(前三名分別是亞馬遜、特斯拉和英特爾),在2500名頂尖CTO中脫穎而出,他不僅是全球一流的數(shù)據(jù)專家,更曾成功創(chuàng)立三家提供數(shù)據(jù)服務(wù)的公司,后來陸續(xù)被IBM、NCR等大廠并購,他也是歐巴馬的創(chuàng)新科技顧問委員會的一員。
身為全球頂尖的大數(shù)據(jù)專家,寶立明在接受《數(shù)位時代》專訪時卻說,他認(rèn)為大數(shù)據(jù)這個詞將會在五年內(nèi)消失,并認(rèn)為從物理學(xué)家到社會學(xué)家都會是優(yōu)秀的數(shù)據(jù)科學(xué)家,以下為寶立明專訪的內(nèi)容摘要:
1. 大數(shù)據(jù)這個詞近年來非常火紅,但也有人認(rèn)為大數(shù)據(jù)已處在泡沫期,您怎么看這種人人高喊大數(shù)據(jù)的現(xiàn)象?
我承認(rèn)現(xiàn)在整個社會上瀰漫著一股大數(shù)據(jù)熱潮,但我認(rèn)為這不失為一種好現(xiàn)象,因為這讓大家注意到這個世界上還有許多尚未被挖掘,并且充滿價值的資料,我認(rèn)為在這股熱潮當(dāng)中,其實是有黃金的,但就像你說的,其實還是有很多人不知道大數(shù)據(jù)是什么意思,更不知道怎么用他。
他們以為大數(shù)據(jù)就是指大數(shù)目的數(shù)據(jù),事實上,我認(rèn)為這是大數(shù)據(jù)中最無趣的部分,我們真正在尋找的是非傳統(tǒng)的、而且未曾被挖掘過的資料,并且從這些資料中去提煉出價值,我相信在五年內(nèi)我們就不會再使用「大數(shù)據(jù)」這個詞了,到頭來大數(shù)據(jù)就只是資料而已,不是嗎?資料是很重要,但是這個世界上還有一大堆以往根本不被視為是資料的資料在那邊等著我們挖掘,到最后,人們會開始回頭分析這些資料,他們會發(fā)現(xiàn),大數(shù)據(jù)不過就只是數(shù)據(jù)的一種,大數(shù)據(jù)、小數(shù)據(jù)、結(jié)構(gòu)化、非結(jié)構(gòu)化的資料…這些稱呼通通都不重要,因為這些都是資料啊,這是我認(rèn)為為什么到最后大數(shù)據(jù)這個詞匯將會退燒的原因。
2. 你認(rèn)為數(shù)據(jù)經(jīng)濟(jì)以后將會成為每個企業(yè)的DNA嗎?
是的沒錯,人們將會依據(jù)一家公司是否有效地運(yùn)用數(shù)據(jù),來定義這家公司是否成功。大數(shù)據(jù)這個詞也許是三年前才出現(xiàn)的,但其實它早在十年前就有了,概念比名詞出現(xiàn)得更早,在八年前發(fā)生了一個比較重大的轉(zhuǎn)變,人們從研究一筆交易變成研究互動,我們開始往下鉆研,不只研究一筆交易,更研究真實的顧客體驗,因此我認(rèn)為雖然不是每一個,但許多大數(shù)據(jù)應(yīng)用必須要能夠更妥善了解顧客的行為和體驗。
我認(rèn)為大數(shù)據(jù)發(fā)展可以分成三階段:
第一階段是.com時期,人們研究log資料,搜集人們的Cookie和搜尋行為等等,這類分析已經(jīng)存在很久了,我們不只知道使用者買了什么東西而已,而是更深層地去分析行為,一筆交易只告訴我價值,但沒有告訴我顧客體驗,大數(shù)據(jù)想要去分析的是顧客體驗。
第二階段是社交網(wǎng)站,這也是我們現(xiàn)在正在經(jīng)歷的階段,我們分析Facebook、Twitter、部落格文章…等等等,這可以幫助我們進(jìn)一步了解顧客行為。
第三階段是物聯(lián)網(wǎng),這是我覺得最有趣的階段,有些企業(yè)已經(jīng)開始分析來自傳感器的數(shù)據(jù)了,在這邊我說的物聯(lián)網(wǎng)不只是穿戴式裝置或智慧家庭而已,我說的是機(jī)器與機(jī)器之間的溝通,這些資料的價值很值得被研究?,F(xiàn)在制造業(yè)都會訂下一些規(guī)矩,例如我們的汽車每半年就要進(jìn)廠維修,就跟人每年都要去做健康檢查一樣,我認(rèn)為這是非常過時的想法,一旦我們用傳感器去搜集引擎、汽車和生理數(shù)據(jù),我們就可以精確知道何時需要進(jìn)廠維修或做健康檢查,這就叫做預(yù)測性維修(condition based maintenance),這個概念對于促進(jìn)顧客體驗、效益和健康保險等領(lǐng)域非常重要。