[大數(shù)據(jù)100分]
主講人:白碩
主持人:趙國棟
承辦:中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟
中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟特別邀請白老師擔(dān)綱首期“大數(shù)據(jù)100分”論壇主講嘉賓!
白碩老師是上海證交所總工程師,北大計算機博士、數(shù)學(xué)系博士后。兼任中科院計算所、信息工程研究所、中國科學(xué)院大學(xué)博士生導(dǎo)師。還擔(dān)任中國中文信息學(xué)會常務(wù)理事,全國金融標(biāo)準(zhǔn)化委員會證券分委員會副主任委員。白老師研究和工作領(lǐng)域橫跨學(xué)術(shù)、產(chǎn)業(yè)、資本,對大數(shù)據(jù)方面的研究既處在實踐前沿又具備理論高度。
以下為交流實況全文,中間穿插部分專家與白老師的互動:
很榮幸同大家進行“大數(shù)據(jù)100分”首場交流。我作為一個曾經(jīng)的學(xué)者和現(xiàn)任的金融機構(gòu)技術(shù)主管,從我們行業(yè)的需求角度,結(jié)合我個人的專業(yè)背景,談一點個人對大數(shù)據(jù)的粗淺體會。
一、大數(shù)據(jù)不等于數(shù)據(jù)大,誰也沒有資格壟斷大數(shù)據(jù)概念的定義權(quán)
有的人會說,你有多少數(shù)據(jù)?如果沒有P量級的數(shù)據(jù),甭跟我談大數(shù)據(jù)。這種觀點很有代表性,不僅自己有P量級數(shù)據(jù)的互聯(lián)網(wǎng)公司、運營商這樣說,一些學(xué)者也這樣說。
(我們還沒混進P階層)
我的觀點是,大數(shù)據(jù)不等于數(shù)據(jù)大。數(shù)據(jù)大,但沒有與這個體量相稱的處理手段、應(yīng)用需求乃至商業(yè)模式,數(shù)據(jù)的價值得不到充分的發(fā)揮,那是空有其大。數(shù)據(jù)大,就算你也有相應(yīng)的自我實現(xiàn)數(shù)據(jù)價值的手段,但這手段如果不能輻射到數(shù)據(jù)不算太大(比如,規(guī)模在1T到1P之間)的領(lǐng)域,那也只是孤芳自賞。我們?nèi)祟惿鐣谶M步中,固然需要不斷挑戰(zhàn)數(shù)據(jù)處理極限,在挑戰(zhàn)極限中發(fā)展新技術(shù)為自己所用,做這些事情的人和機構(gòu)值得我們敬佩,這是肯定的。但他們的價值遠不限于此。他們被挑戰(zhàn)極限逼出來的成果,可以輻射得更遠。
如果既能不斷沖擊極限(“頂天”),也能普遍降低非極限情況下數(shù)據(jù)處理的性價比(“立地”),這才是真正有價值的大數(shù)據(jù)技術(shù)。所以現(xiàn)在,大數(shù)據(jù)不僅是P量級的巨頭們在談,更廣大的IT應(yīng)用群體也在談。誰也沒有資格壟斷大數(shù)據(jù)概念的定義權(quán)。
二、數(shù)據(jù)處理領(lǐng)域的“貴族化”與“去貴族化”
我在自身工作當(dāng)中感觸最深的,就是數(shù)據(jù)處理領(lǐng)域的“貴族化”。我從大數(shù)據(jù)熱潮中獲益最多的,就是數(shù)據(jù)處理領(lǐng)域的“去貴族化”。大數(shù)據(jù)的“普遍降低非極限情況下數(shù)據(jù)處理的性價比”這一特點,就是我們?nèi)ベF族化的利器。
什么是“去貴族化”?這是一個籠統(tǒng)的說法。IT圈里很多人指名道姓地去XXX化,這雖然可以理解,但要看到具體的公司也會變化、也會進步。我們揚棄的實際上是一類貴族化的解決方案,所以我比較偏愛“去貴族化”的說法。
那,什么是“貴族化”呢?依我看,貴族化的解決方案有三個最主要的特點:重、滯、貴。
先看“重”,這里“重”不是指物理重量,而是指一種笨重的堆砌。給你10000個功能,你可能用不了100個,但這10000個功能卻逼迫你走上一條不歸路:你的軟件和硬件無法分離;存儲功能和計算功能無法分離,實時處理功能和歷史分析功能無法分離,非結(jié)構(gòu)化數(shù)據(jù)處理功能只能削足適履地轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)、再用結(jié)構(gòu)化數(shù)據(jù)處理引擎處理。
互動:@顏陽:普恵金融,普惠數(shù)據(jù)。降維處理
再看“滯”,這里主要指這類解決方案在架構(gòu)上的巨大惰性。面對多變的業(yè)務(wù)需求和日新月異的服務(wù)模式,它難以快速掉頭,快速跟進。一方面,用戶之間被License彼此隔絕,很多共性的東西無法共同積累和共享;另一方面,由于平臺的封閉性,解決平臺相關(guān)的缺陷和問題的響應(yīng)速度因缺乏競爭激勵而顯得緩慢低效。
互動:@趙國棟:就像笨重的word
最后看“貴”,顧名思義,采購成本昂貴、維護成本昂貴、平臺遷移成本更加昂貴。這還不算,當(dāng)解決方案從License模式向云模式演進時,還會遇到既得利益者的頑固抵制。這些昂貴的成本,當(dāng)然最后都要落在用戶身上。但是在過去,用戶在安全運行的巨大壓力下,只能在“這種”貴族化和“那種”貴族化中間選擇,只能用貴族化的解決方案來彰顯程序正義。
互動:@顏陽:Ios 榜樣,windows另一榜樣
一個單個的用戶單位,要想做出去貴族化的技術(shù)決策,所面臨的政治壓力可想而知。