1、存在的背景
基礎(chǔ)設(shè)施的巨大飛躍,數(shù)據(jù)儲存技術(shù)、網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,為大數(shù)據(jù)時代的到來準備了物質(zhì)基礎(chǔ)。
物聯(lián)網(wǎng)本質(zhì)上就是更多采集數(shù)據(jù)的入口和節(jié)點;云計算培養(yǎng)了服務(wù)的商業(yè)模式和集中建設(shè)降低單位計算和存儲成本。到了移動互聯(lián)網(wǎng)就更有意思了:第一個特點是身份,在合適的時間,合適的地點,將合適的信息送給合適的人,你要知道你的對方是誰,他有什么喜好,他現(xiàn)在是什么狀態(tài),沒有這個精準身份的信息,一切都無從談起。第二個就是連接,雙向適時的互動連接,有了網(wǎng)絡(luò)以后,你想要什么信息,就從電腦上去索取。手機我們一半除了拿信息以外,我們另外一半推信息,但是這個帶來的變化也就是信息流動能夠更加適時了。第三個是手機主要的特性,信息是有位置屬性的。最后是感應(yīng),我們電腦上已經(jīng)不會再有太多的感應(yīng)器了,手機上的感應(yīng)器角度會越來越多,可穿戴的產(chǎn)品,未來我們的手機可以聞到味道,可以感受到甲醛超標,可以感受到電磁輻射。這三樣結(jié)合在一起本質(zhì)上就是產(chǎn)生、處理和應(yīng)用了大數(shù)據(jù),通過各種各樣新的技術(shù)和來幫助我們解決各種各樣的問題,重新構(gòu)建信息流,資金流、物流。
2 、數(shù)據(jù)究竟有多大
大數(shù)據(jù)帶動方法論上的變化本質(zhì)上是人的行為越來越被虛擬化,以前歷史上誰都不知道你在互聯(lián)網(wǎng)上是人還是狗,現(xiàn)在處處行跡處處痕,語言分析、自然語義處理、圖像處理、信號處理、關(guān)系預(yù)測來精準預(yù)計,導(dǎo)致全球數(shù)據(jù)量每兩年翻一翻。隨著Iphone和各種安卓普及,每個人在云端都有幾個G幾個T的網(wǎng)盤,存著各種各樣的信息,大到一定程度,根本沒法處理,我們叫做狹義的大數(shù)據(jù)。有很多的新的計算機的處理方式,存儲方式,和數(shù)學(xué)建模的方式去分析這些數(shù)據(jù),那數(shù)據(jù)根據(jù)訪問頻次又分冷數(shù)據(jù)和熱數(shù)據(jù)。當年由于熱數(shù)據(jù)所帶來的信息量意義更大,關(guān)注度集中在此,數(shù)學(xué)上的方法也是基于統(tǒng)計抽樣。奇妙的關(guān)聯(lián)度:但隨著計算和存儲成本的降低,發(fā)現(xiàn)可以處理全量數(shù)據(jù),全量數(shù)據(jù)堆積在一起發(fā)生了非常多奇妙的現(xiàn)象。有些對當前的科學(xué)都有重大影響,當年基于統(tǒng)計、抽樣建立起來的模型極有可能是錯的,比如開普敦定律和冥王星的失誤。這個可以參考我和國棟共著的大數(shù)據(jù)時代的歷史機遇一書。所以在狹義的定義下會出現(xiàn)IBM和IDC定義的4個V,數(shù)據(jù)規(guī)模(Volume)、快速(Velocity)、多樣的類型(Variety)據(jù)價值(Value)。
3、為什么大數(shù)據(jù)會如此轟動?我認為是深遠的社會背景,更重要是數(shù)據(jù)思維
首先就是我一直提的數(shù)據(jù)思維,所謂的數(shù)據(jù)思維,要重視數(shù)據(jù)的全面性,而非隨機的抽樣性。其次:就是關(guān)注數(shù)據(jù)的復(fù)雜性,弱化精確性,以前我們就有很多人要求一是一,二是二,現(xiàn)在大數(shù)據(jù)里面我們就不要求那么精了,我們要求一個大的框架,模糊的準確度趨勢的判斷第三大數(shù)據(jù)是一種重新評價企業(yè)、商業(yè)模式的新方法了,數(shù)據(jù)成為核心的資產(chǎn),并將深刻影響企業(yè)的業(yè)務(wù)模式,甚至重構(gòu)其文化和組織。
我定義了從五大維度:活性、顆粒度、維度時空、情緒第一個叫活性,基本上你在互聯(lián)網(wǎng)公司里面,比如你用阿里的服務(wù),可能每天使用3到5次,但是你知道銀行的網(wǎng)點你可能一個月或者更多時間才去一次。第二個稱之為叫顆粒度,就是你在電商的平臺上從你進店到購物、到形成采購、到物流、到運送、到配送、到最后的評價跟分享,所有的環(huán)節(jié)都給你充分的記錄起來,這是很重要的,我稱之為顆粒度,銀行我們現(xiàn)在看到的信息的數(shù)據(jù)或者金融的數(shù)據(jù)就是水電、煤氣加成本,再加上你的工資到賬日期,這個數(shù)據(jù)是非常粗糙的。三個是稱之為維度,像易寶支付,當你使用他的數(shù)據(jù)以后你的數(shù)據(jù)就留在他那里面,這樣有更多的維度進行數(shù)據(jù)相關(guān)的處理和分析。第四遠近。當某個人有貸款需求的時候,我的金融機構(gòu),我的互聯(lián)網(wǎng)公司,很有可能是第一個能知道你有貸款需求的,或者在線的時候知道,我可能第一時間就知道這個客戶,銀行知道這個過程中間還有很多,這是一個,這是遠近。最后一個我們稱之為叫情緒,你在微博上發(fā)的任何一條信息都是帶有情感的,你有情感之后就知道你的狀態(tài),就知道采取任何的營銷是不是有用。
4 、接下來發(fā)生怎樣的事情?——泛互聯(lián)網(wǎng)化
軟件、硬件會免費,成為收集數(shù)據(jù)的入口行業(yè)垂直整合:一開始是軟件做硬件、互聯(lián)網(wǎng)公司做硬件和軟件,接下來就是電商做金融、金融做電商、軟件公司提供增值服務(wù)。為什么?一旦需要無線的靠近客戶之后,就要服務(wù)客戶需求的一切,行業(yè)的邊界在不斷被打破數(shù)據(jù)成為資產(chǎn):數(shù)據(jù)會變得越來越重要,是一切商業(yè)模式起源和重構(gòu)的基礎(chǔ)。