導(dǎo)讀:全局?jǐn)?shù)據(jù)解讀圍繞機(jī)器、未來(lái)、宇宙碰撞出許多很多遐想,但全局?jǐn)?shù)據(jù)并不是離我們很遠(yuǎn)的概念,它與我們客觀世界的生活生產(chǎn),息息相關(guān)。不僅僅因?yàn)閿?shù)據(jù)是客觀世界的映射,更因?yàn)樗呀?jīng)成為一種重要的生產(chǎn)力推動(dòng)社會(huì)變革。然而在這個(gè)以數(shù)據(jù)為核心破局點(diǎn)的當(dāng)下,僅僅討論BIG DATA,是遠(yuǎn)遠(yuǎn)不夠的。
有時(shí)候我們常常感嘆是否真的存在平行時(shí)空,是否有另一個(gè)自己真實(shí)的發(fā)生某些行為。事實(shí)上因?yàn)橐苿?dòng)互聯(lián)、云存儲(chǔ)、大數(shù)據(jù)等新興技術(shù)的出現(xiàn),的確映射出一個(gè)現(xiàn)實(shí)世界的縮影,它就是數(shù)據(jù)世界。
如果把我們真實(shí)可感知的世界稱為客觀世界,那么理論上來(lái)說(shuō),大量數(shù)據(jù)的集成可以映射出客觀世界的部分,形成數(shù)據(jù)映像。映像是不同體系根據(jù)不同需求對(duì)客觀世界的數(shù)據(jù)化抽取和沉積,這種抽取和沉積中本身已包含了一種邏輯(映射本身即算法),而映像這個(gè)集合,其實(shí)是由多個(gè)帶有某個(gè)相同要素的場(chǎng)景所組成。
例如,當(dāng)你開(kāi)車使用高德地圖時(shí),構(gòu)成了導(dǎo)航的場(chǎng)景;吃個(gè)飯搜個(gè)大眾點(diǎn)評(píng),構(gòu)成了美食的場(chǎng)景;玩累了查查附近的酒店,構(gòu)成了住宿的場(chǎng)景;躺在床上曬曬照片聊聊天,構(gòu)成了社交的場(chǎng)景……這些場(chǎng)景的共同點(diǎn)是“你”是所有事件的施動(dòng)者,成為串起所有場(chǎng)景的關(guān)鍵要素。而這些場(chǎng)景組合在一起,經(jīng)過(guò)數(shù)據(jù)化的抽取和沉積,成為“你”某個(gè)時(shí)段休閑行為軌跡的數(shù)據(jù)映像。
不同的映像組合構(gòu)成體系,而不同體系組合交疊成為客觀世界在數(shù)據(jù)世界的縮影。(畢竟不是所有客觀世界的生活痕跡,都可以被記錄以便基于某種邏輯的抽取和沉積,所以數(shù)據(jù)映像只能是客觀世界的部分投影,而非全部。)
數(shù)據(jù)世界與客觀世界的邏輯關(guān)系
數(shù)據(jù)世界的關(guān)鍵在于“數(shù)據(jù)”。伴隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)、云存儲(chǔ)、虛擬現(xiàn)實(shí)等新技術(shù)的出現(xiàn),導(dǎo)致人類可被記錄和收集的數(shù)據(jù)體量爆炸性增長(zhǎng),我們也迎來(lái)“大數(shù)據(jù)時(shí)代”,大數(shù)據(jù)的出現(xiàn)開(kāi)啟了用數(shù)據(jù)探索世界規(guī)律的新紀(jì)元,然而大數(shù)據(jù)本身也存在諸多問(wèn)題。
問(wèn)題一:分散的數(shù)據(jù)孤島,無(wú)法建立連接,導(dǎo)致數(shù)據(jù)無(wú)法流動(dòng)印證
大數(shù)據(jù)最核心的問(wèn)題之一,在于數(shù)據(jù)成分散式的孤島狀,只是在體系內(nèi)開(kāi)放,卻不能在體系外流通印證。最典型的的商業(yè)場(chǎng)景是,在BAT自有體系內(nèi),他們的數(shù)據(jù)量都是非常巨大的。但是,他們只能沉積和應(yīng)用自己產(chǎn)品體系內(nèi)的各種數(shù)據(jù),不能相互關(guān)聯(lián)與開(kāi)放。
分散的數(shù)據(jù)孤島,體系與體系間、映像與映像間、場(chǎng)景與場(chǎng)景間都沒(méi)有連接
造成數(shù)據(jù)孤島的原因來(lái)自于方方面面,法律的約束,商業(yè)的壁壘,競(jìng)爭(zhēng)的策略……而最基礎(chǔ)的還是技術(shù)的不完善。
在過(guò)去,企業(yè)建立一個(gè)新項(xiàng)目,從硬件到軟件再搭建網(wǎng)絡(luò),有一套自用的資源系統(tǒng);等到企業(yè)發(fā)展了一個(gè)階段,又需要新建一個(gè)項(xiàng)目,必須從頭到尾再走一遍。因?yàn)榧夹g(shù)有限,企業(yè)項(xiàng)目與項(xiàng)目之間的資源系統(tǒng)是煙囪式的系統(tǒng),自顧自的豎著“冒煙”。企業(yè)內(nèi)部況且如此,想讓一個(gè)集團(tuán),甚至不同企業(yè)/集團(tuán)之間的數(shù)據(jù)開(kāi)放,從而更好地為產(chǎn)品服務(wù),真正做到以人為本的用戶體驗(yàn),無(wú)異于空中樓閣,天方夜譚。
然而技術(shù)在發(fā)展,從最底部的硬件設(shè)施,到最上層的云端存儲(chǔ),企業(yè)已經(jīng)有了讓自己脫胎換骨的數(shù)據(jù)挖掘、收集、記錄、開(kāi)放形式,打破體系間的數(shù)據(jù)開(kāi)放并非不可能。
問(wèn)題二,體系與體系間存在連接,但連接過(guò)于粗放或過(guò)于細(xì)微
上文我們說(shuō)到場(chǎng)景組成映像,映像是體系的子集,體系又構(gòu)成數(shù)據(jù)世界,故而可以把“場(chǎng)景”當(dāng)成數(shù)據(jù)世界所記錄的客觀世界最常用的單位(不是最小,但卻最常使用)。 那么我們?cè)撊绾味x場(chǎng)景? 一般來(lái)說(shuō),場(chǎng)景包括四部分:時(shí)間、空間、語(yǔ)義、語(yǔ)境(情緒、社群……),四要素隨機(jī)組合構(gòu)成不同的場(chǎng)景,因而不同場(chǎng)景之間,可能涵蓋部分相同的要素,也可能每個(gè)要素都不相同。
于此,我們可以直接指出大數(shù)據(jù)的第二個(gè)問(wèn)題——即便體系間存在連接,這種連接將會(huì)是過(guò)于粗放或細(xì)微的連接,具有模糊性和不確定性。不夠精準(zhǔn),成為大數(shù)據(jù)難以得到應(yīng)用的第二個(gè)問(wèn)題。
過(guò)于粗放:體系與體系之間的連接更多存在于體系間和映像間。但體系由多個(gè)映像構(gòu)成,映像又由不同的場(chǎng)景組成,不同場(chǎng)景又由四要素隨機(jī)組合,僅僅連接體系或映像僅會(huì)導(dǎo)致模糊結(jié)果,無(wú)法得出精準(zhǔn)結(jié)論。