必須承認,我們處于一個不確定的世界里,有許多事件是無法預測的。過分依賴大數(shù)據(jù)和預測模型是危險的,因為有許多決定性的影響因素都不能納入模型參數(shù)的覆蓋范圍之內(nèi)。從天氣預報、地震預測、足球比賽到金融危機等等,都對這一點做了很好的詮釋。
8、誤導性:數(shù)據(jù)也會說謊
與大數(shù)據(jù)的代表性、真實性、完整性、解釋性等局限性相關的,對統(tǒng)計現(xiàn)象只看結(jié)果不重解釋,很可能導致錯誤甚至危險的結(jié)論。二戰(zhàn)時期英國與德國的空戰(zhàn)中,工程師發(fā)現(xiàn),每次戰(zhàn)斗機回來機翼上都帶有很多槍眼,因此認為機翼是最容易受到攻擊的地方,需要進行特別防護??墒窃黾臃雷o之后,飛機的損失率不但沒有降低,反而提高了。問題究竟出在哪呢?原來工程師們被這一統(tǒng)計結(jié)果誤導了,從而采取了錯誤地防護措施。對機翼槍眼的統(tǒng)計只針對成功返航的飛機,而那些不幸的飛機被擊落的原因并沒有被統(tǒng)計和發(fā)現(xiàn)。相反,機翼受損還能飛回來,說明機翼被攻擊并不是飛機被擊落的主要原因。至于為什么增加防護后飛機損失率反而提高了,原因很簡單,因為負荷增加降低了飛機的靈活性和航程。后來,工程師們反其道而行之,在沒有槍眼的部位加強防護,因為這些部位被擊中的飛機都沒有返航,事實證明效果良好。
9、合法性:數(shù)據(jù)安全與隱私保護
大數(shù)據(jù)本身及其采集、使用過程都極有可能會涉及個人隱私、商業(yè)機密、公眾權益和國家信息安全。因此,安全性和合法性問題構成了大數(shù)據(jù)價值發(fā)揮的限制性因素之一。
商業(yè)和技術很重要,但商業(yè)和技術背后的價值觀更重要。
Google曾將"不作惡"作為自己的公司價值觀;百度為了短期商業(yè)利益售賣多個貼吧,公然踐踏公眾隱私,結(jié)果遭千夫所指,萬人唾罵。這些都充分反映了公眾對隱私和信息安全的關注和重視。
白宮曾在2014年發(fā)表書面聲明稱,大數(shù)據(jù)創(chuàng)造的社會價值與經(jīng)濟價值得以遵從該國提倡的“隱私、公正、平等、自主”。中國政府在此方面雖然尚未立法,也從來沒有明確的說法,但民眾的基本權益和訴求理當被審慎考慮。
誠然,安全性、合法性要求限制了大數(shù)據(jù)的使用和商業(yè)價值的充分發(fā)揮,但從社會價值的角度來看,是值得的,也是必須的。
10、價值性:投入與收益的平衡
價值密度低是被公認的大數(shù)據(jù)特征之-,這也在一定程度上限制了大數(shù)據(jù)的研究和應用。
一方面,因為大數(shù)據(jù)的低密度價值特征,那么要使其價值達到可用的程度,就必須有足夠規(guī)模的數(shù)據(jù)積累和有效的價值提取。以常規(guī)的監(jiān)控視頻為例,連續(xù)24小時的視頻監(jiān)控中,有用的數(shù)據(jù)可能僅有數(shù)秒。如何優(yōu)化存儲,并通過強大的機器能力迅速完成數(shù)據(jù)的加工處理和價值呈現(xiàn),到目前為止還是大數(shù)據(jù)面臨的一大難題。另一方面,大數(shù)據(jù)邊際效用遞增規(guī)律的存在,使許多企業(yè)、組織的數(shù)據(jù)無法達到基本的規(guī)模要求,從而也使其數(shù)據(jù)價值無法充分顯現(xiàn)。
同時,前面講到的大數(shù)據(jù)代表性、真實性、完整性、解釋性上的不足及由此引起的結(jié)論誤導,不僅會降低數(shù)據(jù)的價值,甚至可能產(chǎn)生負面作用。
除此之外,大數(shù)據(jù)的采集、存儲、加工和使用所耗費的資金和時間成本都是非常高昂的。作為大數(shù)據(jù)投資主體,應該在投入和收益之間進行合理平衡。當前的確存在那么一種勢力,為了某種目的極力鼓動企業(yè)進行大規(guī)模的大數(shù)據(jù)投資,如果不審慎評估,很可能得不償失。
在此講了這么多大數(shù)據(jù)的局限性,最后再次重申,并非要以此否定大數(shù)據(jù)的價值;同時,也要再次強調(diào),大數(shù)據(jù)代表的只是信息,而非智慧。對世界的改造僅憑有限的信息是遠遠不夠的,更需要人類取之不盡、用之不竭的智慧。只有用好了項上這顆六斤四,才能逐步突破大數(shù)據(jù)的局限性,更好地發(fā)揮大數(shù)據(jù)價值。