我們再來看看地球能源的4V屬性:
圖注:大數(shù)據(jù)的4V屬性:Volume、Variety 、Velocity和Value。
1、Volume——儲量:現(xiàn)在已經探明的,或新探明的煤、天然氣、石油、風、太陽能等能源的儲量是相當驚人的,但遍布于多種地形、地貌中,就看人類有沒有本事都能獲取到了。
2、Variety——類別:隨著人類技術水平的進步,所獲得的能源種類也就越來越多,并且越來越多以前認為不行的資源,后來也慢慢成為了能源,放射性元素就是典型的例子,而若技術成熟,海水將成為人類用之不竭的新能源。曾經有一篇科幻論文說得好“也許未來只需要一把泥土,就能把火箭送上月球”。另一方面,不同能源所需要的開采技術與工具也各不相同,這就好比結構化數(shù)據(jù)與非結構化數(shù)據(jù)的處理手段的差別。因此,人類面對的能源類別越來越多,它也需要人類具備越來越多種類的能源開采能力。
3、Velocity——開采/轉換效率:很難想像一口一天只產一加侖的油井有什么價值,如果一個太陽能的光電轉換效率不到1%,還有使用它的必要嗎?因此,人類在能源上的開采/轉換的效率將決定這種能源的可利用性,就如果做數(shù)據(jù)分析,今天的銷售數(shù)據(jù)分析,一個月后才能出來,那不分析也罷了。
4、Value——價值:能源的價值取決于它所能提供的能量與貢獻,誰都知道95號汽油比92號汽油好,但也更貴;煤很便宜,但能提供的能量也相對較低;電能,在目前仍要通過其他能源轉換得來,這都是價值之所在。它決定于自身的屬性,與相應的數(shù)據(jù)挖掘與提煉的能力,前者相當于汽油與煤的不同,后者相當于煉油廠在95與92號之間的提煉工藝不同。它們都最終決定了數(shù)據(jù)的價值——并且像某些大數(shù)據(jù)宣傳中所鼓吹的那樣,好像任何數(shù)據(jù)用大數(shù)據(jù)分析后,就能黃土變黃金一樣,這是不可能的,除非你自己對某類數(shù)據(jù)的認知就有偏差(原本就是土,和原本就是金子,有著本質不同)
IBM所提倡的Veracity,我認為可以理解為能源的提煉水平,就算是95號汽油,中國產的能和歐美產的相提并論嗎?這就是所謂的真95與假95號的區(qū)別。另一個典型的例子就是濃縮鈾,豐度為3%的鈾235的低濃縮鈾可用于核發(fā)電,而豐度高于90%的鈾235則可以用來制造核武器,兩者的價值肯定不一樣?所以,這種提煉質量與能力上的區(qū)別也最終會體現(xiàn)在能源的價值上。因此,IBM強調數(shù)據(jù)分析的準確與真實,可以與能源提煉過程中的純度相對應,體現(xiàn)了對數(shù)據(jù)分析的一種質的要求。
圖注:IBM把大數(shù)據(jù)第4個V定義為Veracity。
說完理念的對比,再看縱向技術架構上的相似之處,大家可以想想大數(shù)據(jù)中所談到的數(shù)據(jù)采集、匯總、保存、管理、分析、呈現(xiàn)是不是與能源的勘探、開采、匯聚、保管、提煉、使用有著一一對應的關系呢?
特別需要指出的是,現(xiàn)在物聯(lián)網的一大分支——工業(yè)互聯(lián)網越來越熱,而大數(shù)據(jù)就是其最后的重要支撐(前不久通用電氣還專門為此投資了Pivotal),其理念在于將各種傳感器、致動器也納入整體的信息采集體系,借助工業(yè)設備管控平臺,分析出存在于工業(yè)設備內有價值的信息,以便于管理、精度調校以及健康預警。想想看,這是不是像地質勘探中,將不同炸點的傳感信息匯總起來,再通過震蕩波分析軟件,來呈現(xiàn)出地下的礦產分布與結構視圖?
大數(shù)據(jù)到底是什么?
話說至此,我們應該可以總結一下了——在某種角度上講,大數(shù)據(jù)其實就是人類能源開拓歷史在IT領域的一種再現(xiàn)與映射。
無論從理念還是實現(xiàn)手法上,大數(shù)據(jù)的種種說辭,都可以在人類悠久的能源勘探、開采、利用的經驗中到對應的關系,因此,從根本上講它并不新鮮。
但關鍵就在于,在IT領域,對于“數(shù)據(jù)能源”的認知水平,遠不如人類對其他類別能源的認知,所以當我們有一天終于完善了相關理念基礎,開發(fā)出相應的工具,看到了數(shù)據(jù)內部的能源之后,可能就一種當初發(fā)現(xiàn)石油一樣的沖動,進而將其夸大、神話。但是,仔細想想,對于已經經歷過太多這類驚喜的人類來說(火、電、煤、油、氣、核能、太陽能,哪個不給我們一個驚喜?),應該不必如此大驚小怪。