類型雜必然促使我們對海量數據進行分析、處理和集成,找出原本看來毫無關系的那些數據的關聯性,把似乎沒有用的數據變成有用的信息,以支持我們做出的判斷,最終形成大數據的價值——獲得洞察力和價值。
大數據的崛起,正是在人工智能、機器學習和數據挖掘等技術的迅速發(fā)展驅動下,呈現這么一個過程:將信號轉化為數據,將數據分析為信息,將信息提煉為知識,以知識促成決策和行動。所以真正好的大數據系統,重要的不是越多越好,其實越少越好,最終變成一個決策,這才是最關鍵的。
大數據開啟了一個新的世界,人們的認知必須主動求變
記者:現在看來,有很多大數據園區(qū)、聯盟的出現和成立,但是大數據熱似乎還缺少明確的產業(yè)支撐。美國政府投了2億美金支持大數據發(fā)展,但這種投入也不是特別大。如您所說,從賺錢機會上來看,大數據還沒到“滿地是沙子、滿地是金子”的時候。對于大數據技術和服務公司而言,中小互聯網公司有現成的機會,而最大的蛋糕——企業(yè)數據和感知數據,目前只是聞到香味而已。
吳甘沙:不能神化大數據是萬靈藥,也不能矮化大數據就是包裝舊概念。大數據是一種新的數據形態(tài)和實踐,它與當前主流的數據應用實踐并存,而非取代。而且,它在相當長的時間內仍然是個新鮮事物,即使IDC在2012年底預測,年復合增長率高達32%,到2016年全球大數據技術和服務市場總額也就是240億美元左右。不切實際、一窩蜂地上大數據項目不應鼓勵。
對一部分人來說,大數據已經是個客觀存在和競爭優(yōu)勢﹔對絕大多數人來說,大數據可以是一種“從現在做起”的世界觀,和未雨綢繆、決戰(zhàn)未來的戰(zhàn)略??梢哉f,大數據開啟了一個新的世界,我們對這個世界的認知必須主動求變。
舊的認識是“數據是稀缺資源”,這種認識直接導致“數據小農”心態(tài)。大數據開始于數據測量,而“數據小農”揀著測、挑著存、采著樣來處理,總是幻想能夠從最少的數據壓榨出最多的信息。
新的認識是,要參與大數據的游戲并且制勝,必須產生大數據。在大數據時代,擁有大數據是一種幸福和特權。因此,每一個個體、企業(yè)和政府需要自覺、客觀、全面地去測量世界,并且把數據存下來。決策者需要具備的大數據觀很簡單:數據不是累贅,數據里有很多價值,數據的存儲和搬運會越來越便宜。
因此,大數據也是一種戰(zhàn)略、世界觀和習慣。即使今天沒有大體量的數據,還是可以盡可能自覺、客觀、全面地測量世界,為未來的大數據實踐做準備。對于一個企業(yè)或系統來說,挑戰(zhàn)在數據采集,而非存儲。微信在設計之初就把數據監(jiān)控精細化,并納入基礎框架,這是意識和實力的體現。
VIA:人民日報
更多詳細信息,請您微信關注“計算網”公眾號: