5.不完美的大數(shù)據(jù)是無用的。
這個錯誤讓人瘋狂的,因為完美的尺度基本上是不可能的。例如,IT部門試圖實現(xiàn)讓10億個具有520個數(shù)據(jù)點的產(chǎn)品保持一個讓人夢寐以求的“五個九”的完美標準(99.999%)。那么在此數(shù)據(jù)集中,仍然會有5200萬個不正確的數(shù)據(jù)點。
大數(shù)據(jù)很少達到這種完美的原因很多。許多大的數(shù)據(jù)來源是遠遠不夠完善。亞馬遜公司作為抓取大數(shù)據(jù)來源之一的網(wǎng)站,很可能在產(chǎn)品名稱產(chǎn)生拼寫錯誤。大數(shù)據(jù)也需要建立和組織其機器學習和算法;在產(chǎn)品數(shù)據(jù)的世界里,這些可以很容易地根據(jù)標題或名稱錯誤將產(chǎn)品進行分類。
缺陷并不表明無用,但。一個有能力的數(shù)據(jù)分析師可以去除異常,并從大數(shù)據(jù)中拔出重要的見解,即使有很多缺陷。開發(fā)人員可以添加過濾器,減少進入你的系統(tǒng)的錯誤,,并制定龐大的數(shù)據(jù)集,這將提高數(shù)據(jù)質(zhì)量隨著時間的推移訓練算法。其中大數(shù)據(jù)的一個最大好處是,可以彌補偶爾缺陷,讓你獲得更好的見解。
6.只有大公司需要大數(shù)據(jù)。
小型營銷企業(yè)需要網(wǎng)站的流量和關鍵字搜索的數(shù)字。小型購物公司需要盡可能多地鏈接聯(lián)盟計劃的大型零售商的產(chǎn)品,按需交付服務,并需要可靠的位置數(shù)據(jù)。這只是那些需要大數(shù)據(jù)的小型公司的一小部分。
大型公司可能會產(chǎn)生更多的自己的大數(shù)據(jù),但幾乎每家公司都在現(xiàn)代經(jīng)濟使用上構建了大數(shù)據(jù)或應用程序。這意味著所有的企業(yè)可以獲得訪問見解和信息,并獲得這些龐大的數(shù)據(jù)集提供的好處,而無需建立和管理創(chuàng)建和分析大數(shù)據(jù)所需的基礎設施。
如今,無論企業(yè)規(guī)模如何,都不可回避地采用大數(shù)據(jù)業(yè)務。希望了解這些,可以消除誤解和錯覺。畢竟,我們生活在大數(shù)據(jù)世界中。如果管理人員更好地理解復雜性,陷阱和大數(shù)據(jù)的能力,他們會更好地運行業(yè)務,做出更好的決策。