讓業(yè)務(wù)搭乘大數(shù)據(jù)技術(shù)確實(shí)是件非常有吸引力的事情,而Apache Hadoop讓這個(gè)誘惑來的更加的猛烈。Hadoop是個(gè)大規(guī)??蓴U(kuò)展數(shù)據(jù)存儲(chǔ)平臺(tái),構(gòu)成了大多數(shù)大數(shù)據(jù)項(xiàng)目基礎(chǔ)。Hadoop是強(qiáng)大的,然而卻需要公司投入大量的學(xué)習(xí)精力及其它的資源。
如果得到正確的應(yīng)用,Hadoop確實(shí)能從根本上提升你公司的業(yè)務(wù),然而這條Hadoop的應(yīng)用之路卻充滿了荊棘。另一個(gè)方面,許多企業(yè)(當(dāng)然不是Google、Facebook或者Twitter)的數(shù)據(jù)體積并沒有大到需要巨型Hadoop集群去做分析,他們純粹是被“大數(shù)據(jù)”這個(gè)熱門的詞語(yǔ)給吸引的。
就像Dabid Wheeler所說“計(jì)算機(jī)科學(xué)的所有問題都有另一個(gè)層次間接的解決方案”,而Hadoop正是類似間接解決方案;當(dāng)你的上司被一些流行詞匯所吸引時(shí),做正確的軟件架構(gòu)決策將變的非常艱難。
下文將給出一些對(duì)Hadoop進(jìn)行投資前需要嘗試的替代方案:
了解你的數(shù)據(jù)
數(shù)據(jù)的總體積
Hadoop是為大型數(shù)據(jù)集所建立的有效解決方案。