隨著大數(shù)據(jù)發(fā)展進入2013年,已經(jīng)沒有什么技術能比NoSQL數(shù)據(jù)庫和Hadoop更活躍了,它們都有著更大的提升空間。根據(jù)MarketAnalysis.com 2012年的一份報告看,單單是Hadoop MapReduce市場,預計復合年增長率將達到58%,在2018年將達到22億美元的規(guī)模。
不過,NoSQL和Hadoop的出現(xiàn)主要是為應對非結構化數(shù)據(jù),比如文本數(shù)據(jù)或者web日志。就像Apache Hadoop一樣,這些技術通常是從開源發(fā)起,然后逐漸成為新的商業(yè)產(chǎn)品。Judith Hurwitz是Hurwitz and Associates公司的總裁兼CEO,她認為大數(shù)據(jù)架構和大規(guī)模并行處理大大改變了數(shù)據(jù)應用現(xiàn)狀。她說:“在此之前,即便數(shù)據(jù)真的對公司很重要,人們也并不是真正有能力獲取海量數(shù)據(jù)并實時分析。而現(xiàn)在,原來無法實現(xiàn)的目標已經(jīng)觸手可及。”
SQL陣營的逆襲從2012年開始,關于主流關系型數(shù)據(jù)庫將走向沒落的評論就此起彼伏。觀察者認為,同上文提到的技術相比,SQL 關系數(shù)據(jù)庫未來幾年在應對大數(shù)據(jù)時將失去以往的競爭力。
這一趨勢背后的推動力是企業(yè)希望以更快的速度獲取更多非結構化數(shù)據(jù),這樣才能更加依靠數(shù)據(jù)驅(qū)動做決策。習以為常的數(shù)據(jù)處理方式正在經(jīng)歷變革,以便更好地融入新的技術。對于那些傳統(tǒng)的關系型數(shù)據(jù)庫廠商,過去一年中擁抱大數(shù)據(jù)以及Hadoop的例子也有很多:
IBM不斷收購一些高級數(shù)據(jù)分析公司,以擴充大數(shù)據(jù)產(chǎn)品線。藍色巨人的努力方向從小的改進(比如,針對DB2 10的NoSQL圖形存儲和InfoSphere Warehouse 10)到顛覆性的PureData一體機,都是為了幫助客戶搞定大數(shù)據(jù)。甲骨文在2012年初推出了大數(shù)據(jù)機(Big Data Appliance),又在近期發(fā)布了Oracle NoSQL數(shù)據(jù)庫2.0版本,該產(chǎn)品已經(jīng)自動實現(xiàn)重新平衡,新的應用編程接口可以處理大對象并與Oracle數(shù)據(jù)庫有更緊密的集成,還可以支持直接用SQL查詢Oracle NoSQL數(shù)據(jù)庫記錄。
微軟展示了Hadoop對Windows Azure和Windows Server支持的預覽;Teradata公司發(fā)布了其Aster大數(shù)據(jù)分析產(chǎn)品;而Informatica公司發(fā)布了PowerCenter套件的大數(shù)據(jù)版,據(jù)說消除了Hadoop手工編碼的需求,它把編程任務帶入了Informatica開發(fā)環(huán)境。大數(shù)據(jù)永遠不會存在誰取代誰的問題,SQL雖然在過去一年中遭受了沖擊,但是它并不會走向衰落。正相反,一些NoSQL和Hadoop方面比較專業(yè)的公司也在SQL方面做了許多努力。一個典型的例子是Hadoop初創(chuàng)公司Cloudera,通過Impala來提升Hadoop與SQL的協(xié)作程度。Impala是一款Hadoop軟件產(chǎn)品,支持標準SQL做交互式查詢。
大數(shù)據(jù)變革大數(shù)據(jù)變革也帶動了數(shù)據(jù)庫技術的前進,現(xiàn)在我們看到SQL與NoSQL從對立更多地走向了融合。事實上,在大數(shù)據(jù)早期的討論中,傳統(tǒng)關系型數(shù)據(jù)庫技術是被忽視的。
流媒體數(shù)據(jù)庫廠商SQLstream的副總裁Ronnie Beggs表示:“在過去的幾年里,由于大數(shù)據(jù)的崛起,SQL作為主流技術遭受了一定的沖擊。大數(shù)據(jù)更多地和NoSQL聯(lián)系在了一起。”他人為在2013年,我們應該會看到明顯的變化。在最近幾年已經(jīng)有很多努力在使NoSQL數(shù)據(jù)庫更好地適應SQL數(shù)據(jù)庫的風格。
Beggs說:“大數(shù)據(jù)是不斷變化的,我們接下來這一年會看到的是SQL歸來,它將作為所有大數(shù)據(jù)平臺的接口。”Hadoop、NoSQL和SQL共存的方式,標志著大數(shù)據(jù)在成熟度方面邁進了新的一步。隨著2013年開啟,大數(shù)據(jù)有可能從一個熱門話題逐漸轉(zhuǎn)向落地實踐。
Ashland BI研究機構的總裁和創(chuàng)始人Colin White表示:“我認為人們正努力通過大數(shù)據(jù)的炒作,來真正理解其商業(yè)價值。在2013年,我認為我們將看到人們從大數(shù)據(jù)獲得商業(yè)價值的更好的例子。這不是關于大數(shù)據(jù)的問題,而是你用大數(shù)據(jù)做什么的問題。”雖然對新技術有廣泛的興趣,但不同公司對于接受全面大數(shù)據(jù)系統(tǒng)的速度也會有所不同。
一位系統(tǒng)集成商在金融行業(yè)的活動上向TechTarget記者表示,銀行作為一個領域,只有部分涉足了基本的大數(shù)據(jù),而不是全部。銀行和其它領域只看到了大數(shù)據(jù)的數(shù)量,而沒有留意到它的非結構性。至少目前還是這樣。他說:“大數(shù)據(jù)的含義有兩部分。第一部分是它們的量很大,第二部分是數(shù)據(jù)是非結構化的。銀行明顯屬于第一部分。但是我們不會去收集tweets這樣的社交數(shù)據(jù),至少目前還沒有。我們還在觀望,看金融數(shù)據(jù)服務市場的其他用戶如何處理它。”