在Oracle、IBM以及微軟等大型廠商的包圍圈中,國產(chǎn)數(shù)據(jù)庫廠商還在艱難“求生”。這是一個不可否認(rèn)的事實(shí),數(shù)據(jù)庫市場已經(jīng)接近飽和,特別是在面對交易的關(guān)系型數(shù)據(jù)庫領(lǐng)域,外國廠商起步早、資源豐富,并且還在不斷蠶食細(xì)分市場,已形成巨大優(yōu)勢。面對這一現(xiàn)狀,南大通用CTO武新博士認(rèn)為,國產(chǎn)數(shù)據(jù)庫廠商已經(jīng)錯過最佳時機(jī),不應(yīng)該再拿自己的短板(OLTP)去硬碰硬,而應(yīng)該在OLAP方向發(fā)力。同時伴隨大數(shù)據(jù)時代的到來,NoSQL以及NewSQL有了更多的發(fā)展空間,基于列式存儲的分布式數(shù)據(jù)庫架構(gòu)也越來越受到客戶的認(rèn)可。
在剛剛結(jié)束的數(shù)據(jù)庫大會(DTCC)上,國產(chǎn)數(shù)據(jù)庫GBASE受到了廣泛的關(guān)注。TechTarget中國記者也對武新博士進(jìn)行了專訪,針對國產(chǎn)數(shù)據(jù)庫、NewSQL以及大數(shù)據(jù)等話題進(jìn)行了深入討論。以下是本次采訪實(shí)錄:
TechTarget:我注意到南大通用的主打數(shù)據(jù)庫GBASE 8a是一個分析型數(shù)據(jù)庫,主要面對的是OLAP負(fù)載,這是出于怎樣的考慮?
武新:像Oracle這樣的廠商做數(shù)據(jù)庫已經(jīng)有三十多年了,想要追趕甚至超越他們就需要在底層實(shí)現(xiàn)上考慮一些全新的技術(shù)線路。目前主流的數(shù)據(jù)庫廠商在OLTP方面處理的比較好,而在OLAP的整體性能上表現(xiàn)卻很一般。GBASE 8a主要面向數(shù)據(jù)分析(OLAP)負(fù)載,也是看準(zhǔn)了主流廠商比較弱的一塊,用自己的長處與別人的短板來競爭。
TechTarget:GABSE也使用了列式存儲這樣的架構(gòu),它與列式數(shù)據(jù)庫Sybase IQ有何區(qū)別?優(yōu)勢在哪里?
武新:GBASE 8a中使用了列式存儲和大規(guī)模并行處理(MPP)的架構(gòu)。雖然Sybase IQ最先提出了列式數(shù)據(jù)庫的概念,但GBASE與它最大的區(qū)別在于支持橫向擴(kuò)展(Scale Out),是Share nothing的架構(gòu)。Sybase IQ還是一個共享存儲的小型機(jī)架構(gòu),在橫向擴(kuò)展方面不如GBASE,不適合大規(guī)模的并行計(jì)算。因此在架構(gòu)方面,需要有列式存儲和MPP的 雙重支持。
TechTarget:從您的介紹來看,GBASE 8a的架構(gòu)應(yīng)該與Greenplum更相似,這兩款產(chǎn)品之間有何不同?
武新:GBASE 8a與Greenplum基本上屬于同一類的產(chǎn)品,我把它們稱為NewSQL數(shù)據(jù)庫。用戶應(yīng)該對Greenplum非常熟悉,也做過非常多的測試和對比。同Greenplum相比,雖然都是基于MPP的架構(gòu),但GBASE 8a進(jìn)行了扁平化的設(shè)計(jì),也就是說沒有設(shè)定一個物理Master。這樣的優(yōu)勢體現(xiàn)在兩個方面,Master的高可用性和并發(fā)性。
除了架構(gòu)設(shè)計(jì)之外,我認(rèn)為GBASE最大的優(yōu)勢還在于,作為本土企業(yè),對國內(nèi)用戶的支撐方面會做的更好、更靈活,包括發(fā)現(xiàn)問題與解決問題的速度會比國外廠商要更快。同時在性價比方面,也會比國外廠商更好,畢竟成本也是客戶考慮的主要問題。
TechTarget:您剛才提到了NewSQL的概念,應(yīng)該如何去定義它?NewSQL與我們經(jīng)常說的NoSQL之間有什么區(qū)別?
武新:業(yè)界對NewSQL也有不同的定義。在我看來,NoSQL比較容易解釋,它放棄了關(guān)系模型,主要以Key-Value方式來處理數(shù)據(jù)。在應(yīng)用層面,NoSQL主要以編程的方式而不是我們常用的SQL來處理數(shù)據(jù)。而NewSQL是一個相對的概念,它主要對比了OldSQL,也就是傳統(tǒng)關(guān)系型數(shù)據(jù)庫,包括Oracle、DB2、PostgreSQL等。這些OldSQL的產(chǎn)品基因還是屬于三十年前的,主要以行存儲為主,面向事務(wù)處理。
NewSQL與OldSQL和NoSQL組成了目前數(shù)據(jù)庫產(chǎn)品的三大陣營,它是在過去十年中出現(xiàn)的,雖然使用了關(guān)系模型,但在架構(gòu)方面以及數(shù)據(jù)庫實(shí)現(xiàn)方面與傳統(tǒng)關(guān)系型數(shù)據(jù)庫還是存在很大的區(qū)別。NewSQL主要以列式存儲為主,大規(guī)模使用了基于MPP架構(gòu)的并行計(jì)算來滿足大數(shù)據(jù)量處理需求,屬于Share nothing架構(gòu)。同時NewSQL的產(chǎn)品主要是面向了大數(shù)據(jù)分析與挖掘的應(yīng)用。
TechTarget:除了GBASE之外,在國內(nèi)外比較成熟的NewSQL產(chǎn)品都有哪些?國內(nèi)客戶對于NewSQL的接受度和應(yīng)用情況是怎樣的?
武新:目前NewSQL數(shù)據(jù)庫產(chǎn)品其實(shí)有挺多,市場中比較成熟的NewSQL產(chǎn)品主要有EMC收購的Greenplum,惠普收購的Vertica,Teradata收購的AsterData。而SAP推出的HANA我認(rèn)為也可以算作是NewSQL陣營的一員,它主要涉及到內(nèi)存計(jì)算,同時HANA也采用了列存儲的架構(gòu)。
從我接觸到的客戶來看,大家已經(jīng)開始逐漸接受了NewSQL的技術(shù),并且認(rèn)可它所帶來的一些優(yōu)勢與價值。大數(shù)據(jù)以及云計(jì)算對傳統(tǒng)數(shù)據(jù)庫的沖擊非常大,包括電信、金融行業(yè)在內(nèi)的一些大客戶,他們數(shù)據(jù)量的增長速度是非常快的??蛻舨坏貌蝗ッ鎸σ恍┬碌募夹g(shù)架構(gòu)來應(yīng)對這些問題,因此他們還是非常愿意去積極地進(jìn)行一些嘗試。而嘗試過的客戶都發(fā)現(xiàn)新的架構(gòu)能夠帶來的優(yōu)勢是非常明顯的,而且基本不會再走回頭路。