Facebook Apollo:Facebook的Paxos算法,類似于NoSQL數(shù)據(jù)庫;
jumboDB:基于Hadoop的面向文檔的數(shù)據(jù)存儲;
LinkedIn Espresso:可橫向擴展的面向文檔的NoSQL數(shù)據(jù)存儲;
MarkLogic:模式不可知的企業(yè)版NoSQL數(shù)據(jù)庫技術;
MongoDB:面向文檔的數(shù)據(jù)庫系統(tǒng);
RavenDB:一個事務性的,開源文檔數(shù)據(jù)庫;
RethinkDB:支持連接查詢和群組依據(jù)等查詢的文檔型數(shù)據(jù)庫。
Key Map 數(shù)據(jù)模型
注意:業(yè)內存在一些術語混亂,有兩個不同的東西都叫做“列式數(shù)據(jù)庫”。這里列出的有一些是圍繞“key-map”數(shù)據(jù)模型而建的分布式、持續(xù)型數(shù)據(jù)庫,其中所有的數(shù)據(jù)都有(可能綜合了)鍵,并與映射中的鍵-值對相關聯(lián)。在一些系統(tǒng)中,多個這樣的值映射可以與鍵相關聯(lián),并且這些映射被稱為“列族”(具有映射值的鍵被稱為“列”)。
另一組也可稱為“列式數(shù)據(jù)庫”的技術因其存儲數(shù)據(jù)的方式而有別于前一組,它在磁盤上或在存儲器中——而不是以傳統(tǒng)方式,即所有既定鍵的鍵值都相鄰著、逐行存儲。這些系統(tǒng)也彼此相鄰來存儲所有列值,但是要得到給定列的所有值卻不需要以前那么繁復的工作。
前一組在這里被稱為“key map數(shù)據(jù)模型”,這兩者和Key-value 數(shù)據(jù)模型之間的界限是相當模糊的。后者對數(shù)據(jù)模型有更多的存儲格式,可在列式數(shù)據(jù)庫中列出。若想了解更多關于這兩種模型的區(qū)分,可閱讀Daniel Abadi的博客:Distinguishing two major types of Column Stores。
Apache Accumulo:內置在Hadoop上的分布式鍵/值存儲;
Apache Cassandra:由BigTable授權,面向列的分布式數(shù)據(jù)存儲;
Apache HBase:由BigTable授權,面向列的分布式數(shù)據(jù)存儲;
Facebook HydraBase:Facebook所開發(fā)的HBase的衍化品;
Google BigTable:面向列的分布式數(shù)據(jù)存儲;
Google Cloud Datastore:為完全管理型的無模式數(shù)據(jù)庫,用于存儲在BigTable上非關系型數(shù)據(jù);
Hypertable:由BigTable授權,面向列的分布式數(shù)據(jù)存儲;
InfiniDB:通過MySQL的接口訪問,并使用大規(guī)模并行處理進行并行查詢;
Tephra:用于HBase處理;
Twitter Manhattan:Twitter的實時、多租戶分布式數(shù)據(jù)庫。
鍵-值數(shù)據(jù)模型
Aerospike:支持NoSQL的閃存優(yōu)化,數(shù)據(jù)存儲在內存。開源,“’C'(不是Java或Erlang)中的服務器代碼可精確地調整從而避免上下文切換和內存拷貝”。
Amazon DynamoDB:分布式鍵/值存儲,Dynamo論文的實現(xiàn);
Edis:為替代Redis的協(xié)議兼容的服務器;
ElephantDB:專門研究Hadoop中數(shù)據(jù)導出的分布式數(shù)據(jù)庫;
EventStore:分布式時間序列數(shù)據(jù)庫;
GridDB:適用于存儲在時間序列中的傳感器數(shù)據(jù);
LinkedIn Krati:簡單的持久性數(shù)據(jù)存儲,擁有低延遲和高吞吐量;
Linkedin Voldemort:分布式鍵/值存儲系統(tǒng);
Oracle NoSQL Database:Oracle公司開發(fā)的分布式鍵值數(shù)據(jù)庫;
Redis:內存中的鍵值數(shù)據(jù)存儲;
Riak:分散式數(shù)據(jù)存儲;
Storehaus:Twitter開發(fā)的異步鍵值存儲的庫;
Tarantool:一個高效的NoSQL數(shù)據(jù)庫和Lua應用服務器;
TiKV:由Google Spanner和HBase授權,Rust提供技術支持的分布式鍵值數(shù)據(jù)庫;
TreodeDB:可復制、共享的鍵-值存儲,能提供多行原子寫入。
圖形數(shù)據(jù)模型
Apache Giraph:基于Hadoop的Pregel實現(xiàn);
Apache Spark Bagel:可實現(xiàn)Pregel,為Spark的一部分;
ArangoDB:多層模型分布式數(shù)據(jù)庫;
DGraph:一個可擴展的、分布式、低時延、高吞吐量的圖形數(shù)據(jù)庫,旨在為Google生產水平規(guī)模和吞吐量提供足夠的低延遲,用于TB級的結構化數(shù)據(jù)的實時用戶查詢;
Facebook TAO:TAO是facebook廣泛用來存儲和服務于社交圖形的分布式數(shù)據(jù)存儲;
GCHQ Gaffer:GCHQ中的Gaffer是一個易于存儲大規(guī)模圖形的框架,其中節(jié)點和邊緣都有統(tǒng)計數(shù)據(jù);
Google Cayley:開源圖形數(shù)據(jù)庫;
Google Pregel :圖形處理框架;
GraphLab PowerGraph:核心C ++ GraphLab API和建立在GraphLab API之上的高性能機器學習和數(shù)據(jù)挖掘工具包的集合;
GraphX:Spark中的彈性分布式圖形系統(tǒng);
Gremlin:圖形追蹤語言;
Infovore:以RDF為中心的Map / Reduce框架;
Intel GraphBuilder:在Hadoop上構建大規(guī)模圖形的工具;
MapGraph:用于在GPU上大規(guī)模并行圖形處理;
Neo4j:完全用Java寫入的圖形數(shù)據(jù)庫;
OrientDB:文檔和圖形數(shù)據(jù)庫;
Phoebus:大型圖形處理框架;
Titan:建于Cassandra的分布式圖形數(shù)據(jù)庫;