當(dāng)下Hadoop已經(jīng)成長為一個(gè)龐大的體系,貌似只要和海量數(shù)據(jù)相關(guān)的,沒有哪個(gè)領(lǐng)域缺少Hadoop的身影,下面是一個(gè)Hadoop生態(tài)系統(tǒng)的圖譜,詳細(xì)的列舉了在Hadoop這個(gè)生態(tài)系統(tǒng)中出現(xiàn)的各種數(shù)據(jù)工具。
- 這一切,都起源自Web數(shù)據(jù)爆炸時(shí)代的來臨
- 數(shù)據(jù)抓取系統(tǒng) - Nutch
- 海量數(shù)據(jù)怎么存,當(dāng)然是用分布式文件系統(tǒng) - HDFS
- 數(shù)據(jù)怎么用呢,分析,處理
- MapReduce框架,讓你編寫代碼來實(shí)現(xiàn)對大數(shù)據(jù)的分析工作
- 非結(jié)構(gòu)化數(shù)據(jù)(日志)收集處理 - fuse,webdav, chukwa, flume, Scribe
- 數(shù)據(jù)導(dǎo)入到HDFS中,至此RDBSM也可以加入HDFS的狂歡了 - Hiho, sqoop
- MapReduce太麻煩,好吧,讓你用熟悉的方式來操作Hadoop里的數(shù)據(jù) – Pig, Hive, Jaql
- 讓你的數(shù)據(jù)可見 - drilldown, Intellicus
- 用高級語言管理你的任務(wù)流 – oozie, Cascading
- Hadoop當(dāng)然也有自己的監(jiān)控管理工具 – Hue, karmasphere, eclipse plugin, cacti, ganglia
- 數(shù)據(jù)序列化處理與任務(wù)調(diào)度 – Avro, Zookeeper
- 更多構(gòu)建在Hadoop上層的服務(wù) – Mahout, Elastic map Reduce
- OLTP存儲系統(tǒng) – Hbase