DataDirect Hadoop Apache Hive Driver
Hadoop最令人著迷的特性之一在于將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為足以補充傳統(tǒng)分析工作情報缺失的寶貴資源。這項挑戰(zhàn)的難點在于如何將Hadoop當(dāng)中存儲的數(shù)據(jù)與現(xiàn)有商務(wù)智能及數(shù)據(jù)分析工具相對接。而根據(jù)Progress DataDirect公司數(shù)據(jù)連接部門副總裁Michael Benedict的說法,DataDirect driver for Apache Hive號稱是惟一一款能夠在多套Hadoop發(fā)行版中實現(xiàn)開箱即用的全兼容式驅(qū)動程序。
“如果沒有DataDirect Hive Driver的幫助,我們很難想象該如何訪問并分析數(shù)據(jù)——Hadoop的容量如此龐大,用戶幾乎無法訪問、尤其是快速訪問到自己需要的信息,”Benedict指出。“而DataDirect Hadoop Driver的意義正在于幫助用戶以實時方式從Hive Data Warehouse中訪問信息、進而簡化數(shù)據(jù)分析的難度。”
Adaptec HBA
PMC-Sierra公司剛剛為大數(shù)據(jù)存儲發(fā)布了一款主機總結(jié)適配器(簡稱HBA),這就是Adaptec 71605H總線適配器(或者被稱為Series 7H)。這些PCIe HBA在良好的兼容性前提下帶來了高性能I/O與低延遲表現(xiàn)。它們利用PMC的PM8018 16x6G SAS協(xié)議控制器并支持SAS與SATA接口。它們還能夠最高接入16款固態(tài)硬盤或磁盤驅(qū)動器。HBA每秒能夠執(zhí)行超過百萬次輸入/輸出操作(即IOPS),數(shù)據(jù)持續(xù)吞吐量則達到6.6 GB每秒。
“HBA最重要的適用范圍在于數(shù)據(jù)中心環(huán)境下應(yīng)對大量接入存儲驅(qū)動器的同時,還要為持續(xù)增長的數(shù)據(jù)容量提供高密度存儲與低成本維護,”PMC公司企業(yè)存儲部門產(chǎn)品營銷主管Zaki Hassan表示。“Seris 7H HBA在可用端口數(shù)量方面達到市場同類商業(yè)解決方案的兩倍。這些端口數(shù)量龐大但卻更加低調(diào)的HBA幫助數(shù)據(jù)中心將壓縮運營成本、優(yōu)化存儲連接變?yōu)榭赡堋?rdquo;
Attunity RepliWeb for Enterprise File Replication
Attunity RepliWeb for Enterprise File Replication (即企業(yè)文件復(fù)制,簡稱EFR) 解決的是大數(shù)據(jù)技術(shù)面臨的另一個重要課題——如何對大規(guī)模存儲數(shù)據(jù)進行復(fù)制。它的設(shè)計目的在于簡化數(shù)據(jù)文件在Apache Hadoop數(shù)據(jù)集合之間的復(fù)制流程。Attunity公司全球營銷副總裁Matt Benati解釋稱,Hadoop平臺在設(shè)計初衷上只考慮到大量數(shù)據(jù)消耗狀況;然而某些企業(yè)可能還保留著一些較小的數(shù)據(jù)段,希望將其與大數(shù)據(jù)結(jié)合以進行更加精確的業(yè)務(wù)分析。Attunity公司能夠幫助這類企業(yè)用戶打理好從各類渠道進入Hadoop、有大有小的多種數(shù)據(jù)集。
“在合理的時耗之內(nèi)通過廣域網(wǎng)移動數(shù)據(jù)絕非易事,”Benati補充道。“Attunity公司的內(nèi)存內(nèi)數(shù)據(jù)流處理能力及相關(guān)技術(shù)優(yōu)化使得大數(shù)據(jù)遷移更加輕松——無論是在本地還是云環(huán)境之下。”
Shadoop
Hadoop各款開源發(fā)行版在安全功能方面的關(guān)注并不突出,針對這一狀況,商業(yè)發(fā)行版也就應(yīng)運而生。這類發(fā)行版通常會把訪問控制及登錄等機制納入進來。“Shadoop為Hadoop集群帶來了以角色為基礎(chǔ)的訪問控制機制,具備日志審計及Kerberos(由麻省理工學(xué)院開發(fā)的一套安全認證系統(tǒng))驗證功能,” Enterprise Management Associate分析師Scott Crawford解釋道。