http://ourjs.com/detail/57d0cfe1696ab502edd8ea8b
就本身而言, Hadoop 不是很有用的東西,原因是它需要編寫大量復(fù)雜和定制的程序代碼,難以治理,也沒有數(shù)據(jù)質(zhì)量概念和數(shù)據(jù)治理可談了。企業(yè)用戶都忙于去研究如何解決使用 Hadoop 所碰到的問題,主要是涉及到項(xiàng)目實(shí)施時(shí)間、成本和風(fēng)險(xiǎn)等,而 Hadoop 自身的客戶化編程就增加了項(xiàng)目實(shí)施時(shí)間、成本和風(fēng)險(xiǎn)。
大數(shù)據(jù)項(xiàng)目 實(shí)施僅靠 Hadoop 是不會(huì)成功的,除非你能有效地做好大數(shù)據(jù)集成這部分的工作,所以, 大數(shù)據(jù) 集成對(duì) Hadoop 系統(tǒng)的初期建設(shè)來說就變得非常重要。 大部分 Hadoop 系統(tǒng)初期建設(shè)僅是側(cè)重于“無價(jià)值的數(shù)據(jù)折騰進(jìn)來,無價(jià)值的數(shù)據(jù)折騰出去”,考慮著在 Hadoop 系統(tǒng)在處理大數(shù)據(jù)量情況下,是否能夠可以更快些、成本更低些?IBM 研究發(fā)現(xiàn),只有在大數(shù)據(jù)集成這部分任務(wù)實(shí)施成功,才能解決 Hadoop 系統(tǒng)有效性問題,是值得大家去重點(diǎn)地關(guān)注。
目前,僅有 IBM 能在幫助全球的客戶通過大數(shù)據(jù)集成和治理,把 Hadoop Swamp(沼澤)轉(zhuǎn)變成 Hadoop Lake (湖)這部分工作做得最優(yōu)秀。
IBM解決方案說明
IBM 為 IBM BigInsights 在內(nèi)的 Apache Hadoop 系統(tǒng)提供了數(shù)據(jù)集成(InfoSphere Data Integration)和數(shù)據(jù)質(zhì)量治理(InfoSphere Data Quality)解決方案,以幫助客戶建設(shè)一個(gè)真正有用和高效的 Hadoop 平臺(tái)系統(tǒng)。

1. InfoSphere Data Integration
按照各種需求在不同的源和目標(biāo)之間整合與轉(zhuǎn)換數(shù)據(jù),強(qiáng)大運(yùn)行擴(kuò)展性滿足很復(fù)雜的轉(zhuǎn)換需求;
轉(zhuǎn)換和匯聚任何的數(shù)據(jù)量,數(shù)百種內(nèi)置轉(zhuǎn)換控件和函數(shù),基于元數(shù)據(jù)驅(qū)動(dòng)的技術(shù)和產(chǎn)品,大大地提升團(tuán)隊(duì)協(xié)作能力;
通過基于Web瀏覽器儀表盤來快速地監(jiān)控管理運(yùn)行環(huán)境,管理好你的數(shù)據(jù)轉(zhuǎn)換以滿足業(yè)務(wù)要求;
任性地運(yùn)行在任何地方,無論是傳統(tǒng)的 Unix、Linux、Windows操作系統(tǒng),還是新興的 Apache Hadoop系統(tǒng)。這些活兒,都是不容易做到呀!

2. InfoSphere Data Quality
分析:利用源數(shù)據(jù)分析了解您的問題,自動(dòng)發(fā)現(xiàn)關(guān)鍵數(shù)據(jù)和隱藏的數(shù)據(jù)關(guān)系。
清洗:分析、標(biāo)準(zhǔn)化、匹配、存留數(shù)據(jù),最大范圍地定制出適合你的解決方案。
監(jiān)控?cái)?shù)據(jù)質(zhì)量:在任意位置和跨系統(tǒng)的訪問,都能監(jiān)控到你的數(shù)據(jù)質(zhì)量(數(shù)據(jù)庫或數(shù)據(jù)流),通過獨(dú)一無二的功能去優(yōu)化數(shù)據(jù)質(zhì)量指標(biāo),從而滿足業(yè)務(wù)與治理目標(biāo)。
IBM解決方案重點(diǎn)
針對(duì) Hadoop 平臺(tái)而發(fā)布的 Data Integration 和 Data Quality 解決方案,還有 BigMatch for Hadoop、BigSQL、BigSheet 這幾個(gè)“鐵哥們”一起去打天下。
迎合科技潮流 DataLake 發(fā)展方向,能全面地解決把任何 Hadoop 數(shù)據(jù)進(jìn)行分發(fā)和推送所遇到的問題,是一個(gè)能提供管理和人見人愛的軟件解決方案。
IBM解決方案價(jià)值


IBM 獨(dú)有價(jià)值:擁有先進(jìn)技術(shù),并成為市場(chǎng)領(lǐng)導(dǎo)者。
自然運(yùn)行在 Hadoop 平臺(tái)上,提供強(qiáng)大的數(shù)據(jù)轉(zhuǎn)換處理和數(shù)據(jù)質(zhì)量提升的可擴(kuò)展的引擎處理能力,還無需要編寫那怕是一行的程序代碼,讓技術(shù)人員爽歪歪。
基于 Hadoop 平臺(tái)上的整體解決方案級(jí)別,讓你能更了解每條數(shù)據(jù)記錄,洞察埋藏在信息中的奧秘。
是 IBM BigInsight Hadoop 平臺(tái)加速器,還能在其他 ODP(Open Data Platform)平臺(tái)系統(tǒng)上分發(fā)數(shù)據(jù),并提供 Big SQL、Big Sheets、BigMatch 等武器裝備。
目前在技術(shù)水平上,IBM 數(shù)據(jù)處理速度和擴(kuò)展能力還沒有對(duì)手能夠超越,真正是一個(gè)面向企業(yè)級(jí)用戶的大數(shù)據(jù)信息集成與治理解決方案。
為大數(shù)據(jù)生態(tài)環(huán)境提供了最佳的配套軟件工具,并遵循 ODP 規(guī)范,四海之內(nèi)皆兄弟,無論是多大數(shù)據(jù)量、多復(fù)雜、多變化的數(shù)據(jù),都能全面和高效地集成。
哇!當(dāng)你把在 Hadoop 平臺(tái)上搞信息集成的重點(diǎn)內(nèi)容都搞清楚后,就可馬上進(jìn)入高效的大數(shù)據(jù)世界,嘆世界啦!