當SQL Server Hadoop連接器部署完畢之后,用戶可以使用Sqoop來導入導出SQL Server數(shù)據(jù)。注意,Sqoop和連接器是在一個Hadoop的集中視圖下進行操作的,這意味著用戶使用Sqoop導入數(shù)據(jù)的時候是從SQL Server數(shù)據(jù)庫檢索數(shù)據(jù)并添加到Hadoop環(huán)境中,而相反地,導出數(shù)據(jù)是指從Hadoop中檢索數(shù)據(jù)并發(fā)送到SQL Server數(shù)據(jù)庫當中。
總而言之,微軟表示,隨著新連接工具的出現(xiàn),客戶將能夠在Hadoop、SQL Server和并行數(shù)據(jù)倉換環(huán)境下相互交換數(shù)據(jù)。
微軟再次發(fā)力在線數(shù)據(jù)庫連接器:Apache Hadoop發(fā)揚光大
微軟新研發(fā)的是一款ODBC連接器,用于訪問Hadoop對應的Hive數(shù)據(jù)倉庫系統(tǒng)。Excel用戶拿到Hive數(shù)據(jù)后,就可以借助Excel PowerPivot等工具,開始數(shù)據(jù)分析了。
Hortonworks與微軟積極開展合作,致力于將微軟的Hadoop連接器推廣到開源社區(qū)。另外的JavaScript也遵循同樣的模式,即微軟關注的是做產(chǎn)品,而Hortonworks則致力于開源。
Hortonworks借微軟東風 強化合作
雖然目前來講,這款Javascript框架和連接器還沒有發(fā)布,不過預計將來會開源,前景很客觀。
總之,“閉源”微軟擁抱Hadoop是木已成舟,微軟似乎對開源領域頻繁拋出橄欖枝,但無論如何,微軟都不可能與開源Linux劃上等號,因為Linux永遠是Windows系統(tǒng)在臺式機及服務器領域的直接對手。而Hadoop則不同,它可以作為微軟SQL Server及Azure系列產(chǎn)品的一大重要補充方案而存在。另一方面,Hortonworks 希望能夠與微軟積極合作,將這門技術應用到開源領域,被廣大Apache Hadoop社區(qū)所采用。微軟將重點研發(fā)這款工具,打造屬于自己產(chǎn)品的核心平臺,正所謂各取所需,Hortonworks 也將重點瞄準了產(chǎn)品,希望借此東風,進一步衍生出更廣泛的應用。