Sqoop導入導出的數(shù)據(jù)支持一些存儲類型:
-文本文件:基礎的文本文件,用逗號等相隔;
- 序列文件:二進制文件,包含序列化記錄數(shù)據(jù);
- Hive表:Hive數(shù)據(jù)倉庫中的表,這是針對Hadoop構(gòu)建的一種特殊的數(shù)據(jù)倉庫架構(gòu)。
總體來說,SQL Server和Hadoop環(huán)境(MapReduce和HDFS)能夠讓用戶處理海量的非結(jié)構(gòu)化數(shù)據(jù),并將這部分數(shù)據(jù)整合到一個結(jié)構(gòu)化的環(huán)境中,進行報表制作以及BI分析。
微軟大數(shù)據(jù)策略才剛剛開始 SQL Server Hadoop連接器在微軟大數(shù)據(jù)之路上算是邁出了重要的一步。但與此同時,由于Hadoop、Linux和Sqoop都是開源技術,這意味著微軟要對開源世界大規(guī)模地敞開胸懷。其實微軟的計劃并不只如此,在今年年底,他們還將推出一個類似于Hadoop的解決方案,并以服務的形式運行在Windows Azure云平臺上。
在明年,微軟還計劃推出針對Windows Server平臺的類似服務。不能否認,SQL Server Hadoop連接器對于微軟來說意義重大,用戶可以在SQL Server環(huán)境中處理大數(shù)據(jù)挑戰(zhàn),相信在未來他們還會帶給我們更多的驚喜。
2/2 首頁 上一頁 1 2