由于dataset數(shù)據(jù)集變得日益龐大并且難以處理,因此要想移動(dòng)它們會(huì)越來(lái)越困難。當(dāng)與以PB單位計(jì)量的數(shù)據(jù)庫(kù)相提并論時(shí),即便是最快速的數(shù)千兆位通道看起來(lái)也像雞尾酒中的吸管一樣單薄。在Structure 2012大會(huì)專家小組的一次討論中,云計(jì)算領(lǐng)域的經(jīng)理級(jí)高管們指出,要實(shí)現(xiàn)將大規(guī)模重要數(shù)據(jù)轉(zhuǎn)移到利用它們工作的應(yīng)用程序中,越來(lái)越任重道遠(yuǎn),反之亦然。
一個(gè)選擇是,簡(jiǎn)單地將應(yīng)用實(shí)例移至毗鄰數(shù)據(jù)的地方。為了靠近最重要的市場(chǎng)和客戶,紐約證券交易所就曾將自己的數(shù)據(jù)中心搬到了新澤西和倫敦,紐約證券交易所IT部門NYSE Technologies的高級(jí)副總裁和平臺(tái)服務(wù)方面世界級(jí)的領(lǐng)頭羊Ken Barnes表示。起初,因?yàn)闀r(shí)滯的原因,這種地理層面的接近會(huì)非常必要,在證券交易領(lǐng)域,一毫秒的時(shí)間都是至關(guān)重要的。但是紐約證券交易所隨后發(fā)現(xiàn),由于客戶在它的數(shù)據(jù)中心不斷地移進(jìn)和移出數(shù)量巨大的數(shù)據(jù),帶寬問題如今成了它的更大關(guān)注點(diǎn)。
Aspera公司聯(lián)合創(chuàng)始人、工程技術(shù)部門副總裁SerbanSimu指出,對(duì)于金融服務(wù)而言,某種形式的主機(jī)代管可能會(huì)更有效,在這一領(lǐng)域,數(shù)據(jù)和用戶全部都聚集在少數(shù)幾個(gè)中心,但是在其他一些領(lǐng)域,比如康健行業(yè),這種模式就行不通,因?yàn)樵谶@一行業(yè),醫(yī)院、研究機(jī)構(gòu)、上百萬(wàn)的醫(yī)生以及數(shù)十億計(jì)的患者全部分散在世界各地。為美國(guó)某家大學(xué)搜集和分析海外數(shù)據(jù)的一位醫(yī)療研究者,如今就遭遇了這樣的帶寬難題。
即使我們能夠?qū)?yīng)用移至靠近dataset數(shù)據(jù)集的場(chǎng)所,或者將數(shù)據(jù)庫(kù)搬到利用它來(lái)工作的云計(jì)算資源所在地附近,在一個(gè)地點(diǎn)搜集的信息或者進(jìn)行的分析,對(duì)于另外某個(gè)地點(diǎn)而言,通常也是實(shí)用的。Infineta產(chǎn)品副總裁HaseebBudhani說(shuō)。
我們生成數(shù)據(jù)的速度要遙遙領(lǐng)先于我們能夠移動(dòng)數(shù)據(jù)的速度,我們生成的數(shù)據(jù)越多,數(shù)據(jù)就會(huì)變得越來(lái)越不可移動(dòng),思科系統(tǒng)副總裁和首席技術(shù)官Lew Tucker表示,“數(shù)據(jù)的確具有‘惰性’,”他說(shuō),“它傾向于呆在最初被輸入的地方。”他提出,數(shù)據(jù)分析最終會(huì)采用分布式計(jì)算的模式。需要處理巨額工作量的領(lǐng)域,比如染色體組研究領(lǐng)域,將會(huì)在本地搜集并且前處理它們手頭的數(shù)據(jù),再將精心提煉過(guò)的dataset數(shù)據(jù)集傳輸?shù)狡渌姆植际綌?shù)據(jù)中心。既然視頻行業(yè)可以通過(guò)引入內(nèi)容分發(fā)網(wǎng)絡(luò),解決帶寬分布的難題,Tucker提到,為什么其他領(lǐng)域的數(shù)據(jù)分析不效仿這一成功經(jīng)驗(yàn)?zāi)兀?/p>