完整性和延遲之間的權(quán)衡
在計(jì)算時(shí),隨著我們?cè)诹魇教幚?、增量處理和批處理之間變換,我們面臨著相同的根本權(quán)衡。一些應(yīng)用需要所有的數(shù)據(jù),并產(chǎn)生更為完整和準(zhǔn)確的結(jié)果,而一些則只需要低延遲的數(shù)據(jù)來產(chǎn)生相對(duì)可接受的結(jié)果即可。讓我們來看幾個(gè)例子。

圖五:展示了不同的Hadoop應(yīng)用對(duì)延遲和數(shù)據(jù)完整性的容忍度。由Vinoth Chandar提供
圖五描繪了一些應(yīng)用案例,根據(jù)它們對(duì)延遲和(不)完整性的容忍度來定位。商務(wù)儀表盤可以展示不同的粒度的各項(xiàng)指標(biāo)。它們通常較為靈活,可展示最近時(shí)間內(nèi)不完整但是有較低延遲的數(shù)據(jù),并隨著時(shí)間變得完整(這也使得它們成為L(zhǎng)ambda架構(gòu)的代表)。對(duì)于數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)的案例而言,從輸入的數(shù)據(jù)中抽取特征的過程通常延遲較低,而模型用更完整的數(shù)據(jù)進(jìn)行自我訓(xùn)練的延遲較高。其他的例子中,欺詐檢測(cè)要求低延遲地處理可獲取的最新數(shù)據(jù)。而實(shí)驗(yàn)性平臺(tái)需要相當(dāng)?shù)臄?shù)據(jù)量,并以一個(gè)相對(duì)較低的延遲來保證實(shí)驗(yàn)結(jié)果比較新。