圖六:一個(gè)簡單的例子,通過更新插入新的改變到表1(table_1),并通過增量消費(fèi)建立一個(gè)簡單的投影表(projected_table)。由Vinoth Chandar提供
借用Spark流式處理的說法(如,流-數(shù)據(jù)集連接,流-流連接),我們可以更高效地以較低的延遲來操作簡單的投影和流-數(shù)據(jù)集連接。甚至是流-流連接也可以增量計(jì)算,只不過需要增加一些額外的邏輯來做窗口對齊。

圖七:一個(gè)更為復(fù)雜的例子,將一個(gè)事實(shí)表連接到多個(gè)維度表,從而建立一個(gè)連接過的表。由Vinoth Chandar提供
這個(gè)案例是我們可以節(jié)省硬件花費(fèi)的同時(shí)顯著地降低延遲的不多見的場景之一。