數(shù)據(jù)切分是從邏輯上或物理上將數(shù)據(jù)分割成數(shù)個(gè)更好維護(hù)或訪問(wèn)的部分,同時(shí)很多流行的開(kāi)源關(guān)系型數(shù)據(jù)庫(kù)都支持分片(比如MySQL Partitioning及Postgres Partitionging)。
在傳統(tǒng)數(shù)據(jù)庫(kù)上考慮數(shù)據(jù)庫(kù)分片
數(shù)據(jù)庫(kù)分片是提升傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)性能極限的最后一招,適用于數(shù)據(jù)可以邏輯分片在不同節(jié)點(diǎn)上并且很少做跨節(jié)點(diǎn)join分享的情況。在網(wǎng)絡(luò)應(yīng)用程序中,基于用戶分片,并將用戶相關(guān)信息儲(chǔ)存在同一個(gè)節(jié)點(diǎn)上是提升性能的常見(jiàn)途徑。
分片有很多限制條件,所以并不是適合所有場(chǎng)景,同樣在用例中存在太多的跨節(jié)點(diǎn)jion,分片將發(fā)揮不了任何作用。
總結(jié)
Hadoop的部署將耗費(fèi)公司巨量的人力和物力,如果能通過(guò)提升現(xiàn)有基礎(chǔ)設(shè)施來(lái)達(dá)到目標(biāo)也不失為一良策。
(CSDN)