在實際的存儲文件過程中,如果文件太大,對整個文件進(jìn)行存儲,不是很安全,效率也不高,百度的做法是切成小單位,然后在保存在Mola系統(tǒng)里面去(可能存在不同的服務(wù)器上),讀取的時候再按照拆分的順序組合成原文件。
多副本存儲與副本快速恢復(fù)
為了保證云存儲的高可用性,數(shù)據(jù)采用3份冗余存儲,讀取數(shù)據(jù)時會按負(fù)載均衡選擇一個ChunkServer上的副本,因此只要有一臺ChunkServer存活,服務(wù)就可用。此外,如果某個ChunkServer出現(xiàn)問題,也可以進(jìn)行副本快速恢復(fù),因為數(shù)據(jù)的分片是打散在所有的Chunk Server上,單臺Chunk Server在進(jìn)行數(shù)據(jù)恢復(fù)時候,可以多機(jī)給一臺機(jī)器傳輸數(shù)據(jù)。
在云存儲中用戶存儲的數(shù)據(jù)中大部分是非結(jié)構(gòu)化的可以通過Mola來存儲;此外用戶還是有一些結(jié)構(gòu)化的數(shù)據(jù),比如聯(lián)系人、短信、收藏的音樂、電影以及游戲進(jìn)度、裝備、設(shè)置等;這些結(jié)構(gòu)化數(shù)據(jù)則通過增加結(jié)構(gòu)化存儲來解決。
云端管多層次安全機(jī)制
在安全方面,百度也從云端管三個方面設(shè)置了多項安全的保障,確保用戶安全放心地使用云存儲服務(wù)。
云:數(shù)據(jù)中心災(zāi)備;多副本冗余;數(shù)據(jù)隔離;安全監(jiān)測用戶分享內(nèi)容
端:OAuth2.0安全認(rèn)證;統(tǒng)一訪問控制系統(tǒng)
管:HTTPS加密數(shù)據(jù)傳輸
比如在云端,百度搭建了ACL(AccessControlList)服務(wù)器,讓開發(fā)者定義語法,界定存儲對象是公開還是私有,或者允許某些特定用戶訪問。對個人用戶而言,也可以指定哪些數(shù)據(jù)或者哪些子目錄下的數(shù)據(jù)可以公開給某些應(yīng)用使用,靈活控制數(shù)據(jù)的使用、同時提供安全保障。
實現(xiàn)數(shù)據(jù)唯一性
從國內(nèi)主流的網(wǎng)盤來看,大都實現(xiàn)了數(shù)據(jù)在不同終端之間的同步,有些可以針對不同終端進(jìn)行媒體的適配,提高用戶體驗。但并沒有解決不同應(yīng)用之間的數(shù)據(jù)共享問題。比如在微博上朋友分享的照片,如果要想同時在微信上分享給別的好友,那用戶只能是先從微博上把照片單獨拷貝到網(wǎng)盤,然后再到微博上去分享。理想的狀態(tài)是只要有更新的照片,無論是來自哪個應(yīng)用,只要用戶許可,其他應(yīng)用都可以看到這些數(shù)據(jù),并且觸發(fā)某些操作(當(dāng)然用戶也可以設(shè)置不這樣做),百度云做到了這一點。