多集群存儲:即計算集群可直接訪問遠(yuǎn)程系統(tǒng)并按需要存取數(shù)據(jù)。
云數(shù)據(jù)緩存:即特定數(shù)據(jù)倉庫(主機(jī))的元數(shù)據(jù)索引和全數(shù)據(jù)集,可被有選擇的異步緩存到遠(yuǎn)程(客戶端)系統(tǒng),以實(shí)現(xiàn)本地快速訪問。
聯(lián)合數(shù)據(jù)庫:可使分布式數(shù)據(jù)庫間安全聯(lián)合。
元數(shù)據(jù)管理:此功能為前面三點(diǎn)提供了基礎(chǔ)。存儲、管理和分析數(shù)十億數(shù)據(jù)對象對任何數(shù)據(jù)倉庫而言都是必須具備的能力,尤其是擴(kuò)展超出PB級的數(shù)據(jù)倉庫,而這正成為基因組基礎(chǔ)設(shè)施的發(fā)展趨勢。元數(shù)據(jù)包括系統(tǒng)元數(shù)據(jù),如文件名、路徑、大小、池名稱、創(chuàng)建時間、修改或訪問時間等,也涵蓋以鍵值對形式存在的自定義元數(shù)據(jù),這樣被應(yīng)用程序、工作流或用戶所使用的文件可與之創(chuàng)建關(guān)聯(lián),從而用于實(shí)現(xiàn)以下目標(biāo)。
基于大小、類型或使用情況放置和移動文件以方便I/O管理。
基于對元數(shù)據(jù)的閃電掃描收集信息,啟用基于策略的數(shù)據(jù)生命周期管理。