醫(yī)療大數(shù)據(jù)架構(gòu):我們應(yīng)該怎么做?規(guī)?;笥衷撊绾巫觯?/strong>
我們需要收集數(shù)據(jù)、處理數(shù)據(jù)、存儲數(shù)據(jù),并最終將數(shù)據(jù)用于分析,機(jī)器學(xué)習(xí)和數(shù)據(jù)表盤。
數(shù)據(jù)擷取:NFS
通過網(wǎng)絡(luò)文件系統(tǒng)(NFS)協(xié)議可遠(yuǎn)程訪問網(wǎng)絡(luò)共享磁盤。啟用NFS服務(wù)器后,可與客戶共享目錄和文件,讓用戶和程序像訪問存儲在本地的文件一樣訪問遠(yuǎn)程系統(tǒng)上的文件。
與只允許集群數(shù)據(jù)導(dǎo)入或批量導(dǎo)入的其它版本的Hadoop不同,MapR允許通過NFS直接掛載群集本身,讓您的應(yīng)用程序直接讀取、寫入數(shù)據(jù)。通過POSIX語義,該MapR文件系統(tǒng)允許直接修改文件和多個并發(fā)讀取寫入操作。掛裝NFS的集群可實現(xiàn)對數(shù)據(jù)源的簡單數(shù)據(jù)擷取,比如說從其他應(yīng)用標(biāo)準(zhǔn)Linux命令、實用程序、應(yīng)用程序和腳本的設(shè)備上擷取文件、圖片等。