美國國家衛(wèi)生研究院宣布,由國際千人基因組計(jì)劃創(chuàng)建的最大的人類遺傳變異研究數(shù)據(jù)集在亞馬遜網(wǎng)站云服務(wù)(AWS)上免費(fèi)公開。截至目前,數(shù)據(jù)量已經(jīng)達(dá)到大約200TB,相當(dāng)于1600萬個(gè)塞滿文本資料的文件柜或3萬多個(gè)標(biāo)準(zhǔn)DVD的容量。該數(shù)據(jù)集的規(guī)模極為龐大,幾乎沒有哪個(gè)研究機(jī)構(gòu)具有足夠的計(jì)算能力對(duì)其中進(jìn)行有效利用?,F(xiàn)在AWS將千人基因組計(jì)劃數(shù)據(jù)集免費(fèi)公開,供研究人員自由訪問和使用,他們只需為自己使用的計(jì)算服務(wù)付費(fèi)。
能源部:通過高級(jí)計(jì)算技術(shù)加速科學(xué)發(fā)現(xiàn)
能源部將斥資2500萬美元建立可擴(kuò)展數(shù)據(jù)管理與可視化研究所,幫助科學(xué)家對(duì)數(shù)據(jù)進(jìn)行有效管理。
美國能源部將斥資2500萬美元建立可擴(kuò)展數(shù)據(jù)管理、分析與可視化(SDAV)研究所。在能源部勞倫斯伯克利國家實(shí)驗(yàn)室(Lawrence Berkeley National Laboratory)的組織下,SDAV研究所將匯集6大國家實(shí)驗(yàn)室和7所著名大學(xué)的專業(yè)知識(shí)和經(jīng)驗(yàn)來開發(fā)新工具,幫助科學(xué)家對(duì)能源部超級(jí)計(jì)算機(jī)上的數(shù)據(jù)進(jìn)行有效管理和可視化處理。此舉將進(jìn)一步簡(jiǎn)化和加速開發(fā)流程,使科學(xué)家們能夠利用能源部的研究設(shè)施開展更加卓有成效的科學(xué)研究和發(fā)現(xiàn)。目前能源部的超級(jí)計(jì)算機(jī)上同時(shí)運(yùn)行的數(shù)據(jù)流在規(guī)模和復(fù)雜性方面均呈現(xiàn)不斷增長(zhǎng)的勢(shì)頭,因此對(duì)這些新型工具的需求也更加迫切。開展的主要項(xiàng)目計(jì)劃包括:
高性能存儲(chǔ)系統(tǒng)能夠?qū)ηf億次的數(shù)據(jù)進(jìn)行分析處理,從龐大的科學(xué)數(shù)據(jù)集提取信息,發(fā)現(xiàn)其主要特征并理解其間的關(guān)系。系統(tǒng)廣泛適應(yīng)于從能源部到電網(wǎng),包括宇宙學(xué)和天氣數(shù)據(jù)、傳感器數(shù)據(jù)等。
生物和環(huán)境研究計(jì)劃:大氣輻射測(cè)量氣候研究設(shè)施是一個(gè)多平臺(tái)的科學(xué)用戶設(shè)施,可提供重要的大氣現(xiàn)象的精確觀測(cè)研究。主要用于應(yīng)對(duì)從數(shù)以百計(jì)的文件中迅速采集和提交解決方法的挑戰(zhàn),以滿足用戶的需求。
美國核數(shù)據(jù)計(jì)劃是一個(gè)多方面努力、涉及7個(gè)國家實(shí)驗(yàn)室和兩所大學(xué)的項(xiàng)目,提供跨越多個(gè)領(lǐng)域、核物理、編譯和交叉檢查、對(duì)所有原子核的重要性質(zhì)的相關(guān)實(shí)驗(yàn)結(jié)果,維護(hù)和廣泛使用的專用數(shù)據(jù)庫。