如若LHC加速器以理想的方式運(yùn)行,那么需要為全世界超過(guò)500所研究機(jī)構(gòu)和大學(xué)的近5000名參與到LHC的實(shí)驗(yàn)的科學(xué)家提供對(duì)實(shí)驗(yàn)數(shù)據(jù)的訪問(wèn)。除此以外,在LHC預(yù)計(jì)超過(guò)15年的生命周期里,所有的數(shù)據(jù)都須是可用的。
出于經(jīng)濟(jì)和技術(shù)的眾多理由,都強(qiáng)烈需求一個(gè)分布式架構(gòu):
作出采用分布式計(jì)算的方式來(lái)管理LHC數(shù)據(jù)的首要考慮還是金錢(qián)。在1999年,當(dāng)LHC數(shù)據(jù)分析計(jì)算系統(tǒng)設(shè)計(jì)工作開(kāi)始的時(shí)候,就很快認(rèn)識(shí)到了其所需求的計(jì)算能力遠(yuǎn)遠(yuǎn)超出了CERN的資助能力。另一方面,大多數(shù)LHC的合作實(shí)驗(yàn)和院校都有國(guó)家級(jí)或地區(qū)級(jí)計(jì)算設(shè)施的使用權(quán)。明顯的一個(gè)問(wèn)題就是:這些設(shè)施能整合起來(lái)為L(zhǎng)HC提供一個(gè)統(tǒng)一的計(jì)算服務(wù)嗎?高速發(fā)展的廣域網(wǎng)——能力和容量的增長(zhǎng)伴隨著成本的顯著降低——使之看似可行。從那時(shí)起,LHC計(jì)算網(wǎng)格的發(fā)展路線就確定了。
在LHC計(jì)算網(wǎng)格的研發(fā)過(guò)程中,分布式系統(tǒng)的許多附加優(yōu)勢(shì)開(kāi)始顯現(xiàn):
- 不同的站點(diǎn)能保有數(shù)據(jù)的多份拷貝,保證了所有參與其中的科學(xué)家都能訪問(wèn),獨(dú)立于地理位置。
- 允許多個(gè)計(jì)算中心的閑置能力得到最優(yōu)化的使用,提升了效率。
- 在多個(gè)時(shí)區(qū)都擁有計(jì)算中心使晝夜不停的監(jiān)控易如反掌并保證了可靠的專(zhuān)業(yè)支持。
- 不存在單點(diǎn)失效。
- 維護(hù)和升級(jí)的成本是分散的,因?yàn)閱蝹€(gè)機(jī)構(gòu)負(fù)責(zé)資助本地的計(jì)算資源并保有相應(yīng)責(zé)任,與此同時(shí)仍然對(duì)全球化的目標(biāo)作出了貢獻(xiàn)。
- 獨(dú)立掌控資源鼓勵(lì)了計(jì)算和分析的新興手段。
- 所謂的“人才流失”,研究員不得不離開(kāi)本土以獲取資源,當(dāng)資源從他們桌面即可獲取時(shí),這一現(xiàn)象被大大地減少了。
- 系統(tǒng)只需簡(jiǎn)易重新配置即可應(yīng)對(duì)新的挑戰(zhàn),使其能隨著LHC的生命周期動(dòng)態(tài)的演進(jìn),能力不斷成長(zhǎng),以滿(mǎn)足每年采集數(shù)據(jù)增加引起的需求上升。
- 對(duì)于在什么地點(diǎn)以及怎樣擴(kuò)充未來(lái)的計(jì)算資源留出了足夠的靈活性。
- 允許社區(qū)享用新技術(shù)帶來(lái)的提升的易用性,成本效益或能源效率。
整體項(xiàng)目的規(guī)模給LCG團(tuán)隊(duì)帶來(lái)了一些有趣的挑戰(zhàn):
- 管理需要在網(wǎng)格間可靠傳輸?shù)凝嫶髷?shù)據(jù)。
- 掌管每個(gè)站點(diǎn)的存儲(chǔ)空間。
- 跟蹤9000名物理學(xué)家分析數(shù)據(jù)所產(chǎn)生的幾千萬(wàn)的文件。
- 保證足夠的網(wǎng)絡(luò)帶寬:主站點(diǎn)之間用光纖鏈接,而最遠(yuǎn)程的站點(diǎn)也需要可靠的鏈接。
- 保證大量獨(dú)立站點(diǎn)之間的安全同時(shí)最小化官僚作風(fēng),確保認(rèn)證用戶(hù)易于訪問(wèn)。
- 維護(hù)多個(gè)站點(diǎn)安裝的軟件版本一致連貫。
- 處理異構(gòu)的硬件。
- 提供會(huì)計(jì)機(jī)制,基于不同級(jí)別的需求和對(duì)基礎(chǔ)設(shè)施的貢獻(xiàn),保證公平的訪問(wèn)。
對(duì)于如此巨大的分布系統(tǒng)來(lái)說(shuō),安全同樣是個(gè)重要的挑戰(zhàn)。據(jù)“每日電訊”報(bào)道,9月10日,當(dāng)?shù)谝皇W迎h(huán)繞粒子加速器呼嘯而過(guò)時(shí),來(lái)自希臘的黑客曾獲取了CERN中一臺(tái)LHC計(jì)算系統(tǒng)的片刻權(quán)限。
在CERN,運(yùn)營(yíng)著這個(gè)龐然大物的機(jī)構(gòu),科學(xué)家們擔(dān)心黑客們一旦得手將會(huì)做什么,因?yàn)樗麄冸x控制這一機(jī)器中一個(gè)龐大探測(cè)器的計(jì)算機(jī)系統(tǒng)僅“一步之遙”。這是個(gè)重達(dá)12500噸的磁體,長(zhǎng)近21米,寬高15米。
如果他們進(jìn)入到第二道計(jì)算機(jī)網(wǎng)絡(luò),他們可以關(guān)掉這大型探測(cè)器的一部分。內(nèi)部人士說(shuō):“就算沒(méi)人搗亂要讓它們工作起來(lái)都?jí)蚶щy了?!?
攻擊造成的后果是,在寫(xiě)這篇文章的時(shí)候,公眾仍然無(wú)法訪問(wèn)cmsmon.cern.ch這一站點(diǎn)。
驅(qū)動(dòng)LCG的操作系統(tǒng)是Scientific Linux發(fā)行版 3/4 首頁(yè) 上一頁(yè) 1 2 3 4 下一頁(yè) 尾頁(yè) 更多詳細(xì)信息,請(qǐng)您微信關(guān)注“計(jì)算網(wǎng)”公眾號(hào):