設(shè)計維護(hù)不當(dāng)都可能給存儲系統(tǒng)帶來致命威脅,嚴(yán)重時可能導(dǎo)致整個系統(tǒng)癱瘓。下文就談?wù)劥鎯ο到y(tǒng)失效的常見原因,便于管理者日常的維護(hù)。
一、存儲空間不足導(dǎo)致存儲系統(tǒng)失效
存儲系統(tǒng)失效的第一個幕后黑手不是一些比較高深的原因,而是一個最簡單的因素造成的。這個簡單的因素就是"存儲系統(tǒng)的磁盤空間不足"。在實際工作中,很多因素促成了這種情況。
一是企業(yè)存儲需求發(fā)展的比較快,跟不上存儲擴容的速度。如企業(yè)剛開始部署存儲空間的時候,可能只是用來做數(shù)據(jù)庫或者郵件系統(tǒng)的備份之用。此時存儲系統(tǒng)所需要的存儲空間并不是很大??墒前l(fā)展到后來,視頻監(jiān)控系統(tǒng)、多媒體教育系統(tǒng)等等相關(guān)的資料都存儲在了存儲系統(tǒng)之上。由于這些后來的應(yīng)用占據(jù)了比較大的存儲空間,從而導(dǎo)致原先的數(shù)據(jù)庫或者郵件系統(tǒng)由于無法爭取到足夠多的磁盤空間,從而導(dǎo)致這些應(yīng)用性能下降,甚至出現(xiàn)運行故障。
二是由于病毒等原因,導(dǎo)致了存儲空間被迅速占用?,F(xiàn)在針對存儲系統(tǒng)的木馬與病毒等等也越來越多。這些病毒有時候往往采用一個很簡單的攻擊原理。通過復(fù)制大量的文件使得存儲系統(tǒng)的存儲空間在一瞬間被用完。從而導(dǎo)致正常的應(yīng)用無法爭取到足夠的存儲空間。
其實這個故障是最好避免的。如將存儲空間部署在微軟操作系統(tǒng)上的話,則這個操作系統(tǒng)自動帶有磁盤報警系統(tǒng)。當(dāng)剩余存儲空間不足到一定的比率是,如還剩下 20%,則會馬上向系統(tǒng)管理員報警。在其他的操作系統(tǒng)上,通過第三方工具也可以實現(xiàn)類似的預(yù)警機制。有些工具還可以監(jiān)測系統(tǒng)存儲空間的異常變化。如當(dāng)存儲空間的使用率突然上升了20%或者降低了30%等等,類似的猛升猛降都會像管理員報警。這種預(yù)警機制可以在很大程度上避免因為存儲空間不足而導(dǎo)致存儲系統(tǒng)失效。
二、硬盤物理故障導(dǎo)致存儲系統(tǒng)失效
有時候硬盤等存儲設(shè)備出現(xiàn)物理故障也會導(dǎo)致存儲系統(tǒng)失效。如有些企業(yè)為了節(jié)省成本,可能會在同一個存儲服務(wù)器上使用規(guī)格不同的硬盤。在這種情況下,各個硬盤的使用壽命是不同的。此時很可能會因為一塊硬盤的損壞,而導(dǎo)致整個存儲系統(tǒng)無法正常工作。
雖然一些存儲系統(tǒng),如RAID磁盤陣列技術(shù),可以挽回硬盤物理故障所導(dǎo)致的數(shù)據(jù)損失。如現(xiàn)在有六塊硬盤組成一個RAID5磁盤陣列。此時如果有一塊硬盤出現(xiàn)了物理故障,此時出現(xiàn)故障的硬盤中的數(shù)據(jù)仍然可以被修復(fù)。但是這也只限于一塊硬盤出現(xiàn)物理故障。也就是說,當(dāng)兩塊硬盤出現(xiàn)物理故障,如同時出現(xiàn)壞區(qū)或者因為電壓不穩(wěn)定的原因?qū)е掠脖P出現(xiàn)損壞,此時損壞的數(shù)據(jù)就無法進(jìn)行恢復(fù)。在實際工作中,不少的管理員會忽視硬盤物理故障所導(dǎo)致的系統(tǒng)失效。他們總以為,硬盤不會出現(xiàn)物理故障。但是當(dāng)正的出現(xiàn)故障了的時候已經(jīng)來不及了。
硬盤的物理故障比較難以排除。因為造成這一故障的原因太多了。不過通過如下的努力,仍然可以在最大程度上降低硬盤等存儲設(shè)備物理故障的幾率。如為存儲服務(wù)器能夠配置獨立的穩(wěn)壓器,以保證提供穩(wěn)定的電壓,防止硬盤等敏感設(shè)備由于電壓不穩(wěn)而燒壞阿。如在配置存儲服務(wù)器的時候,如果需要用到磁盤陣列等技術(shù),則硬盤最好能夠采用相同規(guī)格的。特別是對于生產(chǎn)用的存儲服務(wù)器,要用新的硬盤?,F(xiàn)在硬盤等存儲介質(zhì)的價格比較便宜,企業(yè)還是可以接受的。最后一點就是周邊環(huán)境的管理,如最好將存儲服務(wù)器放在獨立的機房中,以確保比較少的灰塵、一定的濕度等等。這些措施雖然不能夠百分之百的保證硬盤不出現(xiàn)故障(有時候可能硬盤本身的原因從而導(dǎo)致硬盤運行出現(xiàn)問題),但是仍然可以在很大程度上提升硬盤的使用壽命,從而減少存儲系統(tǒng)由于硬盤故障而出現(xiàn)失效狀況的幾率。
三、服務(wù)器升級不當(dāng)導(dǎo)致存儲系統(tǒng)失效
存儲系統(tǒng)跟其他軟件一樣,由于企業(yè)業(yè)務(wù)需求的變化,也需要對其進(jìn)行升級。但是在實際工作中,經(jīng)常有企業(yè)會遇到因為升級不當(dāng)而導(dǎo)致存儲系統(tǒng)在短時間之內(nèi)處于癱瘓的境地。如以前有一個客戶,需要為存儲服務(wù)器加一條內(nèi)存。但是由于新加的內(nèi)存與系統(tǒng)原由的內(nèi)存與主板不兼容,從而導(dǎo)致存儲服務(wù)器運行出現(xiàn)故障。新加的內(nèi)存不但沒有提高服務(wù)器的性能,反而使得系統(tǒng)運行的更加慢了。