為了保證關(guān)鍵業(yè)務(wù)的連續(xù)運(yùn)行,存儲(chǔ)系統(tǒng)需要全天候就緒。存儲(chǔ)系統(tǒng)的日常易于維護(hù)和可視化管理變得十分關(guān)鍵。XE2000軟件定義存儲(chǔ)一體機(jī)擁有完善的軟硬件運(yùn)維管理功能,可簡(jiǎn)化日常運(yùn)維,減少運(yùn)維人員和時(shí)間成本投入。
01硬件運(yùn)維
硬件方面,XE2000本身可通過(guò)前、后面板指示燈,硬盤(pán)燈等顯示情況以及管理軟件來(lái)進(jìn)行管理,以及分析是否存在硬件故障情況。
前面板指示燈
以前面板指示燈為例,123分別是系統(tǒng)健康,網(wǎng)絡(luò)和電源等,綠色則表示正常,紅色或者黃色顯示告警。4是UID燈,登錄管理軟件后會(huì)亮燈。
后面板指示燈,1是以太網(wǎng)連接狀態(tài)指示燈,綠燈常亮,網(wǎng)絡(luò)鏈路已連通;燈滅,網(wǎng)口鏈路沒(méi)有連通。2是以太網(wǎng)接口數(shù)據(jù)傳輸狀態(tài)指示燈,綠色閃爍,網(wǎng)口正在接受或發(fā)送數(shù)據(jù);燈滅,網(wǎng)口沒(méi)有接受或發(fā)送數(shù)據(jù)。3和4是電源模塊狀態(tài)指示燈,綠色常亮模塊工作正常;橙燈閃爍或者常亮表示告警或已經(jīng)出現(xiàn)損壞。
后面板指示燈
前面板的硬盤(pán)燈,F(xiàn)ault燈如果是橙色,則是故障,如果不亮說(shuō)明沒(méi)有設(shè)置好RAID。
查看硬件是否故障,還可以進(jìn)入管理軟件查看。管理軟件中的【整體概況】頁(yè)面可以查看服務(wù)器的基本信息和基本狀態(tài)。管理軟件中的【健康診斷】中可以查看【事件日志】和【管理軟件日志】,來(lái)分析是否存在硬件故障。
02軟件運(yùn)維
1、概覽檢查
通過(guò)Web登陸存儲(chǔ)UI界面。在概覽界面,查看【數(shù)據(jù)狀態(tài)】和【健康狀態(tài)】,當(dāng)這兩個(gè)欄目都顯示正?;蚪】禒顟B(tài)時(shí),集群正常;在【告警】欄目檢查是否有嚴(yán)重和緊急的告警,如果有則及時(shí)檢查;在【存儲(chǔ)池容量使用】欄目查看存儲(chǔ)池容量使用是否超過(guò)75%,如果是則考慮擴(kuò)容;
2、服務(wù)器檢查
在【服務(wù)器管理】界面查看服務(wù)器的【狀態(tài)】,如果健康狀態(tài)顯示告警或離線狀態(tài)則要檢查并分析原因;查看服務(wù)器的【CPU和內(nèi)存利用率】,如果顯示超過(guò)80%要監(jiān)控并分析原因;檢查【系統(tǒng)盤(pán)容量使用率和IO利用率】,如果系統(tǒng)盤(pán)容量使用較高,要分析并清理無(wú)用文件,如果系統(tǒng)盤(pán)IO利用率較高則要分析并降低系統(tǒng)盤(pán)負(fù)載。
3、SSD緩存檢查
在【緩存管理】界面查看緩存盤(pán)狀態(tài);如果顯示健康狀態(tài)則正常,如果顯示告警狀態(tài)則要分析SSD盤(pán)是否發(fā)生故障;查看SSD的【寫(xiě)入壽命】,寫(xiě)入壽命顯示在30%以下時(shí)要及時(shí)更換SSD;在“性能”選項(xiàng)卡頁(yè)面可查看到SSD讀寫(xiě)帶寬、讀寫(xiě)IOPS和延時(shí)。
4、硬盤(pán)檢查
在【硬盤(pán)管理】界面查看硬盤(pán)狀態(tài);如果顯示健康狀態(tài),則正常,如果顯示告警狀態(tài)則要分析硬盤(pán)是否發(fā)生故障;查看硬盤(pán)的容量使用情況,如果硬盤(pán)使用量超過(guò)75%則要及時(shí)擴(kuò)容。
在【硬盤(pán)管理】列表模式下,可以查看osd狀態(tài)和性能,點(diǎn)擊某塊osd,可查看硬盤(pán)的SMART信息。
5、更換SATA盤(pán)
在【硬盤(pán)管理】界面中有個(gè)別osd顯示告警狀態(tài),檢查并確認(rèn)是硬盤(pán)故障后,進(jìn)入該osd所在服務(wù)器的【服務(wù)器管理】—【物理盤(pán)】界面,點(diǎn)擊【硬盤(pán)點(diǎn)燈】開(kāi)啟手動(dòng)點(diǎn)燈功能,對(duì)故障盤(pán)進(jìn)行手動(dòng)點(diǎn)燈,確認(rèn)故障盤(pán)位置。
找到故障硬盤(pán)后,將故障盤(pán)從服務(wù)器中拔出,安裝新的SATA盤(pán)到服務(wù)器;然后在存儲(chǔ)UI管理界面中的【硬盤(pán)管理】界面找到故障盤(pán),選中故障盤(pán)->【操作】列表中點(diǎn)擊【硬盤(pán)重建】->選擇【新物理盤(pán)】->選中新盤(pán)后點(diǎn)擊【下一步】->設(shè)置緩存盤(pán)選中【原緩存】后點(diǎn)擊【下一步】進(jìn)行硬盤(pán)重建。
硬盤(pán)重建成功后,osd為健康狀態(tài),同時(shí)存儲(chǔ)池開(kāi)始數(shù)據(jù)重平衡,等待數(shù)據(jù)重平衡完成后,集群恢復(fù)正常,硬盤(pán)更換完成。
6、配置郵箱告警
在【通知列表】界面點(diǎn)擊【配置郵箱服務(wù)器】按鈕,即可快速配置存儲(chǔ)郵件告警。郵箱服務(wù)器配置完成后,在通知列表中點(diǎn)擊【創(chuàng)建】故障信息通知郵箱;在【告警中心】->【告警通知】頁(yè)面添加告警規(guī)則。