ITBear旗下自媒體矩陣:

一個IT老兵從“支付寶”“攜程”事件看業(yè)務(wù)連貫性保障

   時間:2015-06-04 11:32:42 來源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評論無障礙通道

在過去一周,熱衷“互聯(lián)網(wǎng)+”主題的大家冷汗不已,“支付寶”和“攜程”接踵而至的運維保障事故,讓一直以互聯(lián)網(wǎng)為傲的IT圈一片唏噓。公開報道的事故原因涉及網(wǎng)絡(luò)線路中斷、運維人員誤操作,因此造成其服務(wù)較長時間無法恢復(fù)。作為一個在IT運維領(lǐng)域工作多年的老兵,看到這些有多年運維經(jīng)驗的企業(yè)仍然會在應(yīng)急響應(yīng)、操作規(guī)范性等基礎(chǔ)運維管理工作上栽跟頭,其背后折射出的是國內(nèi)大多數(shù)企業(yè)運維管理水平還無法保障業(yè)務(wù)穩(wěn)定運行的現(xiàn)狀。

目前國內(nèi)企業(yè)IT運維管理工作中突出存在的問題主要有四個:

第一:自動化程度不高導(dǎo)致誤操作幾率倍增。當前企業(yè)運維例行操作的工作大多還依賴手工,年復(fù)一年,這樣即便是簡單重復(fù)的工作,出現(xiàn)誤操作的幾率也會成倍提升。隨著企業(yè)業(yè)務(wù)量的增長,IT設(shè)備數(shù)量和運維工作將同步增加。但基于編制和成本的考慮,企業(yè)的IT人員配備無法滿足運維需求。這樣會導(dǎo)致工作壓力過高,促使誤操作幾率提升。另外,IT人員的穩(wěn)定性較低,新人在技能和業(yè)務(wù)熟悉程度都有限的情況下,出現(xiàn)誤操作的幾率更大;所以通過自動化運維系統(tǒng)替代大量重復(fù)繁雜的例行人工操作,這種方法可以降低誤操作幾率;同時,也是IT運維的發(fā)展趨勢。

第二:缺乏有效的資源管理使運維效率低下。企業(yè)做好IT運維服務(wù),首先需要及時收集、分類、更新相關(guān)機房資源、物理資源、平臺資源、虛擬資源、應(yīng)用資源到數(shù)據(jù)資源各類服務(wù)對象的信息;如果出現(xiàn)變更的情況,一旦變更前不能準確獲悉可能影響的所有相關(guān)資源信息,就會引起無法估量的損失;如果在承接業(yè)務(wù)需求時,不能知曉現(xiàn)有系統(tǒng)性能、存儲和網(wǎng)絡(luò)情況,就會讓業(yè)務(wù)上線成為空談;如果在采購新設(shè)備建設(shè)新機房時,不能了解當前運算資源的忙閑程度,就會讓企業(yè)浪費投資決策失誤;所以只有完整準確可用的資源管理服務(wù),才能將運維工作的效率大大提升。

第三:風(fēng)險評估與應(yīng)急準備流于形式使“狼來了”成真。不可否認當下企業(yè)越來越重視風(fēng)險評估,考慮業(yè)務(wù)連貫性的問題;但能夠真正從業(yè)務(wù)出發(fā),考慮所有可能風(fēng)險并給出相應(yīng)對策,同時能夠堅持演練的企業(yè)卻少之又少;首先風(fēng)險評估需要運維團隊中具備或協(xié)調(diào)理解業(yè)務(wù)需求的資源,能夠?qū)︼L(fēng)險做出正確判斷,尤其不能遺漏自認為不會發(fā)生的或小概率的問題,通常確是損失較大的風(fēng)險;其次對風(fēng)險能合理分類分級,提供企業(yè)能承受的恢復(fù)方案,其中不只包括IT部門還包括業(yè)務(wù)部門、市場宣傳部門、法務(wù)部門等整套方案;最后為確保恢復(fù)方案的可行,一定要定期演練并及時總結(jié)和完善方案,風(fēng)險模擬越真實,演練帶來的效果越可信,當然企業(yè)要做好承擔(dān)由于演練帶來的新風(fēng)險以及演練的相關(guān)成本;流于形式的風(fēng)險應(yīng)急準備工作只會讓“狼來了”成為現(xiàn)實。

第四:能否敏捷應(yīng)對業(yè)務(wù)需求變化是判斷 IT價值的最大因素。最后一個問題就是IT運維不能只埋頭拉車而不懂抬頭看路。運維的目標說到底就是要保障業(yè)務(wù)的平穩(wěn)運行,在業(yè)務(wù)需求變化時也能保持敏捷感知,并隨之做出相應(yīng)調(diào)整。但IT運維的管理者們常常會被每天變更、故障、應(yīng)急等具體事物糾纏的不可開交,而且管理者們大多是技術(shù)出身,更喜歡研究專業(yè)的問題。所謂不能跳出畫看畫,迷失在忙碌中卻忽視了最終的目標。其實從運維工作的規(guī)劃開始,就要瞄準業(yè)務(wù)規(guī)劃的目標設(shè)計;具體工作中也要時刻保持與業(yè)務(wù)部門的密切溝通,確定運維的保障工作也是業(yè)務(wù)工作中所需要的內(nèi)容;當業(yè)務(wù)需求發(fā)生變化時,IT運維部門更要主動出擊,了解運維工作的需求變化,并做出積極調(diào)整;業(yè)務(wù)成功,才是運維的成功。

作為多年的IT老兵與公司神州信息在IT服務(wù)領(lǐng)域摸爬滾打了二三十年,我們的技術(shù)人員在為行業(yè)客戶提供IT服務(wù)的過程中,不斷了解學(xué)習(xí)行業(yè)客戶的業(yè)務(wù)知識,總結(jié)行業(yè)IT服務(wù)經(jīng)驗,摸索和開發(fā)出保障行業(yè)客戶業(yè)務(wù)運營的IT服務(wù)系列產(chǎn)品。早在2004年就提出“IT服務(wù)隨需而動”的理念,按照ITSS、ISO20000等國內(nèi)外標準設(shè)計的“智慧數(shù)據(jù)中心(SDC)”服務(wù)產(chǎn)品,強調(diào)自動化平臺、一線服務(wù)團隊和高端運維專家三位一體的服務(wù)模式。通過自動化平臺完成數(shù)據(jù)中心所有資源的監(jiān)控、巡檢、作業(yè)和流程流轉(zhuǎn)等工作,一線服務(wù)團隊統(tǒng)一接口提供快速響應(yīng)的故障支持和項目配合,通過專家團隊提供業(yè)務(wù)和IT多方面主動的調(diào)研評估和優(yōu)化改進工作。

通過多年的實踐,采用“智慧數(shù)據(jù)中心”運維的完整或局部方案,能為企業(yè)直接帶來業(yè)務(wù)開通成功率提升3-10倍、變更成功率提升15%-30%、IT故障減少30%-50%、例行操作效率提升2-10倍等顯著的回報,從而客戶可以釋放自己的IT精力,將有限的IT資源投入到自身的業(yè)務(wù)需求中去。

說一千道一萬,做好運維服務(wù),就要以業(yè)務(wù)發(fā)展為綱,智慧服務(wù)為翼,專業(yè)和管理并重,才能讓運維服務(wù)的價值得以充分體現(xiàn)!

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version