ITBear旗下自媒體矩陣:

如何有效避免IDC故障,騰訊云專家談IDC聯合運營經驗

   時間:2015-06-25 19:37:20 來源:互聯網編輯:星輝 發(fā)表評論無障礙通道

近年,國內云服務商迅速發(fā)展壯大,自建機房趕不上發(fā)展速度,云服務商普遍通過租用IDC的方式進行服務擴容。IDC供應商眾多,而災備能力卻參差不齊,電力中斷導致的故障最近更時有發(fā)生。

租用機房的做法,在國內云服務商提供海外云服務時更為常見,云服務商如何選擇海外數據中心,通過什么手段保障聯合運營效果,災備能力是否足夠,成為用戶最關心的話題。

為此,我們對騰訊云專家進行了關于海外云服務和災備能力建設的主題專訪。若遇到電力中斷等意外事故,騰訊的海外數據中心將如何處理?專家的解讀,相信能給用戶與云服務商提供更多借鑒。

Q :中國的云服務商在海外布局數據中心一般采取什么策略,共建、租用還是自建?

A:據我們了解,由于規(guī)模的原因,中國互聯網公司在海外的數據中心很少自建,大多是租用。騰訊云在香港和北美的數據中心采取的方式是租用+定制化。

Q: 在租用+定制化的策略下,騰訊云對合作伙伴有著怎樣的選擇標準?

A 近期的多起云服務商故障大多緣于IDC基礎設施設計的冗余等級較低,且可用性運營經驗匱乏。

騰訊自QQ業(yè)務開始自建數據中心,擁有超過15年的IDC經驗,擁有亞洲最大的互聯網數據中心,以及亞洲最大的數據中心群。在15年的發(fā)展過程中,騰訊不斷組建及壯大自己的IDC專家團隊,積累及沉淀IDC技術,構建運營及安全保障體系,技術實力在國內數據中心行業(yè)處于領先地位。

在海外,騰訊云采用的是租用+定制化方式,因此在選擇合作供應商有嚴格的篩選要求,且每次機房選址都會投入技術專家參與數據中心選址。在香港,與騰訊云合作的供應商是全球數一數二的數據中心提供商,在全球擁有超過15年的建設和運營經驗,有體系化嚴謹的運營安全及保障體系,機房有優(yōu)異的可用性記錄。

事實上,騰訊為了支撐自身海外業(yè)務的發(fā)展(如QQ、微信等),每個地區(qū)其實有多個IDC,我們根據實際運行水平,其中再挑選出其中最好的數據中心,開放出來做云服務。

Q: 騰訊云如何保證聯合運營的效率,保障業(yè)務穩(wěn)定?

A 騰訊自身互聯網業(yè)務眾多,發(fā)展迅猛,服務器規(guī)模從10W到20W僅僅用了1年時間,給業(yè)務穩(wěn)定運營帶來了前所未有的壓力。騰訊不單扛住了海量業(yè)務的挑戰(zhàn),更在這一過程中積累了豐富的運營商IDC及自建IDC運維經驗。

騰訊IDC運營歷史之悠久,自建和合作機房之多,均領先業(yè)界。我們將海內外的百家優(yōu)勢和經驗匯聚在一起,通過總結、提煉和分享創(chuàng)造共同財富,不讓同一問題在其他機房再出現。在安全可靠性運營方面,我們積累了非常豐富的經驗。

著眼于安全可靠性運營的核心問題,我們早些年就開始與各大運營商建立了一系列卓有成效的聯合運營機制。除了把騰訊自身積累的經驗分享給IDC服務商之外,還提升到雙方高效溝通、規(guī)范流程體系、數據量化、聯合巡檢、聯合排查、聯合整治、聯合優(yōu)化、技術平臺共享的高度。一方面保障了騰訊的業(yè)務,同時也促進各大運營商不斷進步,創(chuàng)造多方共贏。這的聯合運營方式,也是騰訊在業(yè)界的首創(chuàng)。

隨著聯合運營的廣泛落地,騰訊最近幾年在基礎設施層面的重大故障幾乎為零,這也大大提升了行業(yè)內眾多運營商的IDC運營水平。

Q :近日,有云服務商香港數據中心因斷電,造成服務中斷十多個小時。數據中心是否應當有備用發(fā)電設備,一旦斷電作自動切換?騰訊云采取哪些措施來應對類似突發(fā)狀況?

A 就斷電故障而言,對災備能力有充足投入的IDC運營商是可以實現斷電自動切換的,云服務商在選擇合作伙伴的時候需要嚴格把關。

就供電系統(tǒng)而言,目前業(yè)界流行的是相對低成本的N+1設計,以及相對高成本的2N設計。整體而言,2N系統(tǒng)的可靠性比N+1系統(tǒng)要更高。

騰訊云香港數據中心的電力系統(tǒng)從市電進線、柴發(fā)、UPS系統(tǒng),一直到機柜PDU,都是完全獨立2N系統(tǒng),中間不交叉,一旦其中一路系統(tǒng)的某個部件出現問題,都可以有另外一路進行全負載備份,可靠性更高。

Q :除了近期的斷電事故,包括之前還有云服務商因機房遭受雷擊而故障的事件,數據中心的災備還需要考慮什么情況,騰訊云是怎么做的?

A 機房遭受雷擊,說明數據中心防雷設施可能存在一系列的問題。

騰訊建設數據中心,在建設階段,會從數據中心全生命周期,設計、建設、驗收進行管理,且不同領域包括電力、空調、安全、網絡,都會有專業(yè)人員參與,而且這些專業(yè)人員都是從騰訊所有IDC身經百戰(zhàn)過來。

運營階段,我們通過上述提及的聯合運營的機制,投入騰訊的專家人員,與運營商一起對相關IDC進行聯合巡檢、聯合排查、確保在事故前發(fā)現問題,提早整改,規(guī)避隱患。對于可能發(fā)生的風險,騰訊是零容忍的,隱患只要在某一機房發(fā)現,就會進行全國排查。過去幾年,我們曾在多個IDC發(fā)現過隱患,經過聯合整改,最后規(guī)避了風險。

Q :在海外數據中心方面,異地災備是必須的么?萬一出現斷電等問題,騰訊云將如何保證用戶的業(yè)務安全?

以香港數據中心為例,騰訊云除了嚴格選擇合作伙伴、建立緊密聯運機制之外,在供電、防雷、制冷、UPS、底層光纖等方面,都具有較高的冗余設計,后續(xù)更計劃擴展第二個可用區(qū),為客戶提供更高級別的可用性。

(備注:可用區(qū),即同一地域下(如廣州),電力和網絡互相獨立的物理區(qū)域(一般是一個物理機房),目標是能夠保證可用區(qū)間故障相互隔離(大型災害或者大型電力故障除外),不出現故障擴散,使得用戶的業(yè)務持續(xù)在線服務??捎脜^(qū)類似同城容災,用戶可以選擇在不同的可用區(qū)部署來達到跨機房的高可用。)

Q :中國很多云服務商,包括騰訊云在海外提供服務都首選香港,為什么?

A 在海外選點部署IDC,網絡覆蓋是第一位的,在整個亞太區(qū),香港能實現良好的網絡覆蓋。

香港大區(qū)目前的主要覆蓋用戶群體是東亞和東南亞區(qū)域,從亞太地區(qū)的海底光纜交匯點及互聯網的POP點看,香港的優(yōu)勢非常明顯,覆蓋東南亞地區(qū)的網絡質量也比較平均;對于機房底層的設施看,不論選點在哪里,都是需要提供較高的可用性給客戶,騰訊云在香港提供了較高的服務能力。

Q :云時代,云服務商和IDC提供商應該是一個怎樣的關系,騰訊對此是否有創(chuàng)新的舉措?

A 即便是在國內,云服務商的數據中心也很少是完全自建的,更多是和運營商租用或者合建。就騰訊云而言,IDC分布在多個運營商,各個IDC的基礎設施情況不同,運營水平有高有低。運營商的運營水平,將直接影響云服務商,最后影響到用戶。因此云服務商與運營商的依賴關系如同魚和水的關系。

我們的CEO Pony說過騰訊把半條命都交給了合作伙伴,這句話用來形容騰訊與IDC合作伙伴的關系,也非常適用。剛才提到,騰訊在業(yè)界首創(chuàng)聯合運營機制,不但確保了騰訊業(yè)務的安全可靠,同時也提升了運營商的運營能力。

我們認為,像騰訊、阿里這樣,擁有海量數據中心的互聯網企業(yè),在某種意義上被賦予了一個使命,通過“云”這個特殊的媒介,與下游產業(yè)每一家IDC相互分享經驗,完善運營體系,落實最佳實踐,從而實現多方共贏,進而促進整個產業(yè)的進步。實際上,也只有像騰訊、阿里這樣擁有海量規(guī)模的互聯網公司才能承擔這樣的使命。

我們非常高興看到許多運營商也持開放的態(tài)度,參與到騰訊IDC的聯合運營中,我們也有理由相信,在整個云產業(yè)及數據中心行業(yè)的共同努力,我們?yōu)橛脩籼峁┑脑品眨欢〞粩嗵嵘?/p>

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  網站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉載  |  滾動資訊  |  English Version