ITBear旗下自媒體矩陣:

快速應(yīng)對(duì)年度峰值,微博基于阿里云與Docker的混合云實(shí)踐

   時(shí)間:2016-03-31 14:17:41 來源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評(píng)論無障礙通道

面對(duì)不期而至的流量高峰,在最短的時(shí)間內(nèi)將服務(wù)器部署規(guī)模擴(kuò)大1倍,微博是如何實(shí)現(xiàn)的?

近日,微博研發(fā)中心高級(jí)架構(gòu)師劉道儒和阿里云云上技術(shù)服務(wù)負(fù)責(zé)人丁原接受CSDN記者專訪,介紹了微博如何基于阿里云的混合云方案和Docker等開源技術(shù)構(gòu)建混合云平臺(tái)來應(yīng)對(duì)業(yè)務(wù)發(fā)展中面臨的流量峰值挑戰(zhàn)。

微博的混合云需求

作為典型的社交媒體平臺(tái),微博的IT架構(gòu)面臨的一大挑戰(zhàn)就是流量峰值,包括可預(yù)期峰值流量和隨機(jī)峰值流量兩種。前者如春晚和紅包的雙重刺激,后者如范冰冰李晨事件,都會(huì)導(dǎo)致微博發(fā)布量和請(qǐng)求量暴增,包括大量的圖像和視頻,超出了冗余服務(wù)器所能實(shí)現(xiàn)的最大負(fù)載。

以2016年春節(jié)為例,新浪微博日活躍用戶達(dá)到1.34億,同比去年增長31%。春晚直播期間,討論春晚的微博達(dá)到5191萬條,網(wǎng)友互動(dòng)量達(dá)到1.15億,增長76%,春晚相關(guān)話題的總閱讀量達(dá)到182億次。截至除夕24點(diǎn),網(wǎng)友搶微博紅包的總次數(shù)超過8億次。

社交媒體如微博一直都是各類熱點(diǎn)事件的爆發(fā)地,除了過年過節(jié)的流量峰值之外,隨機(jī)熱點(diǎn)事件帶來的流量峰值是很難預(yù)測(cè)到和提前做準(zhǔn)備的,系統(tǒng)對(duì)穩(wěn)定性和彈性伸縮都有極高的要求。相比傳統(tǒng)的提前預(yù)估流量峰值去采購并部署服務(wù),周期非常長,而且隨機(jī)熱點(diǎn)事件完全無法預(yù)測(cè)發(fā)生時(shí)間,很難做得到準(zhǔn)實(shí)時(shí)的快速擴(kuò)容,通過混合云架構(gòu),企業(yè)把公共云計(jì)算當(dāng)做自有機(jī)房的延伸,利用云計(jì)算快速的應(yīng)對(duì)節(jié)日和突發(fā)流量峰值帶來的海量彈性資源擴(kuò)容需求,快速借用公共云的計(jì)算能力為己所用,充分發(fā)揮云計(jì)算的彈性伸縮能力,業(yè)務(wù)峰值流量過去后,又迅速將公共計(jì)算資源快速釋放掉,避免了高峰期后的閑置浪費(fèi)。

當(dāng)然,像微博這樣具有大量傳統(tǒng)IT資產(chǎn)的企業(yè),短期把業(yè)務(wù)全部放到公共云計(jì)算也不太現(xiàn)實(shí),這需要一個(gè)過程,混合云會(huì)架構(gòu)是個(gè)很好的上云過渡路徑。對(duì)微博來說,混合云的部署對(duì)公共云平臺(tái)和微博技術(shù)團(tuán)隊(duì)也存在很大的挑戰(zhàn)。

需要選擇性能指標(biāo)能夠滿足微博高并發(fā)需求的公共云資源,例如充足的冗余資源、高速緩存以及網(wǎng)絡(luò)帶寬等,并且冗余資源具備一套快速分發(fā)、快速釋放的機(jī)制。

公共云資源需要和內(nèi)部服務(wù)器資源實(shí)現(xiàn)無縫銜接,所有資源網(wǎng)絡(luò)對(duì)業(yè)務(wù)系統(tǒng)來說是一致的,同時(shí)還要保證數(shù)據(jù)訪問和傳輸?shù)陌踩浴?/p>

內(nèi)部業(yè)務(wù)系統(tǒng)的架構(gòu)需要改造以適應(yīng)新的擴(kuò)展模式,能夠快速通過API擴(kuò)容,具備成熟的發(fā)布體系。

微博的混合云實(shí)踐

從資源、技術(shù)、團(tuán)隊(duì)各方面考慮,微博選擇基于阿里云構(gòu)建混合云平臺(tái)。如前所述,實(shí)現(xiàn)混合云,微博方面需要做內(nèi)部系統(tǒng)的改造,而對(duì)于阿里云來說,和微博的此次合作時(shí)間緊任務(wù)重,挑戰(zhàn)重重。

好在阿里云歷經(jīng)2015年天貓雙11這一全球最大規(guī)模的混合云實(shí)踐考驗(yàn),丁原表示,對(duì)于現(xiàn)在的阿里云來說,通過ECS鏡像、ESS彈性伸縮等功能,應(yīng)用快速部署1000臺(tái)的效率幾乎和1臺(tái)的效率是相當(dāng)?shù)模鎸?duì)突發(fā)性業(yè)務(wù)峰值壓力可快速通過云服務(wù)器ECS速實(shí)現(xiàn)大規(guī)模的服務(wù)器擴(kuò)容。

更重要的是,阿里云專門挑選經(jīng)歷雙11考驗(yàn)的資深技術(shù)專家組建了一個(gè)護(hù)航團(tuán)隊(duì),針對(duì)客戶業(yè)務(wù)壓力暴漲的情況提供全面的系統(tǒng)保障服務(wù)即護(hù)航服務(wù),現(xiàn)場模擬業(yè)務(wù)狀況和排查問題。護(hù)航的內(nèi)容包括:系統(tǒng)化現(xiàn)有瓶頸定位,模擬真實(shí)業(yè)務(wù)場景進(jìn)行系統(tǒng)壓測(cè)和容量摸底,峰值系統(tǒng)容量評(píng)估和擴(kuò)容方案設(shè)計(jì),安全保障,應(yīng)用優(yōu)化,數(shù)據(jù)庫優(yōu)化等,為客戶提供護(hù)航期間的全程應(yīng)急技術(shù)保障,協(xié)同客戶一起保障系統(tǒng)順利度過業(yè)務(wù)峰值。同時(shí),護(hù)航會(huì)針對(duì)系統(tǒng)現(xiàn)有問題設(shè)計(jì)改造方案,以更貼近云計(jì)算和互聯(lián)網(wǎng)架構(gòu)來設(shè)計(jì)現(xiàn)有的業(yè)務(wù)系統(tǒng),應(yīng)對(duì)未來更大的流量峰值。

與此同時(shí),微博也通過熱門的Docker技術(shù)來抹平業(yè)務(wù)差異性實(shí)現(xiàn)快速擴(kuò)容。事實(shí)上,微博于2014年4月就開始研究Docker,2015年1月完成內(nèi)網(wǎng)上線,經(jīng)過2016年元旦的測(cè)試,在2016年春節(jié)進(jìn)行首次大規(guī)模應(yīng)用。大規(guī)模部署Docker的目的,很大程度上就是為了滿足快速、彈性擴(kuò)展的需求。因此,微博對(duì)Docker的主要運(yùn)用就是Registry,可以快速創(chuàng)建和銷毀,同時(shí)不需要為Docker目前存在的一些還不成熟的或者復(fù)雜的功能買單。

劉道儒介紹,微博對(duì) Docker Registry做了如下的主要改進(jìn):

前端部署了Nginx,并配置轉(zhuǎn)發(fā)策略,兼容Docker1.3+所有版本。

后端存儲(chǔ)均使用Ceph,便于彈性擴(kuò)容。

阿里云中使用二級(jí)緩存的部署結(jié)構(gòu),二級(jí)緩存可迅速擴(kuò)容,提高分發(fā)效率,同時(shí)減小回穿內(nèi)網(wǎng)的請(qǐng)求量。

高可用和性能的優(yōu)化。

圖片描述

劉道儒說:“通過這樣的改造之后,阿里云資源和微博原有的資源組成的池子對(duì)業(yè)務(wù)系統(tǒng)來說并無區(qū)別,但擴(kuò)容更加無邊界和靈活。由此,微博實(shí)現(xiàn)了從提前擴(kuò)容到實(shí)時(shí)擴(kuò)容服務(wù)器的升級(jí),可以結(jié)合實(shí)際的流量負(fù)載與實(shí)時(shí)數(shù)據(jù)分析對(duì)預(yù)估峰值進(jìn)行動(dòng)態(tài)調(diào)整,一旦發(fā)現(xiàn)請(qǐng)求量有暴漲趨勢(shì),就可以啟動(dòng)應(yīng)急方案,在最短的時(shí)間之內(nèi)將服務(wù)器部署規(guī)模擴(kuò)大一倍。”

微博在應(yīng)對(duì)2016年春節(jié)峰值流量時(shí)上了1400多臺(tái)云服務(wù)器ECS,其中核心業(yè)務(wù)需要800多臺(tái)。當(dāng)監(jiān)控系統(tǒng)發(fā)現(xiàn)資源使用量達(dá)到預(yù)先設(shè)定的閾值,就會(huì)自動(dòng)申請(qǐng)阿里云資源。通過混合云擴(kuò)容,相對(duì)于之前提前擴(kuò)容的方案,資源成本節(jié)約40%,同時(shí)運(yùn)維工程師也擺脫了很多基礎(chǔ)類的手工運(yùn)維的工作,將精力放在系統(tǒng)開發(fā)等工作。

關(guān)于未來的計(jì)劃,劉道儒表示,主要精力還是不斷完善系統(tǒng)。例如,PHP體系帶本地緩存,其機(jī)器日常的管理,如容量評(píng)估、上線/下線,還不能完全自動(dòng)化,還需要提煉一個(gè)比較通用的解決方案。

阿里云的混合云觀

事實(shí)上,阿里云的混合云、護(hù)航服務(wù)不僅僅在于微博。其他的社交媒體公司,比如陌陌,在海量圖片存儲(chǔ)、大數(shù)據(jù)分析方面,也在通過阿里云技術(shù)提高用戶體驗(yàn)。丁原介紹,除了社交媒體行業(yè),護(hù)航保障服務(wù)基本覆蓋到了各行各業(yè),包括游戲,金融,網(wǎng)站,電商,物流,網(wǎng)站,政企行業(yè)等,典型的包括12306春運(yùn),新浪微博,芒果TV,天弘基金,世界互聯(lián)網(wǎng)大會(huì),紅嶺創(chuàng)投等。

在阿里云看來,優(yōu)秀的混合云技術(shù)架構(gòu)需要滿足如下特點(diǎn):

對(duì)客戶來說,公共云和專有云要有一致的開發(fā)和管理體驗(yàn),業(yè)務(wù)體驗(yàn)是無縫的。

從IaaS到PaaS的全棧架構(gòu),讓客戶能夠真正按照資源配比實(shí)現(xiàn)混合云,實(shí)現(xiàn)如傳統(tǒng)虛擬化的功能。

要做到無縫的體驗(yàn),VPC是一個(gè)重要的功能,VPC完全當(dāng)做物理網(wǎng)絡(luò)的隔離,實(shí)現(xiàn)多租戶,并允許客戶定制自己的網(wǎng)絡(luò),這是公共云多租戶無法實(shí)現(xiàn)的。阿里云VPC在開始設(shè)計(jì)的時(shí)候充分考慮企業(yè)級(jí)應(yīng)用對(duì)網(wǎng)絡(luò)穩(wěn)定性、靈活性、高性能、高可用、大容量和功能豐富性的要求,在架構(gòu)設(shè)計(jì)和功能實(shí)現(xiàn)上兼顧了多方面的要求。同時(shí),阿里云VPC還可以輕松實(shí)現(xiàn)不同地域之間的互聯(lián),用戶點(diǎn)點(diǎn)鼠標(biāo)就可以擁有一條跨地域的專線。

丁原表示,阿里云是一個(gè)開放的平臺(tái),在選擇混合云合作伙伴的時(shí)候,主要關(guān)注合作伙伴是否可以和阿里云形成優(yōu)勢(shì)互補(bǔ),通過技術(shù)或者商業(yè)合作給客戶提供真正有價(jià)值的混合云解決方案,解決客戶的痛點(diǎn)問題。客戶的IT環(huán)境是多種多樣的,發(fā)展階段和發(fā)展路徑也不盡相同,阿里云會(huì)持續(xù)擴(kuò)展生態(tài),和合作伙伴一起,提供多種解決方案滿足不同客戶的不同應(yīng)用場景。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version