日活上百萬(wàn)時(shí),騰訊產(chǎn)品如何提前規避服務(wù)器宕機風(fēng)險?
發(fā)表于:2017-05-15來(lái)源:騰訊作者:騰訊點(diǎn)擊數:
標簽:騰訊
外網(wǎng)問(wèn)題無(wú)小事!無(wú)論是游戲還是產(chǎn)品,騰訊經(jīng)歷過(guò)無(wú)數次服務(wù)器考驗,總結出一套通用的應用性能解決方案,WeTest壓測大師獨家開(kāi)放這份騰訊壓測能力,簡(jiǎn)化壓測流程,提升壓測效率。
眾所周知,優(yōu)異的應用
性能是良好用戶(hù)體驗的堅實(shí)基礎,而
服務(wù)器響應緩慢、卡頓、崩潰的產(chǎn)品,即便設計再精美也無(wú)法留住用戶(hù)的心。
2017年2月28日,百度就和用戶(hù)們開(kāi)了一個(gè)不大不小的玩笑,從當天的20點(diǎn)54分到21點(diǎn)24分左右,百度搜索整整宕機了30分鐘,眾多網(wǎng)友戲言那30分鐘成為了百度最有存在感的30分鐘,但是從后來(lái)百度的公關(guān)文章中,可以看到其提到了“錯過(guò)了大家上億次的搜索請求”,從這個(gè)體量來(lái)看,這無(wú)論如何都是一次很大的影響了。
無(wú)獨有偶,今日頭條也在今年的1月出現了宕機現象,系統超過(guò)30分鐘未響應,頭條號的編輯后臺也無(wú)法進(jìn)入,這些現象,均給用戶(hù)帶來(lái)了很大的困擾,而且用戶(hù)體量越大,影響的波及面就越廣,不僅影響用戶(hù)口碑,也影響產(chǎn)品收入。
如果把產(chǎn)品的月收入平攤到每一分鐘的話(huà),大家可以通過(guò)30分鐘,60分鐘,乃至12小時(shí),24小時(shí)的停服時(shí)間計算具體的損失金額,還要加上因此產(chǎn)生的用戶(hù)流失以及品牌口碑影響。
某國外知名游戲在上線(xiàn)之初沖擊到iOS免費榜第二名的時(shí)候,因為沒(méi)有做好應對大量玩家涌入的準備,服務(wù)器卡死、宕機,閃退讓玩家失望選擇離開(kāi),
下載排名一度下降到475,通過(guò)兩個(gè)月的服務(wù)器優(yōu)化才挽回局面。
這樣的例子有很多,隨著(zhù)重度游戲,重度產(chǎn)品越來(lái)越多,產(chǎn)品越來(lái)越重視服務(wù)器性能的優(yōu)化。本文將結合騰訊WeTest團隊為騰訊游戲及產(chǎn)品進(jìn)行服務(wù)器壓測的經(jīng)驗,分享一些方法和思路。
服務(wù)器性能核心指標有哪些
關(guān)于服務(wù)器壓測,有很多指標。為了讓大家更容易理解,舉個(gè)生活中的例子:
你中午去“海底撈”吃飯。
我們可以把“海底撈”這個(gè)飯店看成一個(gè)
被測系統。
你去吃飯,就是對這個(gè)被測系統發(fā)起
請求,對這個(gè)系統造成了一定的
負載。你帶去的人越多,那么這個(gè)餐館就越繁忙,可以說(shuō)餐館承受的負載就越大。
你開(kāi)始點(diǎn)菜。這個(gè)時(shí)候你隔壁桌的人也開(kāi)始點(diǎn)菜。那么你們兩個(gè)對這個(gè)系統產(chǎn)生了
并發(fā)的請求。同時(shí),其他桌有的在吃菜,有的在等菜,這些都是并發(fā)進(jìn)行的
事務(wù)。一個(gè)完整的吃飯事務(wù)可以定義成包括:點(diǎn)菜,下單,上菜,買(mǎi)單四個(gè)步驟。對于一個(gè)C/S的系統來(lái)說(shuō),可以對應于:建立連接,發(fā)送請求,接受應答,斷開(kāi)連接。
影響一個(gè)餐館生意好壞的一個(gè)重要原因是上菜速度。上菜速度體現在兩個(gè)方面:
1.一個(gè)顧客請求的處理耗時(shí),從下單到上菜中間等待的時(shí)間,我們稱(chēng)之為
響應時(shí)間。
2.這個(gè)餐館同時(shí)為多名顧客上菜的頻率,我們稱(chēng)之為
吞吐量。
來(lái)多少顧客,這是飯店自己無(wú)法控制的,但是飯店的上菜速度、餐位多少都會(huì )制約客流量。一定有一個(gè)峰值客流量,當來(lái)的客人超過(guò)了這個(gè)峰值,那么這些客人就會(huì )等位,或者是上菜速度超慢讓客人無(wú)法容忍。容量
測試就是通過(guò)工具模擬足夠多的顧客來(lái)吃飯的事務(wù),希望找到這樣一個(gè)客流量對飯店產(chǎn)生一定的負載,這個(gè)時(shí)候飯店既能接待最多的客戶(hù)同時(shí)也能保證最短的等待時(shí)間。更多的,還可以對這個(gè)酒樓人員配置和餐位設置等進(jìn)行調優(yōu),以期達到一個(gè)最理想的資源利用率和效率。
客流量跟進(jìn)來(lái)的客人多少有關(guān),也跟餐館的接待能力有關(guān)。單方面增加來(lái)就餐的顧客,遭到投訴的可能性就越大,上錯菜的可能性也越大。
性能指標有很多,不可能全都看,那么有哪些核心的指標呢?
1、90%響應時(shí)間
是指所有用戶(hù)的響應時(shí)間由小到大進(jìn)行排序,第90%的響應時(shí)間,是用來(lái)評估系統容量的重要指標之一。
2、TPS性能,關(guān)注服務(wù)器的服務(wù)能力。
每秒系統處理事務(wù)(通過(guò)、失敗以及停止)的數量。通過(guò)它可以確定系統在任何給定時(shí)刻的時(shí)間事務(wù)負載。
3、支持的最大在線(xiàn)人數。
指同時(shí)登錄站點(diǎn)的最大人數或者服務(wù)器同時(shí)接收下載的最大數量。
原文轉自:http://kjueaiud.com/ceshi/news/itdongtai/2017/0515/208439.html