當前位置:首頁 >  IDC >  云計算 >  正文

盤點 | 那些年,云計算廠商出過的十大故障

 2016-07-07 15:55  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

伴隨著云計算的發(fā)展,云計算技術(shù)、應(yīng)急響應(yīng)機制都日趨成熟和完善。多數(shù)情況,云計算平臺都能持續(xù)、穩(wěn)定的正常運行。

不過,因天氣或者其他原因,全球各地大大小小的云計算廠商過去幾年,確實發(fā)生過眾多大大小小的“著名”故障。

1、2009年6月,因分布式拒絕服務(wù)攻擊(DDoS),亞馬遜EC2服務(wù)宕機5小時。

2、2009年6月,Rackspace因供電設(shè)備跳閘,備份發(fā)電機失效,導(dǎo)致服務(wù)器大面積停機。

3、2010年5月,一周內(nèi),亞馬遜弗吉尼亞數(shù)據(jù)中心上演了三次不同的宕機。第一次是不間斷電源(UPS)轉(zhuǎn)換到備份電源時失敗,一整個機架的服務(wù)器停機。第二次發(fā)生在四天之后,因一個電源分配箱短路,導(dǎo)致服務(wù)中斷8小時。兩天后,一輛汽車撞擊了電線桿子,切斷了數(shù)據(jù)中心的電源,導(dǎo)致半小時宕機。

4、2011年4月22日,由于技術(shù)原因?qū)е聛嗰R遜在美國東部地區(qū)的許多服務(wù)中斷。這個故障持續(xù)了大約四天時間,被認為是亞馬遜史上最嚴重的云計算安全事件。

5、2012年2月28日,由于“閏年bug”導(dǎo)致微軟Azure在全球范圍內(nèi)大面積服務(wù)中斷,中斷時間超過24小時。

6、2014年8月18日,在Windows 8.01安全補丁例行發(fā)布后,Azure云因技術(shù)問題引發(fā)部分用戶中斷服務(wù)長達5個小時。微軟報告稱,Azure服務(wù)例如虛擬機網(wǎng)站、自動化、備份和站點恢復(fù)都在多個地區(qū)出現(xiàn)中斷。

7、2014年11月,Azure多個主要Region的存儲服務(wù)出現(xiàn)問題,引發(fā)11個小時的故障。該故障影響了19種Azure服務(wù),涉及12個Region,當時似乎只有澳大利亞數(shù)據(jù)中心幸免于難。

8、2014年11月2日中午12點,騰訊云在上海、廣州兩地的服務(wù)器出現(xiàn)故障,導(dǎo)致使用該服務(wù)器的用戶出現(xiàn)無法正常登錄、連接不穩(wěn)定等現(xiàn)象。故障持續(xù)約兩小時。

9、2015年6月6日,青云的服務(wù)商睿江科技機房因雷暴天氣引發(fā)電力故障,導(dǎo)致青云廣東1區(qū)全部硬件設(shè)備意外關(guān)機重啟,青云官網(wǎng)及控制臺無法訪問、部署于GD1的用戶業(yè)務(wù)不可用。

10、2016年7月6日,上午10點22分,阿里云華北2地域可用區(qū)A由于網(wǎng)絡(luò)設(shè)備出現(xiàn)異常,導(dǎo)致部分產(chǎn)品訪問受到影響。故障持續(xù)約1小時。

結(jié)束語 | 寫給所有云計算用戶的話

當企業(yè)把IT基礎(chǔ)設(shè)施托付給云服務(wù)商的時候,千萬別忘了你才是這些系統(tǒng)的主人。

美國知名電腦周刊雜志eWeek 資深科技記者Mike Elgan曾表示:“云計算不是萬靈丹,我們不過是租別人的計算機而已。因此自己數(shù)據(jù)中心可能出現(xiàn)的問題就算是轉(zhuǎn)向了云計算也依然存在”,他建議“企業(yè)有自己的替代方案很重要”。

Netflix的技術(shù)人員認為,不論在何種情況下,每個系統(tǒng)必須靠自己存活。所以,他們在設(shè)計系統(tǒng)時考慮了其所依賴的其他系統(tǒng)的故障并且能夠容忍故障。

從兩地三中心到同城雙活到異地多活,金融機構(gòu)、政府、大中型企業(yè)一直秉持“不把雞蛋放在一個籃子里”的思路,在災(zāi)備的路上越走越高精尖。

但是高精尖的背后是高昂的成本,對中小企業(yè)而言有些負擔(dān)過重。事實上,在云計算上也有對應(yīng)的服務(wù):地域(Region)和可用區(qū)(AZ:Availabe Zone)。所以對于自己的云端業(yè)務(wù),既可以分散到多個可用區(qū),也分散到多個地域。

除此之外,互聯(lián)網(wǎng)界對于系統(tǒng)如何達到高可用是有一些基本共識的,比如:大系統(tǒng)小做,服務(wù)拆分;并發(fā)控制,服務(wù)隔離;灰度發(fā)布;全方位監(jiān)控報警;核心服務(wù),平滑降級。這些最佳實踐,如果很好地落實,對于提高系統(tǒng)可用性非常有幫助。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標簽
云計算廠商

相關(guān)文章

熱門排行

信息推薦