阿里云再次發(fā)生故障,這已是2019年的第二起。
3月2日23時(shí)55分左右,阿里云開始出現(xiàn)大規(guī)模宕機(jī)故障,位于華北地區(qū)的多家互聯(lián)網(wǎng)公司的IT運(yùn)維人員發(fā)現(xiàn)多個(gè)APP和網(wǎng)站開始陷入卡頓。這場(chǎng)事故,持續(xù)了三個(gè)小時(shí)左右。經(jīng)緊急排查處理后,3月3日早間云服務(wù)全部恢復(fù)正常。針對(duì)故障,阿里云表示會(huì)根據(jù)SLA協(xié)議(服務(wù)合同),盡快處理賠償事宜。
十天前,阿里云今年的第一起事故被曝光。2月22日,有媒體報(bào)道了阿里云云效平臺(tái)的源代碼泄露問題,涉及40 家企業(yè)共 200 余項(xiàng)目,甚至還波及用戶隱私敏感數(shù)據(jù)。此事還引起了“Internal之爭(zhēng)”,即Internal權(quán)限到底是公司內(nèi)部公開還是對(duì)整個(gè)云效平臺(tái)公開,不同企業(yè)有不同理解,但最終還是造成了源碼泄露。后來,阿里云就此事作出回應(yīng),并在網(wǎng)站醒目標(biāo)識(shí)并給出告警。
事實(shí)上,阿里云源代碼泄露問題在去年8月就已被用戶發(fā)現(xiàn),只是到今年2月份才被媒體曝出。
一
縱觀近幾年云計(jì)算發(fā)展,云計(jì)算事故就沒有停止過。
不管是知名云計(jì)算廠商,還是剛上路的云計(jì)算初創(chuàng)企業(yè),服務(wù)器中斷以及客戶數(shù)據(jù)丟失等問題,頻頻困擾著云計(jì)算企業(yè)。
2012年圣誕節(jié)前夕,亞馬遜AWS的彈性負(fù)載均衡服務(wù)出錯(cuò),導(dǎo)致Netflix停機(jī)。
2014年11月18日,由于軟件更新及性能增加,微軟zure存儲(chǔ)服務(wù)發(fā)生大規(guī)模斷電,這種情況在2015年12月再次發(fā)生。
2016年5月9日,Salesforce.com的硅谷NA14實(shí)例脫機(jī),導(dǎo)致其斷電超過24個(gè)小時(shí)。從那之后,Salesforce將其大部分工作量轉(zhuǎn)移到了AWS上。
2016年10月21日,甲骨文旗下的DYN(DNS業(yè)務(wù))遭遇了一系列分布式拒絕服務(wù)(DDoS)攻擊,致使Airbnb、Twitter、 Amazon、Ancestry、 Netflix及PayPal等公司的業(yè)務(wù)均受到不同程度的影響。
二
即便云計(jì)算安全技術(shù)及防御設(shè)施不斷進(jìn)步,云計(jì)算故障仍舊時(shí)有發(fā)生。據(jù)不完全統(tǒng)計(jì),單是2018年就有數(shù)十起云計(jì)算故障發(fā)生,涉及國(guó)內(nèi)外各大知名云計(jì)算平臺(tái)。其中比較有影響的,包括以下幾個(gè)事故。
4月6日,微軟Office 365和Azure Active Directory訪問出現(xiàn)問題,幾年來微軟云計(jì)算出現(xiàn)多次此類故障。
6月15日,因重復(fù)分配內(nèi)部IP地址,谷歌云虛擬機(jī)實(shí)例大量出現(xiàn)聯(lián)不上網(wǎng)的問題。
6月27日,由于運(yùn)維失誤,導(dǎo)致一些客戶訪問阿里云官網(wǎng)控制臺(tái)和使用部分產(chǎn)品功能時(shí)出現(xiàn)問題。受影響范圍包括阿里云官網(wǎng)控制臺(tái),以及MQ、NAS、OSS等產(chǎn)品功能。這次故障被阿里云內(nèi)部定義為S1級(jí)別(在阿里巴巴的線上業(yè)務(wù)故障級(jí)別中,對(duì)S1的定義是:核心業(yè)務(wù)重要功能不可用,影響部分用戶,造成一定損失)。
7月24日,騰訊云廣州區(qū)域部分用戶出現(xiàn)資源訪問失敗、控制臺(tái)登錄異常等情況。經(jīng)排查,是因騰訊云廣州一區(qū)的主備兩條運(yùn)營(yíng)商網(wǎng)絡(luò)鏈路同時(shí)中斷所導(dǎo)致。但業(yè)內(nèi)人士均知,兩條運(yùn)營(yíng)商網(wǎng)絡(luò)鏈路同時(shí)被挖斷的情況并不常見,所以對(duì)騰訊云這次事故的主要原因仍有存疑。
8月,騰訊云發(fā)生故障,直接導(dǎo)致北京的一家初創(chuàng)公司數(shù)據(jù)全部丟失。事實(shí)上,此事發(fā)生于7月,只是到8月才被曝光。
三
在2018年的云計(jì)算事故中,影響面比較廣的當(dāng)屬騰訊云的兩次故障事件。
第一個(gè)事件,正是上文提到的初創(chuàng)公司數(shù)據(jù)丟失事件。
2018年7月,北京一家主要產(chǎn)品為“前沿?cái)?shù)控自媒體”初創(chuàng)公司,在騰訊云的存儲(chǔ)數(shù)據(jù)全部丟失了。某個(gè)是時(shí)間段,前沿?cái)?shù)控的程序員發(fā)現(xiàn)無法登錄云服務(wù)器,就反饋給騰訊云。得到的回復(fù)是“北京三區(qū)部分云硬盤出現(xiàn)故障,正在緊急恢復(fù)中”。
幾天后,騰訊云告知前沿?cái)?shù)控,這些丟失的數(shù)據(jù)無法找回了。于是,雙方開始賠償協(xié)商。前沿?cái)?shù)控索賠1101.6萬元,而騰訊云只愿意賠償13.29萬,雙方陷入僵持。
而此事之所以傳播開去,是因?yàn)轵v訊云承諾9個(gè)9(騰訊云承諾99.9999999%的數(shù)據(jù)可靠性)的安全保障,也沒能保住前沿?cái)?shù)控的數(shù)據(jù),且不能給予客戶認(rèn)為合理的賠償,進(jìn)而引發(fā)了諸多云服務(wù)使用者的熱烈討論。最終輿論演變?yōu)椋把財(cái)?shù)控在操作上存在失誤,但騰訊云服務(wù)的可靠性到底又有多高?廣告宣傳又有多少真實(shí)的存在?
此事表明,即便云服務(wù)商給予再高的承諾,云服務(wù)使用者也應(yīng)本著對(duì)數(shù)據(jù)服務(wù)的態(tài)度,數(shù)據(jù)一定要多云或者異地備份,不能完全依賴云服務(wù)商。否則,一但出現(xiàn)問題,就是賠償?shù)脑俣?,之前的?jīng)營(yíng)數(shù)據(jù)也是無法挽回,甚至足以毀掉一個(gè)項(xiàng)目。
四
如果說數(shù)據(jù)丟失事故屬于“天災(zāi)”,那騰訊云的第二個(gè)事故則可以歸結(jié)為“人禍”。2018年8月,女性短視頻社區(qū)App“她拍”上線了一款名為“她face+”的P圖小程序,可將用戶五官和臉型融合到其他圖片素材中。她拍與騰訊云簽訂一年合同,購(gòu)買其云服務(wù)及一項(xiàng)名為“人臉融合”的技術(shù)服務(wù),每月支付500萬左右費(fèi)用。
騰訊云的“人臉融合”技術(shù)由天天P圖提供支持,此前兩個(gè)團(tuán)隊(duì)均屬騰訊SNG事業(yè)群。9月27號(hào)天天P圖停止向騰訊云提供技術(shù)支持,并力推同類小程序“瘋狂變臉”。期間恰逢騰訊架構(gòu)調(diào)整,因分屬不同事業(yè)群兩團(tuán)隊(duì)溝通協(xié)商難度加大。雙方多次溝通,但原合同無法繼續(xù)履行。
最終,10月17日達(dá)成結(jié)果,45天過渡期后“天天P圖”不再為“她face+”提供技術(shù)支持服務(wù)?!八摹眲?chuàng)始人王宏達(dá)認(rèn)為騰訊為推同類產(chǎn)品損害企業(yè)客戶的利益,起訴起訴騰訊云違約,并索賠一個(gè)億。
這個(gè)事件,意味著企業(yè)上云用云的風(fēng)險(xiǎn)除了云計(jì)算平臺(tái)本身,還有很大的人為因素在內(nèi)。這也是很多企業(yè)一直擔(dān)心的問題,如果核心數(shù)據(jù)與模式被云計(jì)算廠商掌握并推出同類產(chǎn)品,企業(yè)又該如何是好?云計(jì)算廠商能夠拿到所服務(wù)企業(yè)的任何數(shù)據(jù),想要擠兌競(jìng)品那是易如反掌之事。
五
看完上面所述事故,大家應(yīng)該已經(jīng)發(fā)現(xiàn),云計(jì)算事故難以避免,至少現(xiàn)在這個(gè)階段是這樣。但是在工業(yè)互聯(lián)網(wǎng)發(fā)展的大趨勢(shì)下,企業(yè)上云的進(jìn)程又是不可逆的,換言之就是不管企業(yè)如何考慮及看待云計(jì)算,最終都要主動(dòng)或者被動(dòng)上云的。因此,對(duì)亟待互聯(lián)網(wǎng)轉(zhuǎn)型的企業(yè)而言,云計(jì)算安全的問題就變成了出現(xiàn)事故如何賠償?shù)膯栴}。
其實(shí)對(duì)企業(yè)來說,要解決上云安全問題,至少要遵循兩點(diǎn):一是將安全提到最高,二是把損失降到最低。這兩點(diǎn),對(duì)于云計(jì)算平臺(tái)和上云企業(yè)都非常重要。
偉哥認(rèn)為,在安全問題上,云計(jì)算平臺(tái)當(dāng)盡量做到以下幾點(diǎn):
首先,云計(jì)算平臺(tái)當(dāng)盡量通過技術(shù)及管控手段將安全事故率降到最低,但再先進(jìn)的技術(shù)也不能保證萬無一失,仍舊需要相應(yīng)的運(yùn)營(yíng)措施保證安全的最大化。
其次,還要在維護(hù)人員的管理方面,做更詳盡的管理規(guī)劃,杜絕技術(shù)之外的人為安全因素。
同時(shí),還要明確安全責(zé)任問題,便于發(fā)生事故之后在處理問題上有據(jù)可依。對(duì)于這一點(diǎn),目前很多廠商都已在做,譬如AWS和阿里云和AWS都提出了安全責(zé)任共擔(dān)模型,阿里云負(fù)責(zé)云平臺(tái)基礎(chǔ)安全防護(hù),用戶負(fù)責(zé)虛擬化層以上的組件安全、業(yè)務(wù)安全等。
還有一點(diǎn),云平臺(tái)作為服務(wù)提供方,應(yīng)該對(duì)企業(yè)用戶提供一定的安全使用培訓(xùn),確保每個(gè)客戶全面了解云計(jì)算的應(yīng)用操作,避免因誤操作而造成平臺(tái)與企業(yè)的多方損失。
六
從企業(yè)用戶安全角度考慮,云計(jì)算安全就是企業(yè)應(yīng)該學(xué)會(huì)識(shí)云用云。
首先,企業(yè)要有上云安全意識(shí)。當(dāng)時(shí)刻提醒企業(yè)管理者云計(jì)算安全的重要性,云平臺(tái)安全措施并不能保障數(shù)據(jù)的絕對(duì)安全。
其次,企業(yè)上云盡量不要把雞蛋放到同一個(gè)籃子。一但云計(jì)算平臺(tái)出現(xiàn)事故,就有可能導(dǎo)致企業(yè)多年經(jīng)營(yíng)全軍覆沒。目前來說,多云方案是最有效的降低數(shù)據(jù)丟風(fēng)險(xiǎn)的手段,企業(yè)應(yīng)該將多云方案應(yīng)該由之前的備選方案轉(zhuǎn)變?yōu)槭走x,以將數(shù)據(jù)安全隱患降到最低。
第三,對(duì)于沒有能力搞混合云以及多云方案的初創(chuàng)企業(yè),要學(xué)會(huì)“狡兔三窟”。除了應(yīng)用云計(jì)算之外,至少應(yīng)該做到數(shù)據(jù)的異地存儲(chǔ),以免出現(xiàn)“前沿?cái)?shù)控”哪種數(shù)據(jù)全丟的情況。
第四,小企業(yè)在大型云計(jì)算平臺(tái)往往會(huì)受到不公待遇,還需一定的監(jiān)管及規(guī)則。小微企業(yè)話語權(quán)小,甚至?xí)霈F(xiàn)上述案例中被“隨意處置”的情況。關(guān)于這一點(diǎn),呼吁相關(guān)機(jī)構(gòu)盡快介入監(jiān)管,以確保在推動(dòng)企業(yè)上云的同時(shí),保證中小企業(yè)的合法權(quán)益。
第五,企業(yè)要盡量了解各種云計(jì)算平臺(tái)。公有云、混合云、私有云每個(gè)方案都不是唯一的,上云企業(yè)出于安全考慮,當(dāng)充分了解幾種類型的優(yōu)缺點(diǎn),然后根據(jù)企業(yè)自身情況選擇不同方案,以確保企業(yè)數(shù)據(jù)的絕對(duì)安全。
此外,企業(yè)亦應(yīng)多關(guān)注更多保障安全的途徑。在理賠方面,除了云平臺(tái)的賠償,上云企業(yè)亦可關(guān)注一下相關(guān)理財(cái)機(jī)構(gòu)推出的云保險(xiǎn)等安全理賠項(xiàng)目。
七
得益于工業(yè)互聯(lián)網(wǎng)的快速發(fā)展,企業(yè)上云乃是大勢(shì)所趨。政策及經(jīng)濟(jì)形勢(shì)造就了企業(yè)上云紅利,云計(jì)算廠商規(guī)模得以快速擴(kuò)大。但在擴(kuò)大的同時(shí)更要保證用戶的數(shù)據(jù)安全,只有解決了安全問題才能打消企業(yè)心中顧慮,才能讓企業(yè)安心選擇云服務(wù)廠商,安心上云。
所以,阿里云、騰訊云等多個(gè)云計(jì)算平臺(tái)的事故,反映的是整個(gè)云計(jì)算行業(yè)當(dāng)前存在的安全問題。解決或者不能說明這些安全問題,無疑會(huì)對(duì)即將上云的企業(yè)造成一定的心理阻礙。
事實(shí)上,平臺(tái)與用戶雙方誰也不想發(fā)生安全事故。但若出現(xiàn)問題,平臺(tái)就應(yīng)確保以更穩(wěn)妥合理的方式去解決問題。不然,就會(huì)造成企業(yè)對(duì)云計(jì)算平臺(tái)的信任度下降。
上文也有提及,綜合而言解決用戶信任問題關(guān)鍵在于兩點(diǎn):
一是如何盡量避免出現(xiàn)此類問題。一方面需要云服務(wù)商在安全層面上做足功夫,優(yōu)先保障云服務(wù)的安全最大化;另一方面從用戶角度考慮云服務(wù)商的便捷性與安全性,只有讓用戶以最簡(jiǎn)單的方式享受高效安全的云服務(wù),使安全問題概率降到最低,才能增加用戶的信任感,進(jìn)而實(shí)現(xiàn)口碑效應(yīng)。
二是出現(xiàn)問題之后,如何妥善的處理。隨著企業(yè)上云數(shù)量的增加,可以預(yù)見今后此類事件會(huì)更多。以前此類事件可能影響不會(huì)太大,但現(xiàn)在安全事件的發(fā)生概率關(guān)聯(lián)著潛在上云企業(yè)對(duì)云服務(wù)商的品牌形象的認(rèn)知。對(duì)某些小問題處理不當(dāng),可能就會(huì)引發(fā)用戶的不滿,進(jìn)而放棄使用云服務(wù)。所以,不怕出現(xiàn)問題,怕的是出現(xiàn)問題以后不能妥善合理的解決。只要云計(jì)算平臺(tái)能夠妥善解決善后問題,其他問題的解決也就不在話下了。
最后,偉哥再次叮囑云平臺(tái)與企業(yè)都要引以為戒,盡量避免出現(xiàn)云計(jì)算事故造成企業(yè)重大損失的情況。
工業(yè)互聯(lián)網(wǎng)趨勢(shì)下的企業(yè)上云大有可為,希望云平臺(tái)和正在數(shù)字化轉(zhuǎn)型的企業(yè),都能最大化享受這波紅利。
【王吉偉,關(guān)注IOT與TMT,專注工業(yè)互聯(lián)網(wǎng)及企業(yè)數(shù)字化轉(zhuǎn)型研究。公號(hào)ID:jiwei1122】
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。