美國當地時間4月21日早晨,位于北弗吉尼亞州的亞馬遜EC2、RDS 服務器出現了技術問題,導致網絡延遲及鏈接錯誤。亞馬遜的此次“云端”技術故障導致多個知名應用出現大規(guī)模停頓。受害者包括:Foursquare,Quora,HootSuite,Reddit。
我將這次技術故障稱為:云震,云端大地震。
IDC 的分析師 Matthew Eastwood 說:“這是對云計算的一次特別提醒?!痹普鹗菍υ朴嬎憷砟畹囊淮尉?。以往云所宣稱的“永不宕機的可靠性”其實只是一種期望。
簡單的去理解云,它是一種以最終計算能力和存儲能力為產品的信息服務,和以往機房提供的服務不同,客戶無需關心計算能力和存儲能力的由來。然而這項服務的根基仍然是機房服務??蛻艨梢圆魂P心云的運營,然而將這個概念擴展到“任何人無需關心云的運營”就不可取了。今天亞馬遜關心的不到位,就要客戶和終端用戶為這樣的不到位買單。
針對“云不是完美的”這項事實,全球的信息專家發(fā)出了各種設想,意在云震之后完善這個理念,讓各種服務繼續(xù)飄在云端。
分布式的云
Netflix是亞馬遜云服務的重要客戶,在此次云震中他們幸免于難。Netflix 的發(fā)言人 Steve Swasey 表示:我們充分利用了亞馬遜的冗余云架構,任何發(fā)生在單點的技術問題不會影響 Netflix 的業(yè)務。
將產品部署到地理位置更廣泛的云端去,同時啟用幾片云而不是一片云。是云震求生的第一條技能。
快速恢復
BigDoor是本次云震中另一個快速恢復服務的公司。總裁 Keith Smith 說:由于購買了亞馬遜的備份恢復服務,我們很快恢復了過來。不過這個服務只在弗吉尼亞數據中心才有。當然公司需要在費用和可靠性中尋求一個平衡點。
快速恢復也許現在的價格很高,但比起丟失用戶體驗,這些錢值得放進創(chuàng)業(yè)規(guī)劃中去。
陰謀論
此次云震的最大受害者是誰?亞馬遜云端上的那些創(chuàng)新企業(yè)。今天,已經有大量創(chuàng)新企業(yè)建筑在大公司提供的低廉的云端上。
會不會有天,當你不聽話了:搶掉了大公司的用戶,或者不同意某項由大公司股東提議的收購,接著,你的那片云就崩了。
云可能成為大公司談判的資本,云也有可能成為大公司操縱市場運作的籌碼。
可能,有可能。
創(chuàng)新公司有想法和團隊,但他們缺少機房和電纜。前者是他們賴以生存的氧氣,后者是他們賴以生存的水,缺了哪項都不行。
自建云
Facebook的馬克·扎克伯格是一位有遠見的技術狂人。在 Facebook 創(chuàng)建初期堅持儲備大于當前用戶數量10倍的計算與存儲作為業(yè)務的保障。在當他們還負擔不起自有機房的時期里,這項策略幫助 Facebook 邁過了一次次的用戶涌入而不至于崩盤?,F在 Facebook 將建造數據中心作為業(yè)務發(fā)展的重要任務予以對待,從機房設計到硬件配置始終親力親為。(近日,Facebook 將披露新建的一家數據中心的技術規(guī)格,其中包括計算機、電源、服務器機柜、電池備份系統(tǒng)和建筑設計的細節(jié)。Open Compute Project)
自建云,讓大企業(yè)的發(fā)展不受制約,并給予其制約其他企業(yè)的機會。
云震,終將過去。多難興邦,“多震興業(yè)”,希望如此吧。(原文鏈接:ifanr.com/38849)