網(wǎng)易科技訊 7月14日消息,11日下午2點到12日下午4點,藝龍旅游網(wǎng)出現(xiàn)了持續(xù)的訪問故障。據(jù)了解,該事件最初是EMC存儲設(shè)備出現(xiàn)故障,而由于藝龍網(wǎng)的存儲結(jié)構(gòu)不完善導致長時間無法修復(fù)。
此次事件在互聯(lián)網(wǎng)行業(yè)的系統(tǒng)架構(gòu)領(lǐng)域引發(fā)了很多的討論,藝龍因為這次宕機事件,其網(wǎng)站服務(wù)和呼叫中心業(yè)務(wù)也無法進行,據(jù)一些媒體計算,藝龍網(wǎng)這次直接損失超過14.7萬營業(yè)收入,而其對客戶造成的潛在影響無法估計。
EMC存儲出現(xiàn)問題引發(fā)連鎖反應(yīng)
11日下午,不斷有網(wǎng)友反應(yīng)藝龍網(wǎng)訪問出現(xiàn)錯誤,很快,官方就出現(xiàn)了“系統(tǒng)故障,正在修復(fù)中……”的提示。對于這家以網(wǎng)站和呼叫中心為主要經(jīng)營窗口的企業(yè)來說,此故障直接影響到業(yè)務(wù)運營。
12日早上8點,藝龍CEO崔廣福表示,藝龍的存儲系統(tǒng)出現(xiàn)故障,導致全部服務(wù)中斷,崔廣福稱藝龍和EMC的工程師已搶修18個小時。
至此,不少目光集中在EMC公司上,藝龍網(wǎng)使用的存儲產(chǎn)品由EMC提供,據(jù)接近現(xiàn)場人士透露,此次宕機也的確是存儲硬件出現(xiàn)問題,導致數(shù)據(jù)庫掛機,系統(tǒng)恢復(fù)需要較長時間造成。
12日下午呼叫中心恢復(fù)機票服務(wù),網(wǎng)站服務(wù)等在4點開始恢復(fù),到18點全部業(yè)務(wù)恢復(fù)運營。
備份架構(gòu)不完善導致維修時間較長
對于藝龍網(wǎng)這次出現(xiàn)問題的原因一時眾說紛紜,在不少人認為EMC硬件出現(xiàn)問題時,一些企業(yè)技術(shù)架構(gòu)人員開始聲援EMC。
丁香園網(wǎng)站CTO馮大輝在微博表示,EMC的產(chǎn)品不會持續(xù)到幾十個小時恢復(fù)不了,而一位網(wǎng)友也提到,“做為EMC的競爭對手也不得不說,這不只是硬件的問題”。
IT服務(wù)公司中達金橋的孫巍表示,他在12日到現(xiàn)場參與系統(tǒng)恢復(fù)。從他的復(fù)述中得知,EMC存儲硬件出現(xiàn)故障引發(fā)了整個事件,而由于藝龍對數(shù)據(jù)庫的備份不足,存儲層沒有災(zāi)備方案,導致系統(tǒng)恢復(fù)緩慢,雖然硬件很快恢復(fù)正常,系統(tǒng)仍然無法工作。
據(jù)深入介紹,企業(yè)在運營平臺的系統(tǒng)設(shè)備架構(gòu)中,為了應(yīng)對突發(fā)硬件、軟件故障,一般需要對各個層級的系統(tǒng)進行備份,比如在服務(wù)器端使用雙機熱備,在存儲層完成災(zāi)備,在軟件層做冗余工作。這樣任何一個環(huán)節(jié)出現(xiàn)問題都可以及時找到替代。
而在藝龍的事件中,藝龍的存儲架構(gòu)只預(yù)備了高性能架構(gòu)的集群備份,災(zāi)備的準備依賴唯一的存儲硬件,軟件層也缺少冗余準備,這樣存儲出現(xiàn)問題,事先準備的災(zāi)備準備也就不起作用。
“把所有雞蛋都放在一個籃子里,籃子出了問題,雞蛋就全碎了。”孫巍這么形容。
存儲行業(yè)的一些廠商人士在微博上紛紛表示,硬件不可能保證100%數(shù)據(jù)安全,要硬件保證不出現(xiàn)問題是不可能的,企業(yè)需要在架構(gòu)上減少硬件出錯對企業(yè)運營的影響。
到截稿為止,藝龍和EMC并沒有回復(fù)關(guān)于此事技術(shù)過程的疑問。
藝龍再次停機升級或為加強存儲系統(tǒng)
14日凌晨,藝龍網(wǎng)再次宣布停止運營7個小時,以實現(xiàn)系統(tǒng)升級。此前崔廣福在微博上發(fā)出“英雄帖”,邀請咨詢師、方案服務(wù)提供商、專家等為藝龍數(shù)據(jù)中心系統(tǒng)構(gòu)架、災(zāi)備方案及運維管理會診。這也說明藝龍對此次事件的重視。
業(yè)界人士認為,對于一個在線服務(wù)提供商,時刻在線和穩(wěn)定性成為消費者一種信賴和依靠,而出現(xiàn)系統(tǒng)完全停止服務(wù)將對客戶感受造成較大的影響。
據(jù)存儲技術(shù)人士透露,主要的容災(zāi)技術(shù)結(jié)構(gòu)已經(jīng)完善,各個單位采用不同的架構(gòu)主要原因還是因為成本問題。
也有人認為,這次的事件對于災(zāi)備行業(yè)來說將是一次促進,企業(yè)和政府單位在認識到意外發(fā)生的結(jié)果后會加大數(shù)據(jù)系統(tǒng)的投入。
推薦閱讀
在王興看來,創(chuàng)業(yè)成功不好定義,但創(chuàng)業(yè)失敗不外乎兩種,一種是“錢花完了”,另一種是“沒信心了”。創(chuàng)業(yè)者只要能避免這兩件事情發(fā)生,就還沒有失敗。如何避免創(chuàng)業(yè)失敗,其實就是如何避免沒錢和沒信心。 美團網(wǎng)首席執(zhí)>>>詳細閱讀
地址:http://www.sdlzkt.com/a/01/20111230/210301.html