0
本文作者: 李菁瑛 | 2020-11-26 12:32 |
據(jù)外媒報道,亞馬遜云端服務(wù)Amazon Web Services(AWS)25日遭遇了持續(xù)數(shù)小時的故障,導(dǎo)致部分網(wǎng)站和服務(wù)系統(tǒng)崩潰。
AWS的服務(wù)狀態(tài)頁面上的通知顯示,因其處理大量數(shù)據(jù)流的服務(wù)器Kinesis出現(xiàn)問題,導(dǎo)致一些網(wǎng)站的“錯誤率增加”,亞馬遜已經(jīng)對該問題進(jìn)行了修復(fù),但完全恢復(fù)還需要一段時間,并貼出了當(dāng)前受到影響的服務(wù)。
該故障主要影響美國東部地區(qū)的服務(wù),目前,AWS亞太區(qū)暫未受到波及。
最新更新(太平洋標(biāo)準(zhǔn)時間下午6:23):我們想提供一個關(guān)于影響美國東部1區(qū)內(nèi)Kinesis數(shù)據(jù)流API和其他相關(guān)服務(wù)的問題的更新。我們現(xiàn)在已經(jīng)減輕了對Kinesis中負(fù)責(zé)處理傳入請求的子系統(tǒng)的影響,不再看到錯誤率或延遲的增加。但是,我們還沒有完全承擔(dān)流量負(fù)載,正在努力放寬對服務(wù)的請求限制。在接下來的幾個小時里,我們希望將這些節(jié)流閥放寬到以前的水平。我們預(yù)計,隨著這一時間段的結(jié)束,客戶將開始恢復(fù)。
美國東部1號地區(qū)的CloudWatch指標(biāo)仍處于延遲狀態(tài)。一旦我們將Kinesis的限制恢復(fù)到以前的水平,我們將恢復(fù)CloudWatch度量功能。我們希望在那個階段看到CloudWatch度量的恢復(fù),以獲得新的度量,但是度量完全復(fù)原可能需要更長的時間。
我們將繼續(xù)向您通報我們的最新進(jìn)展。
據(jù)AWS稱,這次宕機(jī)僅影響亞馬遜23個地理AWS區(qū)域之一,但這個問題已經(jīng)嚴(yán)重到影響到了大量互聯(lián)網(wǎng)公司的服務(wù)。
許多公司在推特上吐槽有關(guān)AWS中斷如何影響它們的信息。
包括1Password、Acorns、Adobe Spark、Anchor、Autodesk、Capital Gazette、Coinbase、DataCamp、Getaround、Glassdoor、Flick、iRobot、《費(fèi)城問訊報》、Pocket、RadioLab、Roku、RSS播客、《坦帕灣時報》、Vonage、《華盛頓郵報》和紐約公共廣播電臺(WNYC)。專門監(jiān)測網(wǎng)絡(luò)狀況的網(wǎng)站Downdetector.com也顯示,全天許多用戶紛紛反映亞馬遜的不少服務(wù)出現(xiàn)了問題。
值得一提的是,正值北美“黑色星期五”前夕,AWS宕機(jī)可能影響到亞馬遜的電商業(yè)務(wù)。有賣家稱,其亞馬遜上的訂單數(shù)據(jù)突然急劇下降,甚至廣告費(fèi)用也出現(xiàn)了異常。
AWS是世界上使用最廣泛的云計算服務(wù)之一,因此,任何問題都可能對其他Web服務(wù)和應(yīng)用程序產(chǎn)生嚴(yán)重的連鎖反應(yīng),這一點(diǎn)可以從受今天宕機(jī)影響的公司數(shù)量中看出。
此前,AWS云存儲服務(wù)S3也曾在2017年出現(xiàn)大宕機(jī),該錯誤持續(xù)了4個小時,彼時AWS解釋稱該故障是由于一名程序員在調(diào)試系統(tǒng)的時候,運(yùn)行了一條原本打算刪除少量服務(wù)器的腳本,結(jié)果輸錯了一個字母,導(dǎo)致大量服務(wù)器被刪。被錯誤移除的服務(wù)其中運(yùn)行著兩套S3的子系統(tǒng),從而導(dǎo)致S3不能正常工作,S3 API處于不可用狀態(tài)。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。