最新消息指出,2003年8月14日發(fā)生的美國及加拿大部分地區(qū)史上最大停電事故是由軟件錯誤所導(dǎo)致。 著名安全機(jī)構(gòu)SecurityFocus的數(shù)據(jù)表明,位于美國俄亥俄州的第一能源(FirstEnergy)公司下屬的電力監(jiān)測與控制管理系統(tǒng)“XA/21”出現(xiàn)軟件錯誤,是北美大停電的罪魁禍?zhǔn)。專家對這套廣泛分布的系統(tǒng)的進(jìn)行了持續(xù)數(shù)周的極為細(xì)致的代碼檢查,以便找出導(dǎo)致錯誤的程序所在。根據(jù)第一能源公司發(fā)言人提供的數(shù)據(jù),由于系統(tǒng)中重要的預(yù)警部分出現(xiàn)嚴(yán)重故障,負(fù)責(zé)預(yù)警服務(wù)的主服務(wù)器與備份服務(wù)器接連失控,使得錯誤沒有得到及時通報和處理,最終多個重要設(shè)備出現(xiàn)故障導(dǎo)致大規(guī)模停電。
預(yù)警系統(tǒng)崩潰后沒有接收到更多的警報更沒法向外傳播,操作員并不知道預(yù)警系統(tǒng)已經(jīng)失效,他們發(fā)現(xiàn)了部分異常情況,但因?yàn)闆]有看到預(yù)警系統(tǒng)的警報,而不知道情況有多么嚴(yán)重,以致一個小時后才得到控制站的指示。但此時沒完沒了的故障干擾已經(jīng)讓操作員反應(yīng)不過來,無法控制整個局面。正常情況下,出現(xiàn)錯誤的網(wǎng)絡(luò)會立即與其他網(wǎng)絡(luò)分隔開來,這樣一來錯誤就會被固定在一個地方,但是同樣由于預(yù)警系統(tǒng)失靈,操作員沒有做出應(yīng)有的反應(yīng),最終使得錯誤蔓延,一發(fā)而不可收拾。
第一能源公司目前打算將采取競標(biāo)的方式來更換系統(tǒng)。未避免事故重現(xiàn),NERC(North American Electric Reliability Council,北美電力可靠性委員會)提出了指導(dǎo)意見,責(zé)令第一能源公司在升級系統(tǒng)前為XA/21系統(tǒng)安裝所有補(bǔ)丁程序。