業(yè)務連續(xù)性
1.業(yè)務連續(xù)性概述
業(yè)務連續(xù)性是指企業(yè)有應對風險、自動調(diào)整和快速反應的能力,以保證企業(yè)業(yè)務的連續(xù)運轉(zhuǎn)。為企業(yè)重要應用和流程提供業(yè)務連續(xù)性應該包括以下三個方面。
1.高可用性(High availability) 。它是指提供在本地故障情況下,能繼續(xù)訪問應用的能力。無論這個故障是業(yè)務流程、物理設(shè)施,還是IT軟硬件故障。
2.連續(xù)操作(Continuous operations)。 它是指當所有設(shè)備無故障時保持業(yè)務連續(xù)運行的能力。用戶不需要僅僅因為正常的備份或維護而需要停止應用的能力。
3.災難恢復(Disaster Recovery)。它是指當災難破壞生產(chǎn)中心時,在不同的地點恢復數(shù)據(jù)的能力。
同時,上述三個部分不是相互孤立的,是相互關(guān)聯(lián),而且有交叉的。
2.業(yè)務連續(xù)性的方法論
業(yè)務連續(xù)性管理起源于上個世紀70年代的容災恢復計劃。在那個時代,災難恢復的活動由數(shù)據(jù)處理經(jīng)理來管理。在那個時候,如果出現(xiàn)大的故障或危機,中斷是以天計算而不是小時計算的。金融組織,如銀行和保險公司大都選擇在另外一個遠離主中心的地方存儲備份磁帶。恢復活動經(jīng)常是由火災、水災、暴風或其他物理損壞引發(fā)的。
到了上個世紀80年代,曾出現(xiàn)了很多商業(yè)恢復中心,在共享設(shè)備上提供計算服務,但重點還在IT的恢復。到了上個世紀90年代,IT出現(xiàn)重大的革命,災難恢復計劃發(fā)展為業(yè)務連續(xù)性計劃。
針對業(yè)務連續(xù)性,IBM首先利用一套系統(tǒng)的方法來了解用戶獨特的業(yè)務連續(xù)性和可用性需求。IBM可以幫助用戶構(gòu)思和架構(gòu)一套連續(xù)性規(guī)劃。該規(guī)劃可以使中斷的威脅降到最低或消除中斷威脅,充分考慮最關(guān)鍵需求的優(yōu)先級,并將恢復時間降到最短。IBM連續(xù)性解決方案采用了基礎(chǔ)架構(gòu)管理方面(存儲管理方面領(lǐng)先的自動化軟件、服務器供應和端到端的可用性管理)的先進技術(shù)和最佳實踐經(jīng)驗。
IBM使用自動化、前瞻性和適應性功能,將現(xiàn)場和非現(xiàn)場的備份功能結(jié)合起來滿足用戶的獨特需求。通過IBM系統(tǒng)存儲部提出的基于GDOC和存儲HA的解決方案,可以真正地幫助客戶實現(xiàn)業(yè)務的連續(xù)運轉(zhuǎn),保證了用戶可以在IT技術(shù)層實現(xiàn)第七級的業(yè)務連續(xù)性解決方案。
同時配合IBM業(yè)務連續(xù)性和災難恢復方法論,由分析評估、設(shè)計實施和維護管理組成一個循環(huán)往復的閉合系統(tǒng),推動企業(yè)的業(yè)務連續(xù)和災難恢復能力不斷提升。
這個方法論將貫穿于IBM所有的業(yè)務連續(xù)性和災難恢復服務當中。循環(huán)前進的方案體現(xiàn)了IBM對客戶長期技術(shù)支持的承諾。IBM提供的服務將始終與環(huán)境變遷保持同步,并根據(jù)最新的技術(shù)、客戶的需求及時進行服務升級及補充,以確保企業(yè)的連續(xù)運作,實現(xiàn)企業(yè)的災難恢復能力的螺旋形上升,使業(yè)務連續(xù)性計劃與外界環(huán)境變同步發(fā)展。
總之,IBM希望通過完善的解決方案,幫助企業(yè)的業(yè)務系統(tǒng)適應各種破壞以及災難帶來的挑戰(zhàn),并實時響應新變化,確保企業(yè)業(yè)務的持續(xù)運轉(zhuǎn)。
3.業(yè)務連續(xù)性管理
業(yè)務連續(xù)性管理(Business Continuity Management,BCM),是一項綜合管理流程,使企業(yè)認識到潛在的危機和相關(guān)影響,制訂響應、業(yè)務和連續(xù)性的恢復計劃,其總體目標在于提高企業(yè)的風險防范能力,有效地響應非計劃的業(yè)務破壞并降低不良影響。
業(yè)務連續(xù)管理(BCM)十大最佳實踐標準
1.項目啟動和管理
確定業(yè)務連續(xù)性計劃(BCP)過程的需求,包括獲得管理支持、以及組織和管理項目使其符合時間和預算的限制。
確定可能造成機構(gòu)及其設(shè)施中斷和災難、具有負面影響的事件和周邊環(huán)境因素,以及事件可能造成的損失、防止或減少潛在損失影響的控制措施。提供成本效益分析以調(diào)整控制措施方面的投資達到消減風險的目的。
3.業(yè)務影響分析
確定由于中斷和預期災難可能對機構(gòu)造成的影響以及用來定量和定性分析這種影響的技術(shù)。確定關(guān)鍵功能、其恢復優(yōu)先順序和相關(guān)性以便確定恢復時間目標。
4.制定業(yè)務連續(xù)性策略
確定和指導備用業(yè)務恢復運行策略的選擇,以便在恢復時間目標范圍內(nèi)恢復業(yè)務和信息技術(shù),并維持機構(gòu)的關(guān)鍵功能。
5.應急響應和運作
制定和實施用于事件響應以及穩(wěn)定事件所引起狀況的規(guī)程,包括建立和管理緊急事件運作中心,該中心用于在緊急事件中發(fā)布命令。
6.制定和實施業(yè)務連續(xù)性計劃
設(shè)計、制定和實施業(yè)務連續(xù)性計劃以便在恢復時間目標范圍內(nèi)完成恢復。
7.意識培養(yǎng)和培訓項目
準備建立對機構(gòu)人員進行意識培養(yǎng)和技能培訓的項目,以便業(yè)務連續(xù)性計劃能夠得到制定、實施、維護和執(zhí)行。
8.維護和演練業(yè)務連續(xù)性計劃
對預先計劃和計劃間的協(xié)調(diào)性進行演練、并評估和記錄計劃演練的結(jié)果。制定維持連續(xù)性能力和BCP文檔更新狀態(tài)的方法使其與機構(gòu)的策略方向保持一致。通過與適當標準的比較來驗證BCP的效率,并使用簡明的語言報告驗證的結(jié)果。
9.公共關(guān)系和危機通信
制定、協(xié)調(diào)、評價和演練在危機情況下與媒體交流的計劃。制定、協(xié)調(diào)、評價和演練與員工及其家庭、主要客戶、關(guān)鍵供應商、業(yè)主/股東以及機構(gòu)管理層進行溝通和在必要情況下提供心理輔導的計劃。確保所有利益群體能夠得到所需的信息。
10.與公共當局的協(xié)調(diào)
建立適用的規(guī)程和策略用于同地方當局協(xié)調(diào)響應、連續(xù)性和恢復活動以確保符合現(xiàn)行的法令和法規(guī)。
4.業(yè)務連續(xù)性計劃
業(yè)務連續(xù)性計劃(Business Continuity Planning,BCP)是一套事先被定義和文檔化的計劃,明確定義了恢復業(yè)務所需要的關(guān)鍵人員、資源、行動、任務和數(shù)據(jù)。需要考慮的問題包括:關(guān)鍵業(yè)務數(shù)據(jù)被徹底破壞,只能用昨天的備份恢復,該怎么辦?服務器癱瘓,該怎么辦?技術(shù)更新?lián)Q代,怎么樣對業(yè)務影響最小?發(fā)生了災難事件,該怎么辦?IT系統(tǒng)恢復是否就可以開放業(yè)務運營?
BCP的內(nèi)容不應該只局限在IT方面,應該涵蓋如下幾個方面:應急響應計劃(業(yè)務連續(xù)性管理組織結(jié)構(gòu)、應急初始評估流程、災難宣布流程、災難評估流程);容災恢復計劃(IT切換流程/步驟/啟用條件、IT回切流程/步驟/啟用條件);運維恢復計劃(ORP);業(yè)務恢復計劃。
BCP必須簡單有效,定期演練,演練之前充分準備,遵守相關(guān)流程,從而保持業(yè)務連續(xù)性計劃的有效性。演練的關(guān)鍵點在于通過真實的演練來檢驗并提高,演練規(guī)劃要詳細、模塊化,演習手冊要能滿足指揮員和操作員不同的需求,演習結(jié)果要量化衡量。每次演練都有新的問題發(fā)生,在事前不要給領(lǐng)導100%的預期,因為演練的目的是要成長和提高,通常實現(xiàn)80%的目標就已經(jīng)是一種成功。