登錄

業(yè)務(wù)連續(xù)性計(jì)劃

百科 > 業(yè)務(wù)流程管理 > 業(yè)務(wù)連續(xù)性計(jì)劃

1.業(yè)務(wù)連續(xù)性計(jì)劃概述

業(yè)務(wù)連續(xù)性計(jì)劃是一套基于業(yè)務(wù)運(yùn)行規(guī)律的管理要求和規(guī)章流程,使一個(gè)組織在突發(fā)事件面前能夠迅速作出反應(yīng),以確保關(guān)鍵業(yè)務(wù)功能可以持續(xù),而不造成業(yè)務(wù)中斷或業(yè)務(wù)流程本質(zhì)的改變。

業(yè)務(wù)連續(xù)性是指企業(yè)有應(yīng)對(duì)風(fēng)險(xiǎn)、自動(dòng)調(diào)整和快速反應(yīng)的能力,以保證企業(yè)業(yè)務(wù)的連續(xù)運(yùn)轉(zhuǎn)。為企業(yè)重要應(yīng)用和流程提供業(yè)務(wù)連續(xù)性應(yīng)該包括以下三個(gè)方面。

1.高可用性(High availability) 。它是指提供在本地故障情況下,能繼續(xù)訪問應(yīng)用的能力。無(wú)論這個(gè)故障是業(yè)務(wù)流程、物理設(shè)施,還是IT軟硬件故障。

2.連續(xù)操作(Continuous operations)。 它是指當(dāng)所有設(shè)備無(wú)故障時(shí)保持業(yè)務(wù)連續(xù)運(yùn)行的能力。用戶不需要僅僅因?yàn)檎5膫浞莼蚓S護(hù)而需要停止應(yīng)用的能力。

3.災(zāi)難恢復(fù)(Disaster Recovery)。它是指當(dāng)災(zāi)難破壞生產(chǎn)中心時(shí),在不同的地點(diǎn)恢復(fù)數(shù)據(jù)的能力。

同時(shí),上述三個(gè)部分不是相互孤立的,是相互關(guān)聯(lián),而且有交叉的。

區(qū)分業(yè)務(wù)連續(xù)性和災(zāi)難恢復(fù)是很必要的。嚴(yán)格地說,災(zāi)難恢復(fù)是恢復(fù)數(shù)據(jù)的能力,是業(yè)務(wù)連續(xù)性計(jì)劃的一部分。

讓業(yè)務(wù)連續(xù)性計(jì)劃成為企業(yè)變化管理文化的一部分。在制定企業(yè)業(yè)務(wù)連續(xù)性計(jì)劃之后,不要把這個(gè)計(jì)劃放在一邊。要確保該計(jì)劃的切實(shí)可行,就需要把它變成活動(dòng)的文檔。如果企業(yè)的業(yè)務(wù)模式發(fā)生了變化,或是業(yè)務(wù)過程進(jìn)行了重新設(shè)計(jì),或是發(fā)生突發(fā)狀況時(shí)的重要聯(lián)系人不再為公司工作,舊的計(jì)劃就需要及時(shí)進(jìn)行更新。當(dāng)有變化時(shí),每個(gè)員工都應(yīng)該問問自己該變化會(huì)對(duì)業(yè)務(wù)連續(xù)性計(jì)劃中涉及到自己的部分會(huì)產(chǎn)生怎樣的影響。

2.業(yè)務(wù)連續(xù)性計(jì)劃的重要性

現(xiàn)在的社會(huì)特別是經(jīng)濟(jì)社會(huì)對(duì)網(wǎng)絡(luò)的依賴日益加深,傳統(tǒng)的備份恢復(fù)式安全計(jì)劃已經(jīng)無(wú)法保證企業(yè)業(yè)務(wù)的連續(xù)運(yùn)行。

業(yè)務(wù)連續(xù)性計(jì)劃正是因此而生,它根據(jù)業(yè)務(wù)流程而非針對(duì)技術(shù)進(jìn)行制訂,有助于建立起更具統(tǒng)籌能力的安全管理制度。據(jù)Gartner Group的調(diào)查結(jié)果顯示,如果企業(yè)的大型數(shù)據(jù)中心和信息基礎(chǔ)設(shè)施停止運(yùn)行10日以上,超過百分之三十的企業(yè)在一個(gè)季度內(nèi)倒閉,而接近90%的企業(yè)在一年內(nèi)倒閉。

這些數(shù)據(jù)說明了保證業(yè)務(wù)連續(xù)有效的運(yùn)行對(duì)企業(yè)來(lái)說是多么重要,同時(shí)也可以看出企業(yè)花費(fèi)大量的資金于業(yè)務(wù)連續(xù)性計(jì)劃最核心的原因。

3.業(yè)務(wù)連續(xù)性計(jì)劃的基本要素

BCP的基本要素

籠統(tǒng)地說,BCP的目標(biāo)只有一個(gè),那就是確定并減少危險(xiǎn)可能帶來(lái)的損失,有效地保障業(yè)務(wù)的連續(xù)性。而有關(guān)BCP的一些特定目標(biāo)我們將在以下各個(gè)部分中加以描述。

BCP實(shí)施的最終結(jié)果是:

  • 一組防范危險(xiǎn)的評(píng)測(cè)指標(biāo);
  • 一支執(zhí)行團(tuán)隊(duì),在經(jīng)過培訓(xùn)后可以處理各種危險(xiǎn)事件;
  • 一套計(jì)劃,提供危險(xiǎn)發(fā)生時(shí)的路線圖。該計(jì)劃應(yīng)該是充分和完備的,必須詳細(xì)落實(shí)到該計(jì)劃實(shí)施范圍內(nèi)的每一個(gè)單位、人員或設(shè)備。

每個(gè)企業(yè)所制定的BCP都應(yīng)該有每個(gè)企業(yè)或者所處行業(yè)獨(dú)有的特色,彼此之間不會(huì)完全一致,但大致上說來(lái),一個(gè)完備的BCP主要是由以下一些關(guān)鍵部分構(gòu)成的:

一、 危險(xiǎn)評(píng)估

危險(xiǎn)評(píng)估就是認(rèn)識(shí)并分析各種潛在危險(xiǎn)的結(jié)果。這些危險(xiǎn)的來(lái)源可能是:

  • 各種區(qū)域性的天然災(zāi)難,如洪水、地震、疫病等;
  • 人為事故或蓄意破壞造成的嚴(yán)重災(zāi)難,如火災(zāi)、恐怖主義襲擊等;
  • 安全威脅、硬件、網(wǎng)絡(luò)或通信故障;
  • 災(zāi)難性的應(yīng)用系統(tǒng)錯(cuò)誤。

所有的危險(xiǎn)都應(yīng)納入企業(yè)的危險(xiǎn)評(píng)估范圍,并且應(yīng)對(duì)各種危險(xiǎn)的可能來(lái)源地進(jìn)行較準(zhǔn)確的定位。對(duì)于每一種危險(xiǎn)的來(lái)源都應(yīng)該認(rèn)識(shí)到:

  • 危險(xiǎn)的類型;
  • 危險(xiǎn)的程度;
  • 危險(xiǎn)發(fā)生的可能性。

比如說,如果按照有無(wú)警示性先兆來(lái)分,各類危險(xiǎn)還可以分為:

  • 有些危險(xiǎn)可能沒有任何先兆而突然發(fā)生,無(wú)法事先防范;
  • 有些危險(xiǎn)可以有一定的先兆,可以迅速啟動(dòng)應(yīng)急計(jì)劃加以防范,比如疫病的傳播;
  • 有些危險(xiǎn)可能從來(lái)不會(huì)發(fā)生。

如果按照危險(xiǎn)的破環(huán)類型或程度來(lái)分,它們對(duì)業(yè)務(wù)的影響可以分為:

  • 經(jīng)營(yíng)場(chǎng)所及設(shè)備完全破環(huán);
  • 經(jīng)營(yíng)場(chǎng)所及設(shè)備部分破環(huán);
  • 經(jīng)營(yíng)場(chǎng)所及設(shè)備完好,但人員不能進(jìn)入,比如疫病的隔離、恐怖威脅造成的人員輸散等。

顯然,對(duì)于企業(yè)來(lái)說,一個(gè)完備的BCP必須盡可能多地考慮到所有可能的危險(xiǎn)情況,只有處理災(zāi)難性事件的計(jì)劃而沒有處理應(yīng)用系統(tǒng)失誤的計(jì)劃,這樣的BCP是不完備的;反之亦然。

企業(yè)所制定的BCP應(yīng)該同時(shí)兼顧兩個(gè)方面——預(yù)防和控制。例如,人為事故和蓄意破壞可以通過物理安全和個(gè)人行為的評(píng)測(cè)來(lái)預(yù)防。而應(yīng)用系統(tǒng)的錯(cuò)誤則可以通過對(duì)軟件的有效評(píng)測(cè)與測(cè)試來(lái)預(yù)防。

危險(xiǎn)評(píng)估的最后結(jié)果應(yīng)該是一份有關(guān)危險(xiǎn)效益分析的詳細(xì)陳述報(bào)告,要有對(duì)危險(xiǎn)的精確描述、哪些危險(xiǎn)可能發(fā)生,以及需要采取的保障業(yè)務(wù)連續(xù)性和緩和危險(xiǎn)的措施,同時(shí)要有因?yàn)榭朔宋kU(xiǎn)而帶來(lái)的收益分析。這份報(bào)告還應(yīng)該描述清楚任何現(xiàn)有的前提或者限制因素。

二、 業(yè)務(wù)影響分析(BIA)

業(yè)務(wù)影響分析(Business Impact Analysis)實(shí)質(zhì)上就是對(duì)關(guān)鍵性的企業(yè)功能、以及當(dāng)這些功能一旦失去作用時(shí)可能造成的損失和影響的分析。

對(duì)于企業(yè)業(yè)務(wù)運(yùn)營(yíng)的關(guān)鍵人員來(lái)說,他們需要分析:

A. 影響

  • 哪種功能對(duì)于企業(yè)的整體戰(zhàn)略而言是生死攸關(guān)的
  • 該功能在多長(zhǎng)時(shí)間內(nèi)失效不會(huì)造成影響和損失
  • 企業(yè)的其他業(yè)務(wù)功能由于該功能的失效會(huì)受到何種影響——運(yùn)營(yíng)影響分析
  • 該功能的失效可能造成的收入影響——財(cái)務(wù)影響分析
  • 該功能是否會(huì)對(duì)客戶關(guān)系造成影響——客戶信心的損失
  • 該功能是否會(huì)對(duì)市場(chǎng)份額造成影響——市場(chǎng)占有率的下滑
  • 該功能是否會(huì)對(duì)企業(yè)在行業(yè)中的地位造成影響——企業(yè)競(jìng)爭(zhēng)力的損失
  • 該功能是否會(huì)影響今后的銷售——機(jī)會(huì)的喪失
  • 什么是最大的/可承受的/可允許的失效

B. 業(yè)務(wù)恢復(fù)需求

  • 要使該功能連續(xù),需要哪些資源和數(shù)據(jù)紀(jì)錄
  • 最少的資源需求是什么
  • 哪些資源可能來(lái)自企業(yè)外部
  • 它與企業(yè)其他功能的依賴關(guān)系以及依賴程度
  • 企業(yè)的其他功能與該功能的依賴關(guān)系以及依賴程度
  • 該功能與企業(yè)的外部業(yè)務(wù)/供應(yīng)商/其他廠商的依賴關(guān)系以及依賴程度
  • 在缺少試驗(yàn)環(huán)境的情況下進(jìn)行恢復(fù),需要采取怎樣的預(yù)防措施或檢驗(yàn)手段

在進(jìn)行了這些分析之后,才有可能對(duì)企業(yè)的各種功能進(jìn)行分類:

a)關(guān)鍵功能——如果這類功能被中斷或失效,就會(huì)徹底危及企業(yè)的業(yè)務(wù)并造成嚴(yán)重?fù)p失。

b)基礎(chǔ)功能——這些功能一旦失效將會(huì)嚴(yán)重影響企業(yè)長(zhǎng)期運(yùn)營(yíng)的能力。

c)必要功能——企業(yè)可以繼續(xù)運(yùn)營(yíng),但這些功能的失效會(huì)在很大程度上限制企業(yè)的效率。

d)有利功能——這些功能對(duì)企業(yè)是有利的;但它們的缺失不會(huì)影響企業(yè)的運(yùn)營(yíng)能力。

根據(jù)各種功能的恢復(fù)需求,企業(yè)便可為上述各類功能制定標(biāo)準(zhǔn)的恢復(fù)時(shí)間架構(gòu)。例如,關(guān)鍵功能<1天;基礎(chǔ)功能:2~4天;必要功能:5~7天;有利功能:>10天。

影響分析可以幫助企業(yè)確定各類業(yè)務(wù)功能的優(yōu)先順序,換句話說,也就確定了各業(yè)務(wù)功能的優(yōu)先恢復(fù)順序。

BIA有助于定義恢復(fù)對(duì)象。在進(jìn)行了影響分析之后可能會(huì)發(fā)現(xiàn),在一次災(zāi)難之后恢復(fù)業(yè)務(wù)運(yùn)營(yíng)時(shí),首先恢復(fù)部分功能就足夠了,比如說在24小時(shí)內(nèi)先恢復(fù)日常業(yè)務(wù)的40%就夠了。

詳細(xì)定義好在災(zāi)難或業(yè)務(wù)中斷之后保障業(yè)務(wù)功能運(yùn)營(yíng)的資源需求也是可能的。這些資源需求包括基礎(chǔ)設(shè)施、人力資源、文檔、記錄、設(shè)備、電話、傳真機(jī)等,無(wú)論需要什么資源都要有完備的規(guī)范要求。擁有適當(dāng)?shù)募?xì)節(jié)要求是非常重要的,因?yàn)樵谖kU(xiǎn)事件發(fā)生時(shí),會(huì)產(chǎn)生一定程度的慌亂,到那時(shí)再?zèng)Q定這類細(xì)節(jié)已經(jīng)不可能了。

成本因素在進(jìn)行影響分析時(shí)也是不能忽略的。我們需要記住以下一些事項(xiàng):

  • 收入的損失和商機(jī)的喪失與恢復(fù)所需的時(shí)間直接成正比
  • 一種恢復(fù)策略的成本與恢復(fù)所需的時(shí)間成反比
  • 可能的恢復(fù)策略的成本必須和在采納該策略之前由于業(yè)務(wù)功能中斷而造成的實(shí)際損失進(jìn)行比較。如果所建議的恢復(fù)策略的成本遠(yuǎn)高于預(yù)計(jì)的成本,那么這種策略就是不可取的。

三、 策略

BCP應(yīng)包括以下策略:

A.預(yù)防 預(yù)防的目的在于減少災(zāi)難發(fā)生的可能性。有關(guān)預(yù)防的策略應(yīng)該包括制止和預(yù)防控制。制止控制可以減少危險(xiǎn)的可能性。預(yù)防控制則是保護(hù)企業(yè)的弱點(diǎn)區(qū)域,以防御危險(xiǎn)的發(fā)生并降低其影響。這兩類控制在實(shí)際運(yùn)營(yíng)中廣泛存在,比如經(jīng)營(yíng)場(chǎng)所的安全、人員控制、相關(guān)基礎(chǔ)設(shè)施(如UPS、后備電池、煙火探測(cè)器、滅火器等)、軟件控制、相關(guān)的存儲(chǔ)和恢復(fù)等。

企業(yè)希望保障其資源(包括信息資產(chǎn))的可用性和安全性,其安全策略必須針對(duì)這些對(duì)象而制定,并且提供有關(guān)資源使用和管理的指南。在熟悉了企業(yè)的所有資源、資源的布局以及危險(xiǎn)管理等之后,才可能拿出實(shí)施安全策略所需的必要的控制措施。這些控制措施或安全舉措必須時(shí)時(shí)加以檢查和測(cè)試。

如果一種安全策略,能將預(yù)防措施都部署到位,可以監(jiān)控對(duì)系統(tǒng)的入侵并防范那些試圖破壞系統(tǒng)的行為,那么其本身就是一種制止控制。預(yù)防計(jì)劃的執(zhí)行必須小心謹(jǐn)慎。必須保證實(shí)施安全策略時(shí)既不能對(duì)日常業(yè)務(wù)帶來(lái)限制,出現(xiàn)瓶頸,也不能引起可用性問題,或者給系統(tǒng)的訪問和使用帶來(lái)障礙。

B.響應(yīng) 響應(yīng)就是當(dāng)危險(xiǎn)發(fā)生時(shí)的反應(yīng)。它必須能夠阻止危險(xiǎn)的進(jìn)一步擴(kuò)大,評(píng)估危險(xiǎn)的程度,通過與外部世界的正常通信聯(lián)絡(luò)挽回企業(yè)的聲譽(yù),并啟動(dòng)必要的恢復(fù)時(shí)間表。

對(duì)業(yè)務(wù)中斷的第一反應(yīng)應(yīng)該是告知所有相關(guān)的人員。如果危險(xiǎn)有事前警示的話(比如這次的非典爆發(fā)),那么這種告知就可以提前進(jìn)行。及時(shí)的告知非常重要,因?yàn)檫@可能會(huì)給阻止危險(xiǎn)的進(jìn)一步擴(kuò)大創(chuàng)造機(jī)會(huì)。如果在適當(dāng)?shù)臅r(shí)機(jī)執(zhí)行一次關(guān)機(jī)、一次轉(zhuǎn)換或者一次撤離,甚至有可能完全防止危險(xiǎn)的發(fā)生。但是這需要有診斷或探測(cè)控制的存在。這類控制或者可以持續(xù)掃描以探測(cè)發(fā)生中斷的征候(網(wǎng)絡(luò)、服務(wù)器),或者可以從外部資源搜集信息(自然災(zāi)害)。

準(zhǔn)確的告知程序必須事先制定好。必須清楚地記錄在案:需要告知誰(shuí),怎樣告知,由誰(shuí)告知,而且還得有逐步擴(kuò)大的機(jī)制。

在BCP中必須設(shè)立好一棵告知樹。最初的告知發(fā)送給一組人,然后再由他們中的每個(gè)人去告知另一組人,依次類推。屬于這棵告知樹的人都有不同的責(zé)任和作用,所涉及的人員應(yīng)包括:

  • 管理團(tuán)隊(duì)——需要獲得有關(guān)危險(xiǎn)發(fā)展?fàn)顩r的信息。該團(tuán)隊(duì)有權(quán)力啟動(dòng)緊急響應(yīng)體系和下一步的行動(dòng)。管理團(tuán)隊(duì)還要負(fù)責(zé)與媒體、公眾、客戶以及股東們打交道。
  • 危險(xiǎn)評(píng)估團(tuán)隊(duì)——需要立刻對(duì)危險(xiǎn)進(jìn)行評(píng)估,評(píng)價(jià)業(yè)務(wù)中斷的嚴(yán)重程度。
  • 技術(shù)團(tuán)隊(duì)——應(yīng)當(dāng)為關(guān)鍵決策制定者如何采取下一步BCP行動(dòng)提供服務(wù)。
  • 運(yùn)營(yíng)團(tuán)隊(duì)——應(yīng)當(dāng)執(zhí)行BCP的實(shí)際運(yùn)作。

還有很重要的一點(diǎn)就是每一個(gè)團(tuán)隊(duì)都應(yīng)明確第二負(fù)責(zé)人。萬(wàn)一第一負(fù)責(zé)人沒有通知到或者無(wú)法負(fù)起責(zé)任,那么必須告知第二負(fù)責(zé)人。告知可以使用各種工具或手段:如手機(jī)、呼機(jī)、短信、電話和E-mail。每個(gè)團(tuán)隊(duì)都應(yīng)當(dāng)有相應(yīng)的配備。

危險(xiǎn)評(píng)估團(tuán)隊(duì)?wèi)?yīng)該是最早(或者與管理團(tuán)隊(duì)同時(shí))被告知的。他們應(yīng)當(dāng)最早來(lái)到現(xiàn)場(chǎng),以便評(píng)估所遭受的危險(xiǎn)程度和級(jí)別。如果工作現(xiàn)場(chǎng)已經(jīng)遭到破壞,那么他們就應(yīng)該做好各項(xiàng)準(zhǔn)備,一旦允許進(jìn)入現(xiàn)場(chǎng)就開始工作。

評(píng)估過程本身也應(yīng)有計(jì)劃地進(jìn)行,必須與保障業(yè)務(wù)連續(xù)性的優(yōu)先順序密切相關(guān)。這就是說評(píng)估團(tuán)隊(duì)?wèi)?yīng)當(dāng)意識(shí)到危險(xiǎn)所影響到的工作區(qū)域和工作流程是否對(duì)整個(gè)業(yè)務(wù)的運(yùn)行至關(guān)重要。這將有助于他們優(yōu)化其評(píng)估進(jìn)程,同時(shí)也可正確地關(guān)注關(guān)鍵性工作區(qū)域。這支團(tuán)隊(duì)需要察看以下事項(xiàng):

  • 中斷的原因是什么
  • 阻止危險(xiǎn)擴(kuò)大的前景如何
  • 基礎(chǔ)設(shè)施和設(shè)備受損情況
  • 業(yè)務(wù)受影響狀況
  • 關(guān)鍵記錄受損情況
  • 可以挽回什么損失
  • 什么設(shè)備需要修理、恢復(fù)和更換

有了危險(xiǎn)評(píng)估團(tuán)隊(duì)提供的有關(guān)受損程度和受損區(qū)域的詳盡信息,技術(shù)團(tuán)隊(duì)便可立刻投入工作。

BCP必須擁有一組基于業(yè)務(wù)影響分析和持續(xù)性目標(biāo)的預(yù)設(shè)參數(shù),這些參數(shù)應(yīng)該能夠區(qū)分出中斷和災(zāi)難的不同性質(zhì),同時(shí)也能評(píng)價(jià)出危險(xiǎn)的嚴(yán)重程度。

當(dāng)危險(xiǎn)評(píng)估團(tuán)隊(duì)和技術(shù)團(tuán)隊(duì)開始工作時(shí),其他BCP團(tuán)隊(duì)也應(yīng)依照警示告知到位,以便按照連續(xù)性計(jì)劃采取應(yīng)當(dāng)采取的行動(dòng)。

C.業(yè)務(wù)接續(xù)(Resumption) 業(yè)務(wù)接續(xù)只涉及那些時(shí)間敏感的業(yè)務(wù)流程,要么是在中斷發(fā)生后立即接續(xù),要么是在可允許的一段平均時(shí)間后接續(xù),但不是對(duì)所有業(yè)務(wù)的恢復(fù)。

一旦BCP被激活,命令將從指揮中心發(fā)出。這個(gè)指揮中心應(yīng)該是在一個(gè)不同于日常經(jīng)營(yíng)場(chǎng)所的地方。該中心應(yīng)配備相應(yīng)的通信設(shè)施、辦公設(shè)備,可能的話還應(yīng)該構(gòu)建局域網(wǎng)和VPN。

需要做出的第一個(gè)決策是,關(guān)鍵性業(yè)務(wù)的運(yùn)營(yíng)能否在日常的工作場(chǎng)所或者在一個(gè)備選場(chǎng)所很快恢復(fù)運(yùn)營(yíng)。

備選場(chǎng)所可以分成以下幾類:

(a)空?qǐng)鏊–old Site)——該場(chǎng)所只需配備必要的環(huán)境條件即可,比如說,應(yīng)配備電話插座、電源以及UPS等,但要避免其內(nèi)有任何其他設(shè)備,它的作用就是準(zhǔn)備將保障業(yè)務(wù)持續(xù)所需的全部設(shè)備搬移進(jìn)來(lái)。

(b)熱場(chǎng)所(Hot Site)——該場(chǎng)所是一個(gè)完全的備份場(chǎng)所,有人員工作的空間,所有設(shè)施一應(yīng)俱全,數(shù)據(jù)備份也是最新的。一旦災(zāi)難發(fā)生,BCP團(tuán)隊(duì)只需進(jìn)駐該場(chǎng)所就可開始工作,不會(huì)有額外的時(shí)間拖延。

(c)溫場(chǎng)所(Warm Site)——該場(chǎng)所實(shí)際上就是配備了部分設(shè)備的熱場(chǎng)所,數(shù)據(jù)備份不算最新,但也不能太舊。

(d)機(jī)動(dòng)場(chǎng)所(Mobile Site)——該場(chǎng)所是一個(gè)具有較小設(shè)施配置的機(jī)動(dòng)場(chǎng)所??梢晕挥谥饕?jīng)營(yíng)場(chǎng)所附近,因而也可節(jié)省關(guān)鍵人員在路程上花費(fèi)的時(shí)間。

(e)鏡像場(chǎng)所(Mirrored Site)——該場(chǎng)所在所有方面都與主要經(jīng)營(yíng)場(chǎng)所完全相同,信息和數(shù)據(jù)也與主要場(chǎng)所同步。實(shí)際上該場(chǎng)所就是正常狀況下的一個(gè)冗余場(chǎng)所,因而通常也是成本最高的一種選擇。

在備選場(chǎng)所(或主要場(chǎng)所,如果仍然可用的話),工作環(huán)境需要恢復(fù)。通信、網(wǎng)絡(luò)和工作站需要設(shè)置。與外界的聯(lián)系必須持續(xù)暢通。企業(yè)可以首先手動(dòng)恢復(fù)一些業(yè)務(wù),直到關(guān)鍵的IT業(yè)務(wù)可以繼續(xù)運(yùn)行為止。當(dāng)然,如果恢復(fù)計(jì)劃(下面就要講到)允許,那么關(guān)鍵業(yè)務(wù)功能也可采用自動(dòng)方式迅速恢復(fù)。

D.業(yè)務(wù)恢復(fù)(Recovery) 業(yè)務(wù)恢復(fù)是啟動(dòng)時(shí)間敏感度稍低一些的業(yè)務(wù)流程。業(yè)務(wù)恢復(fù)的開始時(shí)間要取決于接續(xù)那些時(shí)間敏感的業(yè)務(wù)流程需要的時(shí)間。

在進(jìn)行業(yè)務(wù)恢復(fù)的場(chǎng)所(可以是主要經(jīng)營(yíng)場(chǎng)所或備選場(chǎng)所),需要在備份的設(shè)備上恢復(fù)操作系統(tǒng),并按照關(guān)鍵性次序恢復(fù)必要的應(yīng)用系統(tǒng)。當(dāng)服務(wù)于關(guān)鍵功能的應(yīng)用系統(tǒng)恢復(fù)之后,則需要從備份磁帶或其他異地備份媒介上恢復(fù)數(shù)據(jù)。

備份數(shù)據(jù)也必須經(jīng)常保持同步,也就是說,重建的數(shù)據(jù)應(yīng)當(dāng)與業(yè)務(wù)中斷之前的某一預(yù)先確定的時(shí)點(diǎn)的數(shù)據(jù)相吻合。該時(shí)點(diǎn)的選擇取決于關(guān)鍵業(yè)務(wù)的要求。由于商業(yè)數(shù)據(jù)有各種不同的來(lái)源,因此重建的每一種數(shù)據(jù)都必須達(dá)到所需的數(shù)據(jù)一致性狀態(tài)。經(jīng)過同步的數(shù)據(jù)必須經(jīng)常進(jìn)行復(fù)查并保持其有效。這種復(fù)查必須強(qiáng)制執(zhí)行,因?yàn)樵谖kU(xiǎn)發(fā)生的緊急關(guān)頭,不可能再有閑暇來(lái)測(cè)試數(shù)據(jù)是否可用。因此,必須要有一套清楚的方法、策略或復(fù)查清單來(lái)執(zhí)行這個(gè)讓數(shù)據(jù)保持其有效性的過程。

一旦數(shù)據(jù)達(dá)到了可靠的狀態(tài),企業(yè)的事務(wù)就可以加速運(yùn)行,因?yàn)闉?zāi)難已經(jīng)得到處理,所有的關(guān)鍵性功能都已得到接續(xù)。逐步地,其他業(yè)務(wù)也可開始恢復(fù)其功能。

E.復(fù)原(Restoration) 復(fù)原則是修復(fù)并恢復(fù)主要的經(jīng)營(yíng)場(chǎng)所。最終是要在原有的場(chǎng)所或者一個(gè)全新的場(chǎng)所完全恢復(fù)所有的業(yè)務(wù)流程。

就在恢復(fù)團(tuán)隊(duì)開始從某個(gè)備選場(chǎng)所開始支持恢復(fù)運(yùn)營(yíng)的時(shí)候,對(duì)主要場(chǎng)所的全部功能進(jìn)行復(fù)原的工作也可以展開。如果原有場(chǎng)所在災(zāi)難后的確無(wú)法恢復(fù),則需要在一個(gè)新的場(chǎng)所進(jìn)行復(fù)原工作。恢復(fù)團(tuán)隊(duì)和復(fù)原團(tuán)隊(duì)的成員有可能是同一組人。

必須確保該復(fù)原場(chǎng)配備必要的基礎(chǔ)設(shè)施、設(shè)備、硬件、軟件和通信設(shè)備。而且要對(duì)該場(chǎng)所能否處理全部的業(yè)務(wù)流程進(jìn)行測(cè)試。

執(zhí)行上述所有行動(dòng)的計(jì)劃應(yīng)當(dāng)包括一個(gè)時(shí)間跨度定義,確定在某一跨度內(nèi)必須完成哪些行動(dòng)。這個(gè)時(shí)間跨度的定義必須與企業(yè)的恢復(fù)目標(biāo)相一致。BCP團(tuán)隊(duì)必須意識(shí)到,如果在任一時(shí)點(diǎn),他們的行動(dòng)超出了規(guī)定的時(shí)間跨度,那么這個(gè)意外事件就必須立刻上報(bào)到指揮中心,由指揮中心馬上制定相應(yīng)的解決辦法,否則企業(yè)就無(wú)法實(shí)現(xiàn)其恢復(fù)目標(biāo)。

四、 指標(biāo)定義

在危險(xiǎn)評(píng)估和業(yè)務(wù)影響分析階段之后,保持業(yè)務(wù)連續(xù)的基礎(chǔ)業(yè)務(wù)就已經(jīng)顯現(xiàn)出來(lái)。我們?cè)谏厦嬉呀?jīng)說過,按照業(yè)務(wù)術(shù)語(yǔ)可將企業(yè)的業(yè)務(wù)功能分成4類,即關(guān)鍵業(yè)務(wù)、基礎(chǔ)業(yè)務(wù)、必要業(yè)務(wù)和有利業(yè)務(wù)。

這種分類可以讓業(yè)務(wù)連續(xù)的優(yōu)先順序十分清晰,這樣,業(yè)務(wù)恢復(fù)的目標(biāo)就可以用下面的指標(biāo)進(jìn)行量化:

  • 恢復(fù)的時(shí)間目標(biāo)(RTO)——最大可允許中斷時(shí)間
  • 恢復(fù)的時(shí)點(diǎn)目標(biāo)(RPO)——數(shù)據(jù)損失可允許的最遠(yuǎn)回溯時(shí)點(diǎn)
  • 由于引進(jìn)了BCP的評(píng)測(cè)指標(biāo)而導(dǎo)致的企業(yè)性能退化
  • 實(shí)施BCP的成本

4.業(yè)務(wù)連續(xù)性計(jì)劃的內(nèi)容

業(yè)務(wù)連續(xù)性計(jì)劃既可以分成幾個(gè)單獨(dú)的計(jì)劃:即預(yù)防、響應(yīng)、業(yè)務(wù)接續(xù)、業(yè)務(wù)恢復(fù)和復(fù)原計(jì)劃,也可以由每一個(gè)這樣的計(jì)劃構(gòu)成總的計(jì)劃書中的不同章節(jié)。

1.基本項(xiàng)目

  • 目的
    • 制定計(jì)劃的目的必須加以說明。還應(yīng)該說明即劃分幾個(gè)階段試時(shí),每個(gè)階段所要實(shí)現(xiàn)的目標(biāo)是什么。
  • 范圍
    • 說明有哪些部門和運(yùn)營(yíng)業(yè)務(wù)需要實(shí)施BCP。如果一個(gè)BCP只針對(duì)某些災(zāi)難而非全部災(zāi)難,則需要針對(duì)這些特殊災(zāi)難制定專門的實(shí)施處理腳本。
  • 必備條件/前提條件和限制因素
    • 形成一份BCP的前提條件需要在此說明。在某些情況下,還須說明BCP成功的必備條件。比如說,服務(wù)器的數(shù)據(jù)備份間隔不得超過多少小時(shí),受過訓(xùn)練的運(yùn)營(yíng)恢復(fù)團(tuán)隊(duì)必須呼之即來(lái),備選場(chǎng)所必須在災(zāi)難發(fā)生之后多少小時(shí)之內(nèi)一切準(zhǔn)備就緒等等。
    • 如果BCP計(jì)劃的執(zhí)行還存在一些限制條件的話,也應(yīng)在此列出。
  • 團(tuán)隊(duì)
    • BCP團(tuán)隊(duì)的組織/負(fù)責(zé)人選、下屬哪些分支團(tuán)隊(duì)、團(tuán)隊(duì)的作用和責(zé)任等,都必須在此說明。
  • 指標(biāo)
    • 作為一種策略,企業(yè)必須由用于恢復(fù)的RPO和RTO指標(biāo),以及性能指標(biāo)等,這些指標(biāo)應(yīng)該在此加以說明,并向客戶和股東說明。

2.預(yù)防保護(hù)

作為BCP中的一個(gè)實(shí)施部分,預(yù)防措施需要在此說明。這些措施可以概括如下:

  • 監(jiān)督
  • 訪問控制
  • 身份認(rèn)證
  • 防病毒
  • 過濾
  • 入侵檢測(cè)系統(tǒng)
  • 備份計(jì)劃

3.緊急響應(yīng)

  • 響應(yīng)的準(zhǔn)備
    • 在響應(yīng)階段需要哪些資源應(yīng)當(dāng)在此列出,同時(shí)詳細(xì)申明這些資源的配置和所需數(shù)量。如果還需要一些文檔和記錄的硬拷貝,也必須在此申明。
  • 告知樹
  • 危險(xiǎn)評(píng)估
  • 何時(shí)對(duì)外宣布
  • 激活BCP的關(guān)鍵標(biāo)準(zhǔn)

4.業(yè)務(wù)接續(xù)

從緊急響應(yīng)階段到業(yè)務(wù)接續(xù)階段如何進(jìn)行銜接是需要在這里說明的。有關(guān)業(yè)務(wù)接續(xù)運(yùn)營(yíng)的決策過程、在哪里以及怎樣進(jìn)行業(yè)務(wù)接續(xù)、需要采取什么行動(dòng),以及接續(xù)哪些業(yè)務(wù)到何種程度等等,都需要在此加以說明。還要為BCP團(tuán)隊(duì)中的各個(gè)小組指定各自應(yīng)該采取的行動(dòng),每個(gè)小組要完成指定的任務(wù)。BCP中的這一部分也稱為業(yè)務(wù)接續(xù)計(jì)劃(BRP)。

5.業(yè)務(wù)恢復(fù)

執(zhí)行業(yè)務(wù)恢復(fù)的程序在此加以說明。BCP的這一部分也可稱為災(zāi)難恢復(fù)計(jì)劃(DRP)。

這一部分計(jì)劃文檔的組織可以有很多種方式。一種方式就是簡(jiǎn)單地列出所有的恢復(fù)目標(biāo)(按照RPO、RTO、目標(biāo)服務(wù)器/網(wǎng)絡(luò)等來(lái)列)。根據(jù)每一目標(biāo)進(jìn)行計(jì)劃分解,同時(shí)明確相應(yīng)的團(tuán)隊(duì)/負(fù)責(zé)人以及任務(wù)。還有一種方式就是按部門來(lái)組織。無(wú)論采用哪種方式,都應(yīng)確保所有的BCP目標(biāo)都能覆蓋到。

計(jì)劃的這一部分必須編排得像一本操作手冊(cè),由一系列簡(jiǎn)單明確的指令構(gòu)成,恢復(fù)團(tuán)隊(duì)完全可以按照這些指令進(jìn)行恢復(fù)操作。各種操作之間的相互關(guān)系也必須加以明確說明。所有的指令和說明必須明白無(wú)誤,以免因可能引起誤解或不明了而導(dǎo)致時(shí)間損失。

6.復(fù)原

為業(yè)務(wù)運(yùn)營(yíng)復(fù)原原有場(chǎng)所應(yīng)采取的步驟在此加以說明。需要標(biāo)明每個(gè)團(tuán)隊(duì)/負(fù)責(zé)人的責(zé)任和任務(wù)。

5.業(yè)務(wù)連續(xù)性計(jì)劃的運(yùn)作流程

BCP運(yùn)作共有6個(gè)階段,分別為:1、項(xiàng)目初始化、2、風(fēng)險(xiǎn)分析及業(yè)務(wù)影響、3、策略及實(shí)施、4、BCP開發(fā)、5、培訓(xùn)計(jì)劃、6、測(cè)試及維護(hù)。

1、項(xiàng)目初始化

      • 獲得管理層的支持與投入
    • 為了確保該程序能夠成功,高級(jí)管理層必須參與其中。BCP計(jì)劃必須成為公司的戰(zhàn)略性業(yè)務(wù)計(jì)劃之一。同時(shí),公司必須設(shè)定合理預(yù)算,并為BCP提供獨(dú)立的預(yù)算。
      • 建立團(tuán)隊(duì)
    • 必須建立一個(gè)團(tuán)隊(duì),人員包括財(cái)務(wù)部,審計(jì)部,信息技術(shù)部,人事部,行政部等等。當(dāng)災(zāi)難開始時(shí),這些部門在繼續(xù)扮演他們承擔(dān)的支援角色的同時(shí),也必須實(shí)施重大的機(jī)構(gòu)轉(zhuǎn)變以援助受影響的區(qū)域。法律部、公關(guān)部與投資部在事件發(fā)生后需要向公眾及股東通告公司的運(yùn)作狀況。

2、風(fēng)險(xiǎn)分析及業(yè)務(wù)影響分析

    • 決定BCP需求的關(guān)鍵驅(qū)動(dòng)力是“企業(yè)能在災(zāi)難中承受多少金額的損失”?業(yè)務(wù)影響分析的目的是回答以下問題:
      • 保護(hù)何種資產(chǎn)?(資產(chǎn)識(shí)別與評(píng)估)
      • 資產(chǎn)的威脅與脆弱點(diǎn)?(脆弱點(diǎn)和威脅評(píng)估)
      • 有沒有控制措施?控制措施能否預(yù)防或減少潛在的威脅?(評(píng)估控制)
      • 投入金額/勞力的多少?(決定)
      • 投入資金的效率如何?(通訊和監(jiān)控)
  • 當(dāng)進(jìn)行業(yè)務(wù)影響分析時(shí),應(yīng)考慮以下幾方面:
      • 金額的影響:如果不采取相應(yīng)的措施,則組織的經(jīng)濟(jì)損失是多少?
      • 客戶的影響:如果發(fā)生業(yè)務(wù)中斷,則組織會(huì)損失多少市場(chǎng)占有率
      • 法律的影響:組織是否遵從法律的要求?
      • 內(nèi)部依賴關(guān)系的影響:中斷的業(yè)務(wù)是否會(huì)其他領(lǐng)域的關(guān)鍵業(yè)務(wù)?
  • 作為業(yè)務(wù)影響分析的一部分,應(yīng)該評(píng)估業(yè)務(wù)允許中斷的時(shí)間長(zhǎng)短;
    • 組織能提供多常時(shí)間的信息;當(dāng)信息重新可用時(shí),允許損失的信息是多少?這些問題可以通過恢復(fù)時(shí)間目標(biāo)(recovery time objective (RTO))和恢復(fù)點(diǎn)目標(biāo)(recovery point objective (RPO))來(lái)決定。
  • 決定BCP需求的另一個(gè)因素是“災(zāi)難實(shí)際發(fā)生的可能性”。此因素由威脅的級(jí)別和組織具有的薄弱點(diǎn)范圍決定,威脅的程度取決于下列因素:
      • 有惡意性的破壞,如轟炸、縱火、工業(yè)間諜等。
      • 意外事故,如組織的辦公場(chǎng)所、環(huán)境,內(nèi)部系統(tǒng)和處理程序的質(zhì)量。

3、業(yè)務(wù)持續(xù)性策略及實(shí)施

  • 業(yè)務(wù)持續(xù)性策略
    • 業(yè)務(wù)影響分析為制定業(yè)務(wù)持續(xù)性策略提供必要的信息,下來(lái),根據(jù)提供的信息,可以確定多種滿足組織業(yè)務(wù)持續(xù)管理的方案。必須為各種業(yè)務(wù)持續(xù)方案進(jìn)行成本、效益及風(fēng)險(xiǎn)分析,包括:
      • 滿足業(yè)務(wù)持續(xù)目標(biāo)的能力
      • 影響的可能性
      • 安裝設(shè)備的成本
      • 維護(hù)、測(cè)試及調(diào)用設(shè)備的成本
      • 中斷對(duì)于技術(shù)、組織、文化和管理的干擾及未采取持續(xù)管理的潛在影響
    • 應(yīng)該仔細(xì)考慮采取業(yè)務(wù)持續(xù)方案確實(shí)解決了具體的風(fēng)險(xiǎn)但不會(huì)增
    • 加其它風(fēng)險(xiǎn)。通過風(fēng)險(xiǎn)降低和業(yè)務(wù)持續(xù)方案成本的平衡來(lái)決定業(yè)務(wù)持續(xù)策略以降低風(fēng)險(xiǎn)達(dá)到業(yè)務(wù)持續(xù)的目標(biāo)。
  • 實(shí)施
      • 設(shè)立組織及準(zhǔn)備實(shí)施計(jì)劃書
      • 實(shí)施備份安排
      • 實(shí)施降低風(fēng)險(xiǎn)的措施

4、BCP開發(fā)

  • 開發(fā)業(yè)務(wù)持續(xù)性計(jì)劃之前,確定災(zāi)難發(fā)生的情況下執(zhí)行的行動(dòng),你需要熟悉每天的操作任務(wù)。這意味這你需要熟悉每一個(gè)業(yè)務(wù)處理過程的基本文檔。在開發(fā)業(yè)務(wù)持續(xù)性計(jì)劃之前,須考慮下列措施是否已經(jīng)存在:
      • 變更控制流程
      • 最終用戶的標(biāo)準(zhǔn)操作流程
      • 操作人員的具體需求和特殊外圍設(shè)備需求
      • 數(shù)據(jù)流圖表及問題管理程序
      • 重要記錄
      • 磁帶備份/記錄管理日常安排
      • 異地存儲(chǔ)
  • 開發(fā)BCP計(jì)劃時(shí),需考慮在計(jì)劃執(zhí)行的七個(gè)階段中為每個(gè)恢復(fù)小組分派任務(wù):
      • 評(píng)估與聲明
      • 通告
      • 應(yīng)急反應(yīng)
      • 過渡期處理
      • 搶救
      • 重新安置及啟動(dòng)
      • 重新正常運(yùn)做

5、培訓(xùn)計(jì)劃

  • 一些員工需要的特殊培訓(xùn)如下:
      • 有緊急情況時(shí)可應(yīng)用替代的技術(shù)流程
      • 當(dāng)自動(dòng)操作系統(tǒng)正在恢復(fù)時(shí)可替代的人工操作流程
      • 確保團(tuán)隊(duì)成員達(dá)到推動(dòng)BCP所需能力的技術(shù)培訓(xùn)

6、測(cè)試及維護(hù)

進(jìn)行演示及有規(guī)律的測(cè)試,增強(qiáng)信心及效率,確保其相關(guān)的文檔時(shí)常更新。

(1)BCP的測(cè)試

制定好的BCP需要進(jìn)行適當(dāng)?shù)販y(cè)試才能投入使用。這一過程必須經(jīng)常周期性地進(jìn)行。省略了這一過程就意味著BCP只能等災(zāi)難實(shí)際發(fā)生之后進(jìn)行實(shí)地測(cè)試,這樣做的風(fēng)險(xiǎn)太大,恐怕任何一家企業(yè)都不敢做這種嘗試。

規(guī)劃一次BCP測(cè)試需要規(guī)定以下事項(xiàng):

  • 測(cè)試腳本——將可能發(fā)生的災(zāi)難定義為測(cè)試的一個(gè)部分。
  • 測(cè)試計(jì)劃——定義檢查程序、各種測(cè)試腳本、任務(wù)的類型、任務(wù)的參與者,比如說主要團(tuán)隊(duì)或者主要團(tuán)隊(duì)與預(yù)備團(tuán)隊(duì)的混合行動(dòng)。

簡(jiǎn)而言之,在測(cè)試BCP時(shí),需要執(zhí)行下列行動(dòng)

  • 準(zhǔn)備一份測(cè)試計(jì)劃,選擇測(cè)試腳本,說明預(yù)期要達(dá)到的結(jié)果。
  • 執(zhí)行該計(jì)劃
  • 記錄測(cè)試結(jié)果
  • 評(píng)估測(cè)試結(jié)果,報(bào)告存在差距
  • 將測(cè)試結(jié)果和報(bào)告向團(tuán)隊(duì)公布
  • 確認(rèn)需要做何改進(jìn)以彌補(bǔ)差距
  • 培訓(xùn)團(tuán)隊(duì)

(2)BCP的維護(hù)

一個(gè)BCP必須周期性地加以檢查和維護(hù)。一旦有新的系統(tǒng)、新的業(yè)務(wù)流程、或者新的商業(yè)行動(dòng)計(jì)劃加入企業(yè)的生產(chǎn)系統(tǒng)或者信息系統(tǒng),引起企業(yè)整體系統(tǒng)發(fā)生變化時(shí),就更應(yīng)該強(qiáng)制啟動(dòng)這種檢查程序。除此之外,像聯(lián)系人名單的更改這樣微小的變動(dòng)都可能觸發(fā)BCP計(jì)劃的更新。

每一次在進(jìn)行這種檢查程序時(shí),最好是與對(duì)BCP的改進(jìn)相互結(jié)合。例如,在測(cè)試過程中發(fā)現(xiàn)的問題、企業(yè)為了實(shí)現(xiàn)連續(xù)性對(duì)機(jī)構(gòu)所作的調(diào)整,或者在保持業(yè)務(wù)連續(xù)性測(cè)試時(shí)發(fā)現(xiàn)了更好的行動(dòng)方式和計(jì)劃等等。因此,BCP的維護(hù)應(yīng)該是變化和改進(jìn)的結(jié)合與不斷促進(jìn)。

每一次對(duì)BCP計(jì)劃所作的改動(dòng)都應(yīng)該及時(shí)通知所有的BCP團(tuán)隊(duì),并具體落實(shí)到每一次的培訓(xùn)和測(cè)試過程中去。

最后,與業(yè)務(wù)連續(xù)性相關(guān)的資源——人和設(shè)備——也會(huì)受到維護(hù)的影響。人員會(huì)通過培訓(xùn)和測(cè)試程序受到影響,設(shè)備會(huì)通過維護(hù)程序受到影響。只有當(dāng)這些資源始終處于良好狀態(tài),才能在危機(jī)發(fā)生時(shí)成為可靠和可依賴的資源。

公司沒有業(yè)務(wù)持續(xù)計(jì)劃就象是不設(shè)防,不可能阻止任何不可預(yù)測(cè)的破壞所造成的各種損失。所以公司必須認(rèn)真的對(duì)待業(yè)務(wù)持續(xù)計(jì)劃。

評(píng)論  |   0條評(píng)論