軟件可靠性
1.什么是軟件可靠性
軟件可靠性是指在給定時間內(nèi),特定環(huán)境下軟件無錯運行的概率。
2.軟件可靠性的內(nèi)容
軟件可靠性包含了以下三個要素:
1.規(guī)定的時間
軟件可靠性只是體現(xiàn)在其運行階段,所以將“運行時間”作為“規(guī)定的時間”的度量。 “運行時間”包括軟件系統(tǒng)運行后工作與掛起(開啟但空閑)的累計時間。由于軟件運行的環(huán)境與程序路徑選取的隨機性,軟件的失效為隨機事件,所以運行時間屬于隨機變量。
2.規(guī)定的環(huán)境條件
環(huán)境條件指軟件的運行環(huán)境。它涉及軟件系統(tǒng)運行時所需的各種支持要素,如支持硬件、操作系統(tǒng)、其它支持軟件、輸入數(shù)據(jù)格式和范圍以及操作規(guī)程等。不同的環(huán)境條件下軟件的可靠性是不同的。具體地說,規(guī)定的環(huán)境條件主要是描述軟件系統(tǒng)運行時計算機的配置情況以及對輸入數(shù)據(jù)的要求,并假定其它一切因素都是理想的。有了明確規(guī)定的環(huán)境條件,還可以有效判斷軟件失效的責任在用戶方還是研制方。
3.規(guī)定的功能
軟件可靠性還與規(guī)定的任務(wù)和功能有關(guān)。由于要完成的任務(wù)不同,軟件的運行剖面會有所區(qū)別,則調(diào)用的子模塊就不同(即程序路徑選擇不同),其可靠性也就可能不同。所以要準確度量軟件系統(tǒng)的可靠性必須首先明確它的任務(wù)和功能。
3.軟件可靠性的測試[1]
軟件可靠性測試的目的
軟件可靠性測試的主要目的有:
(1)通過在有使用代表性的環(huán)境中執(zhí)行軟件,以證實軟件需求是否正確實現(xiàn)。
(2) 為進行軟件可靠性估計采集準確的數(shù)據(jù)。估計軟件可靠性一般可分為四個步驟,即數(shù)據(jù)采集、模型選擇、模型擬合以及軟件可靠性評估??梢哉J為,數(shù)據(jù)采集是整個軟件可靠性估計工作的基礎(chǔ),數(shù)據(jù)的準確與否關(guān)系到軟件可靠性評估的準確度。
(3)通過軟件可靠性測試找出所有對軟件可靠性影響較大的錯誤。
軟件可靠性測試的特點
軟件可靠性測試不同于硬件可靠性測試,這主要是因為二者失效的原因不同。硬件失效一般是由于元器件的老化引起的,因此硬件可靠性測試強調(diào)隨機選取多個相同的產(chǎn)品,統(tǒng)計它們的正常運行時間。正常運行的平均時間越長, 則硬件就越可靠。軟件失效是由設(shè)計缺陷造成的,軟件的輸入決定是否會遇到軟件內(nèi)部存在的故障。因此,使用同樣一組輸入反復(fù)測試軟件并記錄其失效數(shù)據(jù)是沒有意義的。在軟件沒有改動的情況下,這種數(shù)據(jù)只是首次記錄的不斷重復(fù),不能用來估計軟件可靠性。軟件可靠性測試強調(diào)按實際使用的概率分布隨機選擇輸入,并強調(diào)測試需求的覆蓋面。軟件可靠性測試也不同于一般的軟件功能測試。相比之下,軟件可靠性測試更強調(diào)測試輸入與典型使用環(huán)境輸入統(tǒng)計特性的一致,強調(diào)對功能、輸入、數(shù)據(jù)域及其相關(guān)概率的先期識別。測試實例的采樣策略也不同,軟件可靠性測試必須按照使用的概率分布隨機地選擇測試實例,這樣才能得到比較準確的可靠性估計,也有利于找出對軟件可靠性影響較大的故障。
此外,軟件可靠性測試過程中還要求比較準確地記錄軟件的運行時間,它的輸入覆蓋一般也要大于普通軟件功能測試的要求。
對一些特殊的軟件,如容錯軟件、實時嵌入式軟件等,進行軟件可靠性測試時需要有多種測試環(huán)境。這是因為在使用環(huán)境下常常很難在軟件中植入錯誤,以進行針對性的測試。
軟件可靠性測試的效果
軟件可靠性測試是軟件可靠性保證過程中非常關(guān)鍵的一步。經(jīng)過軟件可靠性測試的軟件并不能保證該軟件中殘存的錯誤數(shù)最小,但可以保證該軟件的可靠性達到較高的要求。從工程的角度來看,一個軟件的可靠性高不僅意味著該軟件的失效率低,而且意味著一旦該軟件失效,由此所造成的危害也小。一個大型的工程軟件沒有錯誤是不可能的,至少理論上還不能證
明一個大型的工程軟件能沒有錯誤。因此,保證軟件可靠性的關(guān)鍵不是確保軟件沒有錯誤,而是要確保軟件的關(guān)鍵部分沒有錯誤。更確切地說,是要確保軟件中沒有對可靠性影響較大的錯誤。這正是軟件可靠性測試的目的之一。軟件可靠性測試的側(cè)重點不同于一般的軟件功能測試,其測試實例設(shè)計的出發(fā)點是尋找對可靠性影響較大的故障。因此,要達到同樣的可靠性要求,可靠性測試比一般的功能測試更
有效,所花的時間也更少。另外, 軟件可靠性測試的環(huán)境是具有使用代表性的環(huán)境,這樣,所獲得的測試數(shù)據(jù)與軟件的實際運行數(shù)據(jù)比較接近,可用于軟件可靠性估計。
總之, 軟件可靠性測試比一般的功能測試更加經(jīng)濟和有效,它可以代替一般的功能測試,而一般的軟件功能測試卻不能代替軟件可靠性測試,而且一般功能測試所得到的測試數(shù)據(jù)也不宜用于軟件可靠性估計。
軟件可靠性測試中需注意的問題
軟件可靠性測試一般可分為四個階段:制定測試方案,制定測試計劃,進行測試并記錄測試結(jié)果,編寫測試報告。
制定測試方案時需要特別注意被測功能的識別和失效等級的定義。制定測試計劃時需設(shè)計測試實例,決定測試時要確定輸入順序,并確定程序輸出的預(yù)期結(jié)果,這時也需注意測試覆蓋問題。
1. 功能識別
軟件可靠性測試的第一步就是進行功能識別,確定使用剖面。功能識別的目標是:識別所有被測功能以及執(zhí)行這些功能所需的相關(guān)輸入,識別每一個使用需求及其相關(guān)輸入的概率分布。為達到第一個目標,需要分析軟件功能的所有集合,這些功能之間全部的約束條件,功能之間的獨立性、相互關(guān)系和相互影響,還需分析系統(tǒng)的不同運行模式、失效發(fā)生時系統(tǒng)重構(gòu)策略等對軟件運行方式有較大影響的因素。第一個目標也是一般軟件功能測試需要達到的目標,但第二個目標則是軟件可靠性測試特別強調(diào)的。為了得到能夠反映軟件使用的有代表性的概率分布,測試人員必須和系統(tǒng)工程師、系統(tǒng)運行分析員和顧客共同合作。需要指出的是,由于可靠性的要求,輸入數(shù)據(jù)的概率分布應(yīng)包括合法數(shù)據(jù)的概率分布和非法數(shù)據(jù)的概率分布兩部分。有時為了更好地反映實際使用狀況,還需給出那些影響程序運行方式的條件,如硬件配置.負荷等的概率分布。
2. 定義換效等級
定義失效等級主要是為了解決下面兩個問題:
·對發(fā)生概率小但失效后危害嚴重的功能需求的識別。
·對可不查找失效原因、并不做統(tǒng)計的功能需求的識別。
在制定測試計劃時,失效及其等級的定義應(yīng)由測試人員、設(shè)計人員和用戶共同商定,達成協(xié)議。
3. 可靠性測試覆蓋
可靠性測試必須保證輸入覆蓋和環(huán)境覆蓋,這是準確估計軟件可靠性的基礎(chǔ)。
輸入覆蓋包括下面幾個內(nèi)容:
·輸入域覆蓋,即所有被測輸入值域的發(fā)生概率之和必須大于軟件可靠度的要求。
·重要輸入變量值的覆蓋。
·相關(guān)輸入變量可能組合的覆蓋,以確保相關(guān)輸入變量的相互影響不會導(dǎo)致軟件失效。
·設(shè)計輸入空間與實際輸入空間之間區(qū)域的覆蓋,即不合法輸入域的覆蓋。
·各種使用功能的覆蓋。
環(huán)境覆蓋是指測試時必須覆蓋所有可能影響程序運行方式的條件。
軟件可靠性測試的步驟
軟件可靠性測試分為四個階段:
1.制訂測試方案
本階段的目標是識別軟件功能需求,觸發(fā)該功能的輸入和對應(yīng)的數(shù)據(jù)域,確定相關(guān)的概率分布及需強化測試的功能。
以下是我們推薦的步驟。在一些特定的應(yīng)用中,有的步驟并不是必須的。
(1)分析功能需求 分析各種功能需求, 識別觸發(fā)該功能的輸入及相關(guān)的數(shù)據(jù)域(包括合法
與不合法的兩部分)。分析時要注意下述問題:
·該軟件是否存在不同的運行模式?如果存在,那么應(yīng)列出所有的系統(tǒng)運行模式。
·是否存在影響程序運行方式的外部條件?如果存在,那么有多少?它們的影響程度如何
·各種功能需求之間是相互獨立的還是相關(guān)的?如果相關(guān),是密切相關(guān)還是部分相關(guān)?如果兩種功能密切相關(guān),那么可將兩種功能合并為一種功能。如果功能之間為部分相關(guān),則需列出相應(yīng)輸入變量的合法組合。
(2)定義失效等級
判斷是否存在出現(xiàn)危害度較大的1級和2級失效的可能性。如果這種可能性存在,則應(yīng)進行故障樹分析,標識出所有可能造成嚴重失效的功能需求和其相關(guān)的輸入領(lǐng)域。
(3)確定概率分布
·確定各種不同運行方式的發(fā)生概率,判斷是否需要對不同的運行方式進行分別測試。如果需要,則應(yīng)給出各種運行方式下各數(shù)據(jù)域的概率分布;否則,給出各數(shù)據(jù)域的概率分布。
·判斷是否需要強化測試某些功能。
(4)整理概率分布的信息 將這些信息編碼送入數(shù)據(jù)庫。
2.制訂測試計劃
本階段的目標是:
(1)根據(jù)前一階段整理的概率分布信息生成相對應(yīng)的測試實例集,并計算出每一測試實例預(yù)期的軟件輸出結(jié)果。
本階段需要注意:在按概率分布隨機選擇生成測試實例的同時,要保證測試的覆蓋面。
(2)編寫測試計劃,確定測試順序,分配測試資源。由于本階段前一部分的工作需要考慮大量的信息和數(shù)據(jù),因此需要一個軟件支持工具,建立數(shù)據(jù)庫,并產(chǎn)生測試實例。另外,有時預(yù)測軟件輸出結(jié)果也需要大量的計算,有些復(fù)雜的軟件甚至要用到仿真器模擬輸出結(jié)果??傊?具體實施與被測應(yīng)用軟件的實際功能類型有關(guān)。
3. 測試
本階段進行軟件測試。需注意的是被測軟件的測試環(huán)境(包括硬件配置和軟件支撐環(huán)境
)應(yīng)和預(yù)期的實際使用環(huán)境盡可能一致,對某些環(huán)境要求比較嚴格的軟件(如嵌入式軟件)則應(yīng)完全一致。測試時按測試計劃和順序?qū)γ恳粋€測試實例進行測試,判斷軟件輸出是否符合預(yù)期結(jié)果。測試時應(yīng)記錄測試結(jié)果、運行時間和判斷結(jié)果。如果軟件失效,那么還應(yīng)記錄失效現(xiàn)象和時間,以備以后核對。
4.編寫測試報告
按軟件可靠性估計的要求整理測試記錄,并將結(jié)果寫成報告。
筆者認為,軟件可靠性測試的關(guān)鍵在于:
·對需求、輸入、數(shù)據(jù)域的識別及相關(guān)概率分布的確定。
·按照概率分布隨機生成測試實例,并確定測試順序。
據(jù)國外有關(guān)文獻報導(dǎo),這種測試方法已成功應(yīng)用于大量應(yīng)用軟件的可靠性測試,包括一些商用軟件和航空、航天電子設(shè)備中嵌入式軟件的測試,其效果很好。因此,我們有必要投入一定的人力、物力,針對我們的實際需要,有目的地對各類應(yīng)用軟件進行軟件可靠性測試,從實踐中逐步積累經(jīng)驗。同時需要軟件開發(fā)方和使用方共同合作,進行軟件可靠性測試方法的研究和有關(guān)支持工具的開發(fā),促進我國軟件可靠性水平的提高。
4.軟件可靠性的評測技術(shù)
軟件可靠性評測是指運用統(tǒng)計技術(shù)對軟件可靠性測試和系統(tǒng)運行期間采集的軟件失效數(shù)據(jù)進行處理并評估軟件可靠性的過程。軟件可靠性評測的主要目的是測量和驗證軟件的可靠性,當然實施軟件可靠性評測也是對軟件測試過程的一種完善,有助于軟件產(chǎn)品本身的可靠性增長。
軟件測試者可以使用很多方法進行軟件測試,如按行為或結(jié)構(gòu)來劃分輸入域的劃分測試,純粹隨機選擇輸入的隨機測試,基于功能、路徑、數(shù)據(jù)流或控制流的覆蓋測試,等等。對于給定的軟件,每種測試方法都局限于暴露一定數(shù)量和一些類別的錯誤。通過這些測試能夠查找、定位、改正和消除某些錯誤,實現(xiàn)一定意義上的軟件可靠性增長。但是,由于它們都是面向錯誤的測試,測試所得到的結(jié)果數(shù)據(jù)不宜用于軟件可靠性評估。
軟件可靠性測試是指在軟件的預(yù)期使用環(huán)境中,為進行軟件可靠性評估而對軟件實施的一種測試。軟件可靠性測試應(yīng)該是面向故障的測試,以用戶將要使用的方式來測試軟件,每一次測試代表用戶將要完成的一組操作,使測試成為最終產(chǎn)品使用的預(yù)演。這就使得所獲得的測試數(shù)據(jù)與軟件的實際運行數(shù)據(jù)比較接近,可用于軟件可靠性估計。
軟件可靠性評測由可靠性目標的確定、運行剖面的開發(fā)、測試的計劃與執(zhí)行和測試結(jié)果的分析與反饋等四個主要的活動組成。
可靠性目標是指客戶對軟件性能滿意程度的期望。通常用可靠度、故障強度、MTTF等指標來描述,根據(jù)不同項目的不同需要而定。建立定量的可靠性指標需要對可靠性、交付時間和成本進行平衡。為了定義系統(tǒng)的可靠性指標,必須確定系統(tǒng)的運行模式,定義故障的嚴重性等級,確定故障強度目標。
為了對軟件可靠性進行良好的預(yù)計,必須在軟件的運行域上對其進行測試,首先定義一個相應(yīng)的剖面來鏡像運行域,然后使用這個剖面驅(qū)動測試,這樣可以使測試真實的反映軟件的使用情況。由于可能的輸入幾乎是無限的,測試必須從中選擇出一些樣本,即測試用例,測試用例要能反映實際的使用情況,反映系統(tǒng)的運行剖面。將統(tǒng)計方法應(yīng)用到運行剖面開發(fā)和測試用例生成,在運行剖面中的每個元素都被定量地賦予一個發(fā)生概率值和關(guān)鍵因子,然后根據(jù)這些因素分配測試資源、挑選和生成測試用例。在這種測試中, 優(yōu)先測試那些最重要或最頻繁使用的功能,釋放和緩解最高級別的風險,有助于盡早發(fā)現(xiàn)那些對可靠性有最大影響的故障,以保證軟件的按期交付。一個產(chǎn)品有可能需要開發(fā)多個運行剖面,這取決于它所包含的運行模式和關(guān)鍵操作,通常需要為關(guān)鍵操作單獨定義運行剖面。
在軟件的開發(fā)過程中使用軟件可靠性測試和利用軟件可靠性測試對最終產(chǎn)品進行評價,在測試計劃的制定上有所不同。用于設(shè)計過程的可靠性測試稱為可靠性增長測試,測試與故障的排除聯(lián)系在一起,一般安排在開發(fā)過程的系統(tǒng)測試階段執(zhí)行,將測試所確定的故障提交給開發(fā)者進行修改,建立軟件的一個新的版本,再進行下一次測試。在這種“測試—排錯—新版本”的迭代過程中,跟蹤故障強度的變化,確認測試是否可以終止及軟件是否可以發(fā)布??煽啃栽鲩L測試的測試腳本將執(zhí)行多次。針對最終產(chǎn)品的可靠性測試稱為可靠性驗證測試,通過驗證測試可確定軟件產(chǎn)品當前的可靠性水平。就單個軟件版本而言,可靠性驗證測試的測試腳本將僅執(zhí)行一次。軟件可靠性故障數(shù)據(jù)的收集是測試活動的一部分,在測試周期內(nèi),紀錄每個故障的資料,如與時間相關(guān)的故障頻度、類型、嚴重性和故障的根源等,并且應(yīng)區(qū)分設(shè)計階段和最終產(chǎn)品的故障。
可靠性增長測試和可靠性驗證測試將從不同的角度理解故障數(shù)據(jù)。在可靠性增長測試中,測試以迭代的方式進行,根據(jù)測試期間跟蹤到的故障,使用基于軟件可靠性增長模型和統(tǒng)計推理的可靠性評估程序進行故障強度的估計,并用于跟蹤測試的進展情況。可靠性驗證測試是軟件系統(tǒng)提交前進行的最后測試。它是最終檢驗而不是調(diào)試。在驗證測試中,其目標是確定一個軟件組件或系統(tǒng)在風險限度內(nèi)是被接受還是被拒絕。驗證測試使用可靠性示圖,故障被繪制在圖上。根據(jù)它落入的區(qū)域,來決定被測軟件是被接受還是被拒絕,或者繼續(xù)進行測試??梢愿鶕?jù)不同的客戶風險(接受一個不良程序的風險)和供應(yīng)商風險(拒絕一個好程序的風險)級別構(gòu)造圖表。